a16z mène un tour de table de 33 M$ — Comment Yupp tire parti de la Blockchain et des incitations pour redéfinir les modèles d'évaluation de l'IA

6/19/2025, 2:54:41 AM

Intermédiaire

a16z a dirigé un tour de financement de seed de 33 millions de $. Comment Yupp redéfinit-il l'évaluation des modèles d'IA grâce à la Blockchain et aux mécanismes d'incitation ? Cet article détaille son modèle d'évaluation participatif, le système de notation VIBE, l'architecture technique et la vision de développement, explorant de nouvelles possibilités à l'intersection de l'IA et du Web3.

Alors que les applications d'IA pénètrent divers secteurs, l'évaluation précise des performances des modèles et l'amélioration de la confiance des utilisateurs sont devenues des questions pressantes. Les évaluations traditionnelles reposent souvent sur des mécanismes centralisés, rendant difficile la couverture de divers scénarios et échouant à refléter les véritables préférences des utilisateurs ; en même temps, le problème de l'"hallucination" des modèles se pose fréquemment, entraînant les utilisateurs à tomber souvent dans des silos d'information lors de leurs choix.

Dans ce contexte, Yupp, en tant que nouvelle plateforme, tente de redéfinir la découverte, la comparaison et l'utilisation des modèles d'IA avec son modèle unique de crowdsourcing et son mécanisme d'incitation, apportant un changement de paradigme dans le domaine de l'évaluation de l'IA. Cet article approfondira les mécanismes fondamentaux de Yupp, les points techniques saillants, les antécédents de l'équipe et son impact potentiel sur l'écosystème de l'IA.

Contexte de l'équipe et financement : Soutenu par l'expérience des géants de la technologie

Yupp se concentre sur la résolution des défis d'évaluation de longue date dans le domaine de l'IA, dédié à la construction d'un marché de retour d'information IA « sans confiance »—permettant à divers retours d'information d'utilisateur de circuler librement sous la protection de la blockchain et des incitations crypto-économiques, formant ainsi une couche d'évaluation de modèle évolutive, équitable et transparente. En incitant à la distribution de données manuellement annotées de haute qualité, Yupp peut rapidement capturer les véritables besoins et préférences des utilisateurs dans différents scénarios, aidant les développeurs d'IA à optimiser les performances des modèles de manière itérative.

Le projet a été fondé en juin 2024 par Pankaj Gupta (Co-fondateur et PDG) et Gilad Mishne (Co-fondateur et Responsable de l'IA), avec le Scientifique en Chef Jimmy Lin (Professeur à l'Université de Waterloo) participant également à l'équipe centrale. Les trois avaient précédemment travaillé ensemble chez Twitter en 2010, où ils ont construit et optimisé des systèmes de recommandation et de recherche à grande échelle, et ont ensuite acquis une vaste expérience chez Google et Coinbase.

En raison de sa vision de décentralisation et de transparence de la valeur des données, qui peut répondre aux doubles exigences des fabricants d'IA pour une évaluation crédible et la participation des utilisateurs, ainsi que de bénéficier de la riche expérience de son équipe dirigeante, Yupp a obtenu une haute reconnaissance de la part de figures bien connues de l'industrie technologique et des principaux investisseurs en capital-risque.

La semaine dernière, Yupp a annoncé l'achèvement d'un financement de 33 millions de dollars en seed round, dirigé par le partenaire d'A16z Chris Dixon. D'autres investisseurs incluent le scientifique en chef de Google Jeff Dean, le co-fondateur de Twitter Biz Stone, le co-fondateur de Pinterest Evan Sharp, le PDG de Perplexity Aravind Srinivas, Dan Boneh de l'université de Stanford, Chris Re, Nick McKeown et Balaji Prabhakar, parmi 45 anges et dirigeants d'entreprise bien connus, ainsi que Coinbase Ventures.

Fonctionnalités de base et expérience utilisateur : Construire un "Parlement IA"

En tant que plateforme d'évaluation IA centralisée, Yupp adhère à la philosophie de « Chaque IA pour tous », permettant aux utilisateurs de découvrir, comparer et utiliser facilement les derniers modèles d'IA. Contrairement aux réponses uniques traditionnelles, Yupp renvoie des réponses de deux (ou même plusieurs) modèles simultanément pour chaque demande, formant un « parlement IA ». Ce design répond non seulement aux demandes des utilisateurs pour des choix diversifiés, mais identifie également efficacement les « hallucinations » potentielles que les modèles peuvent produire, aidant les utilisateurs à prendre des décisions plus éclairées grâce à la comparaison. Comme l'a déclaré le PDG de Yupp, Pankaj Gupta, les résultats côte à côte sont particulièrement bénéfiques pour les utilisateurs préoccupés par les erreurs de génération, car ils peuvent vérifier les résultats.

La plateforme prend désormais en charge plus de 500 modèles d'IA, couvrant les domaines de la génération de texte et d'images, y compris des modèles bien connus tels que ChatGPT, Claude, Gemini, DeepSeek, Grok, Llama et de nombreux modèles émergents. Pour optimiser davantage l'expérience, Yupp a également lancé la fonctionnalité « QuickTake », qui peut distiller des réponses longues en un tweet concis.

De plus, Yupp accorde une grande importance à la confidentialité des utilisateurs : tous les enregistrements de chat sont privés par défaut, sauf si l'utilisateur décide activement de les rendre publics ; même lorsqu'ils sont partagés publiquement, aucune information personnelle n'est divulguée. Les utilisateurs peuvent contrôler le contenu et la portée du partage à tout moment.

Modèles économiques et mécanismes d'incitation : Évaluation du travail des données

Yupp utilisera les retours des utilisateurs gratuitement et mesurera l'utilisation du modèle grâce au système « Yupp Points ». Les nouveaux utilisateurs reçoivent 5000 points lors de l'inscription et peuvent gagner plus de points en notant les réponses du modèle, en sélectionnant des préférences et en expliquant leurs raisons. Plus la qualité des retours est élevée, plus les récompenses sont grandes, garantissant aux utilisateurs de pouvoir utiliser durablement des modèles haut de gamme comme Claude Opus 4 ou OpenAI o3 gratuitement. La plateforme promet que les points ne feront qu'augmenter et que tous les modèles actuels peuvent être expérimentés gratuitement.

Après chaque question, les utilisateurs recevront deux réponses modèles et pourront gagner une "carte à gratter numérique" grâce à leurs retours, récompensant des points Yupp allant de 0 à 250. Chaque 1000 points peut être échangé contre 1 dollar, avec un retrait quotidien maximum de 10 dollars et un maximum mensuel de 50 dollars. Les points peuvent être échangés contre plus de 20 devises, y compris des dollars et des euros, avec des partenaires tels que Stripe, PayPal et Coinbase. En même temps, la plateforme intègre Base Ethernet L2 et des stablecoins Solana pour fournir aux utilisateurs du monde entier des récompenses instantanées et sans frais.

Comme l'a dit Pankaj Gupta, les retours d'expérience de haute qualité générés par les utilisateurs sont bien plus précieux pour le réglage des modèles et l'apprentissage par renforcement des entreprises d'IA que les récompenses elles-mêmes. Bien que les gains mensuels des utilisateurs ne soient équivalents qu'à quelques tasses de café, ces données d'annotation payées sont cruciales pour l'itération de l'IA.

Pour inciter plus de personnes à participer, Yupp a également mis en place une récompense de parrainage : le parrain reçoit 5000 points, et la personne parrainée reçoit 1000 points ; actuellement, les nouveaux utilisateurs enregistrés peuvent recevoir 5000 points, et la personne parrainée reçoit en plus 2500 points.

Yupp VIBE Rating : Un nouveau paradigme pour l'évaluation de l'IA

Pour remédier aux problèmes existants d'insuffisance de transparence dans les classements, de manque d'équité et d'accès inégal aux données d'évaluation, Yupp a lancé une version bêta du classement AI et du système de notation "Yupp VIBE (Vibe Intelligence Benchmark) Score". Ce système agrège les données de préférence générées par des utilisateurs du monde entier lors d'interactions naturelles, visant à fournir des résultats d'évaluation solides et fiables.

Les principes d'évaluation de Yupp incluent :

Robustesse : Assurer la représentativité (couvrant divers scénarios), l'authenticité (réflétant les préoccupations des utilisateurs) et l'anti-tricherie (résistant aux comportements malveillants) ;
Fiabilité : Équitable et neutre (impartial au modèle), transparent et public (divulgation détaillée des algorithmes de classement), rigoureux et scientifique (adhérant aux normes d'évaluation).

La plateforme ne se contente pas de recueillir des préférences binaires, mais encourage également les utilisateurs à indiquer les avantages et les inconvénients des réponses (tels que "précis", "rapide", "bon style", etc.), et effectue une analyse de regroupement basée sur l'âge, l'éducation, la profession et d'autres informations des utilisateurs pour montrer les différences de préférences entre différents groupes.

Sur un plan technique, Yupp explore l'utilisation de la Blockchain, des primitives cryptographiques et des preuves à divulgation nulle de connaissance pour garantir que le processus d'évaluation est équitable, transparent et vérifiable. Dans le même temps, la plateforme s'est associée à des fournisseurs de données AI professionnels pour calibrer les évaluateurs grâce à la vérification archivale et à la détection de qualité multi-niveaux afin d'éliminer les données malveillantes.

Le tableau de classement récent a été mis à jour, présentant les scores VIBE de modèles tels que GPT‑4.5 Preview, Claude Opus 4 et Claude Sonnet 4, ainsi que leurs taux de victoire, taux de désapprobation, vitesse, latence, fenêtre de contexte et métriques de coût.

Histoire du développement et perspectives futures

Yupp a été officiellement lancé le 13 juin 2025, après six mois de tests internes. Depuis son lancement, le produit a été en constante itération :

Support multimodal : Accédez à des modèles tels que Dall‑E, Flux, Stable Diffusion, Luma Photon, Google Imagen 4, etc., et permettez aux utilisateurs de télécharger des images/PDF pour des questions.
Méthode d'interaction étendue : Ajout de la saisie vocale et des fonctions de lecture vocale ;
Mise à jour du modèle : introduction progressive de DeepSeek R1/V3, Mistral Small 3, OpenAI o3-pro, Hermes 3, Amazon Nova Pro v1, série Phi de Microsoft et catégorie « modèle MAX » ;
Informations en temps réel : Dirigez les demandes de requêtes en ligne vers Perplexity et Google Gemini Live, accompagnées de citations hyperliées ;
Mise à jour des paiements : Ajout de retraits US PayPal, Venmo et support pour 24 devises via PayPal;
Partage d'exportation : prend en charge la copie préservant le format, l'exportation PDF/Text/Markdown et le partage de réponses uniques ou de conversations entières selon les besoins ;
Activités communautaires : Organisation d'événements comme le « AI Prompt Challenge » avec des prix allant jusqu'à des dizaines de milliers de points ; nouvelles fonctionnalités telles que des pages de profil personnel et des noms de chat générés par l'IA.

La mission de Yupp est de "donner les moyens à l'humanité de façonner l'avenir de l'IA." Pankaj Gupta croit que le développement de l'IA nécessite la participation et la contribution de chacun. Grâce à des réponses d'IA multi-perspectives et aux retours des utilisateurs, Yupp aide non seulement les utilisateurs à prendre de meilleures décisions, mais fournit également une force motrice continue pour l'évolution de l'IA.

Il convient de mentionner que l'un des principaux concurrents de Yupp est la plateforme d'évaluation de modèles AI ouverte LMArena (site web : https://lmarena.ai/），Le site est très populaire parmi les professionnels de l'IA, mais la plateforme est actuellement au stade de l'exploration commerciale et ne fournit pas de récompenses matérielles directes ou de mécanismes d'incitation en points pour la participation des utilisateurs en tirant parti de la technologie Blockchain.

Dans l'ensemble, Yupp a ouvert un nouveau chemin pour l'évaluation de l'IA avec son modèle de crowdsourcing, son mécanisme d'incitation et son système d'évaluation basé sur les préférences réelles des utilisateurs. Il offre non seulement aux utilisateurs une expérience interactive d'IA gratuite et diversifiée, mais transforme également les retours des utilisateurs en données d'entraînement de haute valeur, favorisant l'optimisation continue du modèle. Avec une équipe expérimentée et un soutien en capital de premier ordre, Yupp devrait jouer un rôle clé dans le futur écosystème de l'IA, réalisant la vision de "L'IA pour tous, façonnée par tous."

Cependant, pour Yupp, qui vient de se lancer, comment garantir en continu la qualité des données, résister aux comportements de tricherie potentiels sous la participation d'un grand nombre d'utilisateurs et trouver un équilibre entre la commercialisation et les incitations pour les utilisateurs restera une direction qui doit être explorée et optimisée dans son développement futur.

Déclaration :

Cet article est reproduit de [PANews] Le droit d'auteur appartient à l'auteur original [ShenZhen] S'il y a des objections à la réimpression, veuillez contacter Équipe Gate LearnL'équipe le traitera aussi rapidement que possible selon les procédures pertinentes.
Avertissement : Les vues et opinions exprimées dans cet article ne sont que celles de l'auteur et ne constituent pas un conseil en investissement.
Les autres versions linguistiques de l'article sont traduites par l'équipe Gate Learn, sauf indication contraire.GateDans de telles circonstances, il est interdit de copier, de diffuser ou de plagier des articles traduits.

Contenu

Contexte de l'équipe et financement : Soutenu par l'expérience de géants de la technologie

Fonctions principales et expérience utilisateur : Construire le "Parlement AI"

Calendrier Crypto

Déblocage de jetons

Aptos (APT) déverrouillera 11,31 millions de jetons le 12 août à 8h00, d'une valeur d'environ 48,07 millions de dollars, soit 1,68 % de l'offre en circulation.

APT

2.48%

2025-08-12

Déblocage de jetons

Aptos (APT) déverrouillera 11,31 millions de jetons le 12 août à 8h00, d'une valeur d'environ 53,16 millions de dollars, représentant 2,2 % de l'offre en circulation.

APT

2.48%

2025-08-12

Lancement de Pixel Heroes Adventure

CROSS a annoncé le lancement imminent de Pixel Heroes Adventure sur sa plateforme. Les utilisateurs peuvent déjà accéder à l'application décentralisée PHA en utilisant le Portefeuille CROSS. Le lancement officiel est prévu pour le 13 août. Selon l'équipe, des événements exclusifs accompagneront la sortie, renforçant l'engagement des joueurs au sein de l'écosystème de jeu CROSS.

CROSS

2025-08-12

Appel communautaire

Babylon organisera un appel communautaire le 13 août à 07h00 UTC. Au cours de la session, les cofondateurs David Tse et Fisher Yu présenteront les indicateurs de performance clés pour le deuxième trimestre, passeront en revue les réalisations et les développements inattendus, et définiront les priorités pour le troisième trimestre.

BABY

-7.41%

2025-08-12

AMA sur X

Taiko organisera un AMA sur X le 13 août à 15h00 UTC.

TAIKO

-2.39%

2025-08-12

Articles connexes

Débutant

Qu'est-ce que les récits Crypto? Top récits pour 2025 (MISE À JOUR)

Memecoins, jetons de repos liquides, dérivés de mise liquide, modularité de la blockchain, Layer 1s, Layer 2s (rollups optimistes et rollups à connaissance nulle), BRC-20, DePIN, robots de trading crypto Telegram, marchés de prédiction et RWAs sont quelques récits à surveiller en 2024.

11/26/2024, 1:38:16 AM

Avancé

Qu'est-ce que Tars AI? Explorer le futur de l'IA et de l'intégration Web3

Découvrez comment Tars AI comble le fossé entre l'IA et Web3, offrant des solutions évolutives et des outils innovants pour les applications décentralisées. Apprenez-en davantage sur ses principales fonctionnalités, ses avantages et son fonctionnement.

9/22/2024, 1:16:18 PM

Débutant

Tout ce que vous devez savoir sur GT-Protocole

GT Protocol est l'un des produits d'IA les plus médiatisés de 2024, utilisant une technologie d'IA avancée pour créer des outils de trading d'IA uniques. Il peut être utilisé pour la gestion de portefeuille d'IA, le trading d'IA et les méthodes d'investissement dans les marchés CeFi, DeFi et NFT, aidant les gens à découvrir facilement et à investir dans diverses opportunités Web3. Il a attiré des centaines de millions d'utilisateurs à participer.

9/25/2024, 7:10:21 AM

Intermédiaire

Inventaire de 12 projets d'IA sur le sous-réseau Bittensor

Bien que l'engouement autour de l'IA ne soit pas aussi fort qu'au début de l'année, le fort rebond de Bittensor montre la confiance du marché dans les projets phares de ce secteur. L'ajout de 12 nouveaux sous-réseaux au cours des derniers mois a considérablement stimulé le développement de l'IA et pourrait favoriser de nouveaux projets innovants. Tout en étant attentif au rebond des prix du TAO, il convient également de tenir compte du développement et du potentiel de ses fondamentaux.

8/20/2024, 9:18:10 AM

Intermédiaire

Comprendre Hyberbolic: la plateforme d'IA en libre accès

Hyperbolic est une plateforme d'IA innovante en libre accès offrant des ressources de calcul rentables et des services d'IA grâce à son marché de GPU décentralisé et à sa technologie de pointe. La plateforme permet l'inférence d'IA, la location de GPU et la monétisation de modèles d'IA, ce qui facilite la prise de départ des chercheurs, des entreprises et des développeurs tout en optimisant les coûts. Grâce à son architecture avancée utilisant la preuve d'échantillonnage (PoSP) et la technologie spML, les utilisateurs peuvent exécuter des tâches de calcul de manière sécurisée et efficace. De débutants à professionnels, Hyperbolic offre des outils puissants et des ressources pour aider les utilisateurs à explorer et à faire progresser la technologie de l'IA.

1/10/2025, 2:07:14 AM

Intermédiaire

Vana: Un projet d'IA soutenu par les trois géants du VC

Vana est une start-up Web3 axée sur la construction d’un réseau de pool de données appartenant aux utilisateurs, en s’attaquant au problème de l’insuffisance des données d’entraînement pour les modèles d’IA grâce à la technologie blockchain. Il offre également aux internautes la possibilité de gagner de l’argent. Récemment, Vana a annoncé l’achèvement d’un tour de financement stratégique de 5 millions de dollars mené par Coinbase Ventures, portant son financement total à 25 millions de dollars. Vana prévoit d’établir un réseau DAO qui permettra aux membres de contribuer et de vendre des ensembles de données aux chercheurs en IA, favorisant ainsi le développement d’un écosystème d’IA décentralisé.

9/25/2024, 10:20:40 AM

Lancez-vous

Inscrivez-vous et obtenez un bon de

100$