Alors que les applications d'IA pénètrent divers secteurs, l'évaluation précise des performances des modèles et l'amélioration de la confiance des utilisateurs sont devenues des questions pressantes. Les évaluations traditionnelles reposent souvent sur des mécanismes centralisés, rendant difficile la couverture de divers scénarios et échouant à refléter les véritables préférences des utilisateurs ; en même temps, le problème de l'"hallucination" des modèles se pose fréquemment, entraînant les utilisateurs à tomber souvent dans des silos d'information lors de leurs choix.
Dans ce contexte, Yupp, en tant que nouvelle plateforme, tente de redéfinir la découverte, la comparaison et l'utilisation des modèles d'IA avec son modèle unique de crowdsourcing et son mécanisme d'incitation, apportant un changement de paradigme dans le domaine de l'évaluation de l'IA. Cet article approfondira les mécanismes fondamentaux de Yupp, les points techniques saillants, les antécédents de l'équipe et son impact potentiel sur l'écosystème de l'IA.
Yupp se concentre sur la résolution des défis d'évaluation de longue date dans le domaine de l'IA, dédié à la construction d'un marché de retour d'information IA « sans confiance »—permettant à divers retours d'information d'utilisateur de circuler librement sous la protection de la blockchain et des incitations crypto-économiques, formant ainsi une couche d'évaluation de modèle évolutive, équitable et transparente. En incitant à la distribution de données manuellement annotées de haute qualité, Yupp peut rapidement capturer les véritables besoins et préférences des utilisateurs dans différents scénarios, aidant les développeurs d'IA à optimiser les performances des modèles de manière itérative.
Le projet a été fondé en juin 2024 par Pankaj Gupta (Co-fondateur et PDG) et Gilad Mishne (Co-fondateur et Responsable de l'IA), avec le Scientifique en Chef Jimmy Lin (Professeur à l'Université de Waterloo) participant également à l'équipe centrale. Les trois avaient précédemment travaillé ensemble chez Twitter en 2010, où ils ont construit et optimisé des systèmes de recommandation et de recherche à grande échelle, et ont ensuite acquis une vaste expérience chez Google et Coinbase.
En raison de sa vision de décentralisation et de transparence de la valeur des données, qui peut répondre aux doubles exigences des fabricants d'IA pour une évaluation crédible et la participation des utilisateurs, ainsi que de bénéficier de la riche expérience de son équipe dirigeante, Yupp a obtenu une haute reconnaissance de la part de figures bien connues de l'industrie technologique et des principaux investisseurs en capital-risque.
La semaine dernière, Yupp a annoncé l'achèvement d'un financement de 33 millions de dollars en seed round, dirigé par le partenaire d'A16z Chris Dixon. D'autres investisseurs incluent le scientifique en chef de Google Jeff Dean, le co-fondateur de Twitter Biz Stone, le co-fondateur de Pinterest Evan Sharp, le PDG de Perplexity Aravind Srinivas, Dan Boneh de l'université de Stanford, Chris Re, Nick McKeown et Balaji Prabhakar, parmi 45 anges et dirigeants d'entreprise bien connus, ainsi que Coinbase Ventures.
En tant que plateforme d'évaluation IA centralisée, Yupp adhère à la philosophie de « Chaque IA pour tous », permettant aux utilisateurs de découvrir, comparer et utiliser facilement les derniers modèles d'IA. Contrairement aux réponses uniques traditionnelles, Yupp renvoie des réponses de deux (ou même plusieurs) modèles simultanément pour chaque demande, formant un « parlement IA ». Ce design répond non seulement aux demandes des utilisateurs pour des choix diversifiés, mais identifie également efficacement les « hallucinations » potentielles que les modèles peuvent produire, aidant les utilisateurs à prendre des décisions plus éclairées grâce à la comparaison. Comme l'a déclaré le PDG de Yupp, Pankaj Gupta, les résultats côte à côte sont particulièrement bénéfiques pour les utilisateurs préoccupés par les erreurs de génération, car ils peuvent vérifier les résultats.
La plateforme prend désormais en charge plus de 500 modèles d'IA, couvrant les domaines de la génération de texte et d'images, y compris des modèles bien connus tels que ChatGPT, Claude, Gemini, DeepSeek, Grok, Llama et de nombreux modèles émergents. Pour optimiser davantage l'expérience, Yupp a également lancé la fonctionnalité « QuickTake », qui peut distiller des réponses longues en un tweet concis.
De plus, Yupp accorde une grande importance à la confidentialité des utilisateurs : tous les enregistrements de chat sont privés par défaut, sauf si l'utilisateur décide activement de les rendre publics ; même lorsqu'ils sont partagés publiquement, aucune information personnelle n'est divulguée. Les utilisateurs peuvent contrôler le contenu et la portée du partage à tout moment.
Yupp utilisera les retours des utilisateurs gratuitement et mesurera l'utilisation du modèle grâce au système « Yupp Points ». Les nouveaux utilisateurs reçoivent 5000 points lors de l'inscription et peuvent gagner plus de points en notant les réponses du modèle, en sélectionnant des préférences et en expliquant leurs raisons. Plus la qualité des retours est élevée, plus les récompenses sont grandes, garantissant aux utilisateurs de pouvoir utiliser durablement des modèles haut de gamme comme Claude Opus 4 ou OpenAI o3 gratuitement. La plateforme promet que les points ne feront qu'augmenter et que tous les modèles actuels peuvent être expérimentés gratuitement.
Après chaque question, les utilisateurs recevront deux réponses modèles et pourront gagner une "carte à gratter numérique" grâce à leurs retours, récompensant des points Yupp allant de 0 à 250. Chaque 1000 points peut être échangé contre 1 dollar, avec un retrait quotidien maximum de 10 dollars et un maximum mensuel de 50 dollars. Les points peuvent être échangés contre plus de 20 devises, y compris des dollars et des euros, avec des partenaires tels que Stripe, PayPal et Coinbase. En même temps, la plateforme intègre Base Ethernet L2 et des stablecoins Solana pour fournir aux utilisateurs du monde entier des récompenses instantanées et sans frais.
Comme l'a dit Pankaj Gupta, les retours d'expérience de haute qualité générés par les utilisateurs sont bien plus précieux pour le réglage des modèles et l'apprentissage par renforcement des entreprises d'IA que les récompenses elles-mêmes. Bien que les gains mensuels des utilisateurs ne soient équivalents qu'à quelques tasses de café, ces données d'annotation payées sont cruciales pour l'itération de l'IA.
Pour inciter plus de personnes à participer, Yupp a également mis en place une récompense de parrainage : le parrain reçoit 5000 points, et la personne parrainée reçoit 1000 points ; actuellement, les nouveaux utilisateurs enregistrés peuvent recevoir 5000 points, et la personne parrainée reçoit en plus 2500 points.
Pour remédier aux problèmes existants d'insuffisance de transparence dans les classements, de manque d'équité et d'accès inégal aux données d'évaluation, Yupp a lancé une version bêta du classement AI et du système de notation "Yupp VIBE (Vibe Intelligence Benchmark) Score". Ce système agrège les données de préférence générées par des utilisateurs du monde entier lors d'interactions naturelles, visant à fournir des résultats d'évaluation solides et fiables.
Les principes d'évaluation de Yupp incluent :
La plateforme ne se contente pas de recueillir des préférences binaires, mais encourage également les utilisateurs à indiquer les avantages et les inconvénients des réponses (tels que "précis", "rapide", "bon style", etc.), et effectue une analyse de regroupement basée sur l'âge, l'éducation, la profession et d'autres informations des utilisateurs pour montrer les différences de préférences entre différents groupes.
Sur un plan technique, Yupp explore l'utilisation de la Blockchain, des primitives cryptographiques et des preuves à divulgation nulle de connaissance pour garantir que le processus d'évaluation est équitable, transparent et vérifiable. Dans le même temps, la plateforme s'est associée à des fournisseurs de données AI professionnels pour calibrer les évaluateurs grâce à la vérification archivale et à la détection de qualité multi-niveaux afin d'éliminer les données malveillantes.
Le tableau de classement récent a été mis à jour, présentant les scores VIBE de modèles tels que GPT‑4.5 Preview, Claude Opus 4 et Claude Sonnet 4, ainsi que leurs taux de victoire, taux de désapprobation, vitesse, latence, fenêtre de contexte et métriques de coût.
Yupp a été officiellement lancé le 13 juin 2025, après six mois de tests internes. Depuis son lancement, le produit a été en constante itération :
La mission de Yupp est de "donner les moyens à l'humanité de façonner l'avenir de l'IA." Pankaj Gupta croit que le développement de l'IA nécessite la participation et la contribution de chacun. Grâce à des réponses d'IA multi-perspectives et aux retours des utilisateurs, Yupp aide non seulement les utilisateurs à prendre de meilleures décisions, mais fournit également une force motrice continue pour l'évolution de l'IA.
Il convient de mentionner que l'un des principaux concurrents de Yupp est la plateforme d'évaluation de modèles AI ouverte LMArena (site web : https://lmarena.ai/),Le site est très populaire parmi les professionnels de l'IA, mais la plateforme est actuellement au stade de l'exploration commerciale et ne fournit pas de récompenses matérielles directes ou de mécanismes d'incitation en points pour la participation des utilisateurs en tirant parti de la technologie Blockchain.
Dans l'ensemble, Yupp a ouvert un nouveau chemin pour l'évaluation de l'IA avec son modèle de crowdsourcing, son mécanisme d'incitation et son système d'évaluation basé sur les préférences réelles des utilisateurs. Il offre non seulement aux utilisateurs une expérience interactive d'IA gratuite et diversifiée, mais transforme également les retours des utilisateurs en données d'entraînement de haute valeur, favorisant l'optimisation continue du modèle. Avec une équipe expérimentée et un soutien en capital de premier ordre, Yupp devrait jouer un rôle clé dans le futur écosystème de l'IA, réalisant la vision de "L'IA pour tous, façonnée par tous."
Cependant, pour Yupp, qui vient de se lancer, comment garantir en continu la qualité des données, résister aux comportements de tricherie potentiels sous la participation d'un grand nombre d'utilisateurs et trouver un équilibre entre la commercialisation et les incitations pour les utilisateurs restera une direction qui doit être explorée et optimisée dans son développement futur.
Alors que les applications d'IA pénètrent divers secteurs, l'évaluation précise des performances des modèles et l'amélioration de la confiance des utilisateurs sont devenues des questions pressantes. Les évaluations traditionnelles reposent souvent sur des mécanismes centralisés, rendant difficile la couverture de divers scénarios et échouant à refléter les véritables préférences des utilisateurs ; en même temps, le problème de l'"hallucination" des modèles se pose fréquemment, entraînant les utilisateurs à tomber souvent dans des silos d'information lors de leurs choix.
Dans ce contexte, Yupp, en tant que nouvelle plateforme, tente de redéfinir la découverte, la comparaison et l'utilisation des modèles d'IA avec son modèle unique de crowdsourcing et son mécanisme d'incitation, apportant un changement de paradigme dans le domaine de l'évaluation de l'IA. Cet article approfondira les mécanismes fondamentaux de Yupp, les points techniques saillants, les antécédents de l'équipe et son impact potentiel sur l'écosystème de l'IA.
Yupp se concentre sur la résolution des défis d'évaluation de longue date dans le domaine de l'IA, dédié à la construction d'un marché de retour d'information IA « sans confiance »—permettant à divers retours d'information d'utilisateur de circuler librement sous la protection de la blockchain et des incitations crypto-économiques, formant ainsi une couche d'évaluation de modèle évolutive, équitable et transparente. En incitant à la distribution de données manuellement annotées de haute qualité, Yupp peut rapidement capturer les véritables besoins et préférences des utilisateurs dans différents scénarios, aidant les développeurs d'IA à optimiser les performances des modèles de manière itérative.
Le projet a été fondé en juin 2024 par Pankaj Gupta (Co-fondateur et PDG) et Gilad Mishne (Co-fondateur et Responsable de l'IA), avec le Scientifique en Chef Jimmy Lin (Professeur à l'Université de Waterloo) participant également à l'équipe centrale. Les trois avaient précédemment travaillé ensemble chez Twitter en 2010, où ils ont construit et optimisé des systèmes de recommandation et de recherche à grande échelle, et ont ensuite acquis une vaste expérience chez Google et Coinbase.
En raison de sa vision de décentralisation et de transparence de la valeur des données, qui peut répondre aux doubles exigences des fabricants d'IA pour une évaluation crédible et la participation des utilisateurs, ainsi que de bénéficier de la riche expérience de son équipe dirigeante, Yupp a obtenu une haute reconnaissance de la part de figures bien connues de l'industrie technologique et des principaux investisseurs en capital-risque.
La semaine dernière, Yupp a annoncé l'achèvement d'un financement de 33 millions de dollars en seed round, dirigé par le partenaire d'A16z Chris Dixon. D'autres investisseurs incluent le scientifique en chef de Google Jeff Dean, le co-fondateur de Twitter Biz Stone, le co-fondateur de Pinterest Evan Sharp, le PDG de Perplexity Aravind Srinivas, Dan Boneh de l'université de Stanford, Chris Re, Nick McKeown et Balaji Prabhakar, parmi 45 anges et dirigeants d'entreprise bien connus, ainsi que Coinbase Ventures.
En tant que plateforme d'évaluation IA centralisée, Yupp adhère à la philosophie de « Chaque IA pour tous », permettant aux utilisateurs de découvrir, comparer et utiliser facilement les derniers modèles d'IA. Contrairement aux réponses uniques traditionnelles, Yupp renvoie des réponses de deux (ou même plusieurs) modèles simultanément pour chaque demande, formant un « parlement IA ». Ce design répond non seulement aux demandes des utilisateurs pour des choix diversifiés, mais identifie également efficacement les « hallucinations » potentielles que les modèles peuvent produire, aidant les utilisateurs à prendre des décisions plus éclairées grâce à la comparaison. Comme l'a déclaré le PDG de Yupp, Pankaj Gupta, les résultats côte à côte sont particulièrement bénéfiques pour les utilisateurs préoccupés par les erreurs de génération, car ils peuvent vérifier les résultats.
La plateforme prend désormais en charge plus de 500 modèles d'IA, couvrant les domaines de la génération de texte et d'images, y compris des modèles bien connus tels que ChatGPT, Claude, Gemini, DeepSeek, Grok, Llama et de nombreux modèles émergents. Pour optimiser davantage l'expérience, Yupp a également lancé la fonctionnalité « QuickTake », qui peut distiller des réponses longues en un tweet concis.
De plus, Yupp accorde une grande importance à la confidentialité des utilisateurs : tous les enregistrements de chat sont privés par défaut, sauf si l'utilisateur décide activement de les rendre publics ; même lorsqu'ils sont partagés publiquement, aucune information personnelle n'est divulguée. Les utilisateurs peuvent contrôler le contenu et la portée du partage à tout moment.
Yupp utilisera les retours des utilisateurs gratuitement et mesurera l'utilisation du modèle grâce au système « Yupp Points ». Les nouveaux utilisateurs reçoivent 5000 points lors de l'inscription et peuvent gagner plus de points en notant les réponses du modèle, en sélectionnant des préférences et en expliquant leurs raisons. Plus la qualité des retours est élevée, plus les récompenses sont grandes, garantissant aux utilisateurs de pouvoir utiliser durablement des modèles haut de gamme comme Claude Opus 4 ou OpenAI o3 gratuitement. La plateforme promet que les points ne feront qu'augmenter et que tous les modèles actuels peuvent être expérimentés gratuitement.
Après chaque question, les utilisateurs recevront deux réponses modèles et pourront gagner une "carte à gratter numérique" grâce à leurs retours, récompensant des points Yupp allant de 0 à 250. Chaque 1000 points peut être échangé contre 1 dollar, avec un retrait quotidien maximum de 10 dollars et un maximum mensuel de 50 dollars. Les points peuvent être échangés contre plus de 20 devises, y compris des dollars et des euros, avec des partenaires tels que Stripe, PayPal et Coinbase. En même temps, la plateforme intègre Base Ethernet L2 et des stablecoins Solana pour fournir aux utilisateurs du monde entier des récompenses instantanées et sans frais.
Comme l'a dit Pankaj Gupta, les retours d'expérience de haute qualité générés par les utilisateurs sont bien plus précieux pour le réglage des modèles et l'apprentissage par renforcement des entreprises d'IA que les récompenses elles-mêmes. Bien que les gains mensuels des utilisateurs ne soient équivalents qu'à quelques tasses de café, ces données d'annotation payées sont cruciales pour l'itération de l'IA.
Pour inciter plus de personnes à participer, Yupp a également mis en place une récompense de parrainage : le parrain reçoit 5000 points, et la personne parrainée reçoit 1000 points ; actuellement, les nouveaux utilisateurs enregistrés peuvent recevoir 5000 points, et la personne parrainée reçoit en plus 2500 points.
Pour remédier aux problèmes existants d'insuffisance de transparence dans les classements, de manque d'équité et d'accès inégal aux données d'évaluation, Yupp a lancé une version bêta du classement AI et du système de notation "Yupp VIBE (Vibe Intelligence Benchmark) Score". Ce système agrège les données de préférence générées par des utilisateurs du monde entier lors d'interactions naturelles, visant à fournir des résultats d'évaluation solides et fiables.
Les principes d'évaluation de Yupp incluent :
La plateforme ne se contente pas de recueillir des préférences binaires, mais encourage également les utilisateurs à indiquer les avantages et les inconvénients des réponses (tels que "précis", "rapide", "bon style", etc.), et effectue une analyse de regroupement basée sur l'âge, l'éducation, la profession et d'autres informations des utilisateurs pour montrer les différences de préférences entre différents groupes.
Sur un plan technique, Yupp explore l'utilisation de la Blockchain, des primitives cryptographiques et des preuves à divulgation nulle de connaissance pour garantir que le processus d'évaluation est équitable, transparent et vérifiable. Dans le même temps, la plateforme s'est associée à des fournisseurs de données AI professionnels pour calibrer les évaluateurs grâce à la vérification archivale et à la détection de qualité multi-niveaux afin d'éliminer les données malveillantes.
Le tableau de classement récent a été mis à jour, présentant les scores VIBE de modèles tels que GPT‑4.5 Preview, Claude Opus 4 et Claude Sonnet 4, ainsi que leurs taux de victoire, taux de désapprobation, vitesse, latence, fenêtre de contexte et métriques de coût.
Yupp a été officiellement lancé le 13 juin 2025, après six mois de tests internes. Depuis son lancement, le produit a été en constante itération :
La mission de Yupp est de "donner les moyens à l'humanité de façonner l'avenir de l'IA." Pankaj Gupta croit que le développement de l'IA nécessite la participation et la contribution de chacun. Grâce à des réponses d'IA multi-perspectives et aux retours des utilisateurs, Yupp aide non seulement les utilisateurs à prendre de meilleures décisions, mais fournit également une force motrice continue pour l'évolution de l'IA.
Il convient de mentionner que l'un des principaux concurrents de Yupp est la plateforme d'évaluation de modèles AI ouverte LMArena (site web : https://lmarena.ai/),Le site est très populaire parmi les professionnels de l'IA, mais la plateforme est actuellement au stade de l'exploration commerciale et ne fournit pas de récompenses matérielles directes ou de mécanismes d'incitation en points pour la participation des utilisateurs en tirant parti de la technologie Blockchain.
Dans l'ensemble, Yupp a ouvert un nouveau chemin pour l'évaluation de l'IA avec son modèle de crowdsourcing, son mécanisme d'incitation et son système d'évaluation basé sur les préférences réelles des utilisateurs. Il offre non seulement aux utilisateurs une expérience interactive d'IA gratuite et diversifiée, mais transforme également les retours des utilisateurs en données d'entraînement de haute valeur, favorisant l'optimisation continue du modèle. Avec une équipe expérimentée et un soutien en capital de premier ordre, Yupp devrait jouer un rôle clé dans le futur écosystème de l'IA, réalisant la vision de "L'IA pour tous, façonnée par tous."
Cependant, pour Yupp, qui vient de se lancer, comment garantir en continu la qualité des données, résister aux comportements de tricherie potentiels sous la participation d'un grand nombre d'utilisateurs et trouver un équilibre entre la commercialisation et les incitations pour les utilisateurs restera une direction qui doit être explorée et optimisée dans son développement futur.