Alors que la concurrence s'intensifie dans le domaine de l'IA, le géant chinois de la vente au détail Alibaba a dévoilé son QwQ-32B-Preview qui surpasserait la série o1 d'OpenAI.
Le dernier modèle surpasserait les modèles o1-preview et o1-mini d'OpenAI sur certains tests spécifiques, tels que les tests AIME et MATH, qui évaluent les performances des modèles d'IA dans les énigmes logiques et les problèmes mathématiques.
Alibaba a créé QwQ-32B-Preview en téléchargement.
Selon le géant de la vente au détail, le nouveau modèle d'Alibaba est capable de résoudre des problèmes complexes et complexes par rapport aux modèles de langage étendus (LLM) normaux comme ChatGPT-4 et Claude 3.5.
Un article de Benzinga indique que le QwQ-32B-Preview est l'un des rares disponibles sous une licence permissive, permettant aux utilisateurs de le télécharger et de l'utiliser. Le modèle est désormais disponible sur la plateforme de développement d'IA Hugging Face.
Cependant, Alibaba a publié certains composants du modèle pour limiter la réplication complète du modèle ou la compréhension de son fonctionnement.
Le dernier modèle d'Alibaba possède 32,5 milliards de paramètres, ce qui lui permet de gérer des invites allant jusqu'à 32 000 mots. Grâce aux capacités significatives du modèle et à son accessibilité semi-ouverte, le nouvel entrant d'Alibaba ouvre la voie à un saut transformateur dans les technologies de raisonnement de l'IA.
Annonce transparente d'Alibaba, qui souligne la sophistication de son modèle, OpenAI a gardé secret le nombre de ses paramètres.
L’arrivée de ce modèle intervient à un moment où OpenAI fait des progrès significatifs dans le secteur de l’IA. En octobre, la valorisation d'OpenAI a grimpé à 157 milliards de dollars suite à un cycle de financement réussi.
Voir aussi L'agence italienne de protection des données met en garde l'éditeur contre le partage de données avec OpenAI
Plus tôt cette semaine, SoftBank Group SFTBF aurait augmenté sa participation dans le fabricant ChatGPT grâce à un rachat d'actions par les salariés pour 1,5 milliard de dollars.
OpenAI étudierait également le développement de son propre navigateur Web pour concurrencer le navigateur Google Chrome, filiale d'Alphabet, après les pressions du ministère américain de la Justice pour qu'il s'en sépare.
Alibaba admet que le modèle a aussi des défauts
Bien qu’il possède des atouts uniques, le nouveau modèle présente également des limites. Selon le groupe, QwQ-32B-Preview présente des problèmes tels que des changements de langue inattendus, qui pourraient potentiellement dérouter les utilisateurs. Le modèle est également sous-performant dans les tâches nécessitant un raisonnement de bon sens, ce qui est courant avec de nombreux systèmes d’IA.
Selon AutoGPT , le modèle peut être pris dans des boucles logiques, retardant les réponses.
Malgré ses défauts, ses capacités de raisonnement lui permettent de se vérifier lui-même, réduisant ainsi les erreurs mais augmentant le temps de résolution.
En raisonnant par tâches et étapes de planification, le modèle d'Alibaba évite certains pièges qui affectent les systèmes d'IA traditionnels. Mais cette approche nécessite plus de temps, ce qui pourrait limiter l'application en temps réel.
Selon Benzinga, les réponses de QwQ-32B-Preview s'alignent sur les normes réglementaires chinoises , évitant ainsi les sujets politiquement sensibles.
Par exemple, des sujets politiquement sensibles comme Taiwan donneront des réponses alignées sur la position du gouvernement chinois.
De plus, les messages concernant des événements tels que la place Tiananmen n'entraînent aucune réponse, ce qui montre la conception prudente du modèle.
Voir aussi Inflection déclare qu'elle ne participera pas à la création de modèles d'IA de nouvelle génération, mais qu'elle acquiert des startups
Même si cela pourrait être idéal pour le marché chinois, cela peut également limiter son attrait sur le marché mondial. Cependant, le modèle constitue une étape importante dans le monde de l’IA raisonnée. Bien que ses limites puissent réduire son attrait mondial, ses autres composants tels que la logique et la nature semi-ouverte en font un concurrent majeur pour OpenAI.
Selon AutoGPT, QwQ-32B-Preview met en évidence le potentiel et les défis de cette frontière passionnante où les laboratoires d'IA du monde entier travaillent à affiner la technologie de raisonnement.
Décrocher un emploi Web3 bien rémunéré en 90 jours : la feuille de route ultime