Manus AI n'est pas le prochain DeepSeek chinois : un regard plus approfondi derrière le battage médiatique

En seulement une semaine, plus de 2 millions d'utilisateurs ont rejoint la liste d'attente pour accéder Agent IA général L'IA chinoise Manus est présentée comme le « deuxième moment DeepSeek » de la Chine. C'est lorsque l'agent est en version bêta fermée et n'est accessible que sur invitation.

Une frénésie s'est emparée de l'IA, beaucoup qualifiant Manus AI de « hack » et de réponse appropriée à l'agent Deep Research d'OpenAI, d'autant plus que la Chine continue de fournir Des innovations en IA à moindre coût. Cependant, le battage médiatique autour de Manus est exagéré, en partie à cause des influenceurs de l’IA qui font des déclarations grandioses sur les plateformes de médias sociaux. Voici pourquoi je pense que Manus AI est un début prometteur, mais pas une avancée décisive.

Pourquoi Manus AI n’est-il pas une avancée majeure ?

DeepSeek est considéré comme une avancée majeure car il imite avec succès l'approche d'apprentissage par renforcement (RL) d'OpenAI, atteignant des performances comparables aux modèles de raisonnement de la série O. De plus, l’équipe DeepSeek a réussi cet exploit avec un budget limité par rapport aux coûts de formation d’OpenAI. Plus tard, DeepSeek a introduit Méthode de formation GRPO en open source, qui a aidé d’autres laboratoires à former des modèles de raisonnement avancés.

Il s’agissait de toutes nouvelles innovations, et l’équipe chinoise DeepSeek les a réalisées malgré les restrictions américaines sur les GPU. D'autre part, le programme d'IA général Manus intègre le modèle Claude 3.5 Sonnet d'Anthropic, plusieurs modèles Qwen améliorés et est basé sur le projet open source Browser Use.

Bien que l’intégration et l’amélioration des outils soient des avantages, la véritable avancée réside dans la création de modèles avancés optimisés pour les tâches des agents. Claude 3.5 Sonnet d'Anthropic est l'un des meilleurs modèles d'IA pour les tâches d'agent et la programmation. En fait, l’équipe derrière Manus teste en interne le nouveau modèle unifié, Claude 3.7 Sonnet, et le trouve « prometteur ».

Essentiellement, la création de modèles d’IA performants reste le plus grand défi et continuera de l’être dans un avenir proche. Cependant, l’équipe Manus AI doit être félicitée pour avoir connecté plusieurs outils et environnements pour accomplir des tâches. Comme mentionné précédemment, c’est un début prometteur vers un avenir basé sur les agents.

L'IA de Manus trébuche

Nous n'avons pas accès à Manus AI, mais certains utilisateurs de X ont eu un accès anticipé et ont partagé leurs expériences. La scientifique biomédicale Derya Onmutmaz a partagé les résultats sur X après avoir exécuté Manus et l'agent Deep Research d'OpenAI côte à côte.

Deep Research a réussi à terminer la tâche en 15 minutes, mais Manus a mis 50 minutes et n'a pas réussi à terminer la tâche. Il a également mentionné que Manus ne cite pas de sources telles que Deep Research.

Recherche approfondie terminée en moins de 15 minutes. Malheureusement, Manus AI a échoué après 50 minutes à l'étape 18/20 ! 😑 Il fonctionnait plutôt bien - je regardais la production de Manus et elle semblait excellente. Cependant, exécuter la même invite une deuxième fois est un peu frustrant car cela prend trop de temps ! https://t.co/bGtmOI65CP

– Derya Unutmaz, MD (@DeryaTR_) 8 mars

De même, l'utilisateur X teortaxesTex a essayé l'agent Manus et a déclaré qu'il était plus efficace pour reproduire des informations sous forme de grands modèles de langage (LLM) que pour effectuer des tâches proxy. Un autre utilisateur de X, TheXeophon, a également partagé ses découvertes après avoir utilisé l'agent Manus, qui a complètement omis de mentionner la Nintendo Switch après avoir recherché sur le marché des consoles de jeux vidéo.

Même pour l'une des plus grandes entreprises au monde avec d'innombrables rapports en ligne, Manus permet de repérer facilement les erreurs, manquant complètement la Nintendo Switch.
Je suis presque sûr de la provenance des chiffres, mais aucune référence n'est faite dans le rapport non plus. https://t.co/kdLDoab1by pic.twitter.com/wxmTRr3TBW

— Xeophon (@TheXeophon) 9 mars

En fait, la vidéo virale montrant l'agent IA Manus effectuant automatiquement 50 tâches s'est avérée être fausse. Yichao « Peak » Ji, scientifique en chef de Manus, a déclaré : « Cette vidéo n'est définitivement pas celle de Manus » Avec un emoji rieur. Cette vidéo a suscité un large débat sur les capacités et les applications de l’intelligence artificielle, incitant les experts à souligner l’importance de vérifier l’authenticité des informations circulant en ligne.

Le co-fondateur de Manus AI est ici ! Merci de votre intérêt pour Manus @heyBarsee, mais cette vidéo n'est certainement PAS Manus🤣. Notre compte officiel est @ManusAI_HQ , et Manus est un agent d'IA basé sur le Web, comme OpenAI Operator/DeepResearch, pas un VNC pour smartphones.

— Yichao « Peak » Ji (@peakji) 8 mars

Malgré quelques échecs initiaux, il faut se rappeler que Manus est toujours en version bêta fermée et que l'abandonner est prématuré. Cependant, il est tout aussi important d’être prudent et délibéré lorsque l’on expérimente de nouveaux produits d’IA. Manus n’est peut-être pas une avancée majeure, mais c’est un début ambitieux dans la bonne direction.

À mesure que les modèles d’IA continuent de s’améliorer dans les tâches d’agent, les nouveaux produits construits sur eux connaîtront également des améliorations. L'équipe Manus AI a déjà déclaré que l'agent sera considérablement amélioré avant une sortie publique plus large. Il reste maintenant à voir si cela répondra aux attentes, mais c'est certainement une évolution notable qui mérite d'être suivie.

Recherche profonde Manus IA