Les grands modèles économiques (LAM) révolutionnent le monde de l’IA par rapport aux modèles traditionnels.
L’émergence de chatbots génératifs alimentés par l’IA a donné naissance au concept de « grand modèle de langage » (LLM), une technologie d’IA avancée qui analyse et comprend le langage naturel pour générer des réponses significatives basées sur les requêtes des utilisateurs. Les grands modèles linguistiques sont capables de générer un contenu cohérent, de type humain, donnant l’impression que l’IA possède une sorte de « pensée » qui lui est propre.
Cependant, les modèles de langage ne sont pas la seule technologie contribuant au développement de l’intelligence artificielle ; Les grands modèles d’affaires (LAM) pourraient être la prochaine étape. Ces modèles visent à améliorer les capacités d’analyse et de prise de décision dans des contextes pratiques, transformant potentiellement des domaines tels que l’automatisation et la gestion d’entreprise. Dans cet article, nous découvrirons comment fonctionnent les LLM et les LAM, ainsi que leur impact croissant sur l’amélioration des applications de l’IA et l’élargissement de sa portée.

Qu’est-ce qu’un grand modèle d’entreprise (LAM) ?
Un grand modèle d'action (LAM) est un modèle d'intelligence artificielle capable de comprendre les apports humains et d'effectuer l'action correspondante, ce qui lui permet d'interagir avec le monde à la manière d'un humain. Il s’agit d’une approche légèrement différente des modèles d’IA qui se concentrent uniquement sur la génération de réponses. Le terme « grand modèle commercial » a été introduit pour la première fois par Rabbit Inc, développeur du Rabbit R1. Dans la vidéo de lancement du Rabbit R1 de la société, il est indiqué que LAM est un nouveau modèle fondamental qui aide à faire passer l'IA des paroles à l'action.
Les LAM sont formés sur de grands ensembles de données sur les actions des utilisateurs ; Ainsi, ils apprennent en imitant les actions humaines ou par démonstration. Grâce à la démo, le modèle LAM peut comprendre et naviguer dans les interfaces utilisateur de différents sites Web ou applications mobiles et effectuer des actions spécifiques en fonction de vos instructions. Selon Lapin,LAM peut y parvenir même si l'interface est légèrement modifiée.
Vous pouvez considérer les LAM comme une extension des capacités existantes des LLM. Alors que les sorties de texte ou de médias génératifs dans les LLM s'appuient sur la saisie de l'utilisateur en prédisant le mot ou le jeton suivant (vous posez une question et le modèle LLM fournit des sorties de texte ou de médias), les LAM vont plus loin en ajoutant la possibilité d'effectuer des actions complexes en votre nom.
Que peuvent faire les LAM ?
Les LAM consistent à effectuer des actions complexes en votre nom. Cependant, le point crucial à noter est la capacité à réaliser des procédures complexes. Cela rend les LAM plus utiles pour les tâches avancées, mais cela ne signifie pas qu'ils ne peuvent pas exécuter des procédures plus simples.
En théorie, cela signifie que vous pourriez, par exemple, demander au modèle LAM de faire quelque chose en votre nom, comme commander un café dans votre café local ou un trajet Uber, et même faire une réservation d'hôtel. C'est donc différent d'effectuer des tâches simples comme demander à Google Assistant, Siri ou Alexa d'allumer la télévision ou les lumières du salon.
Sous le capot, selon la vision partagée par Rabbit Inc., le modèle LAM est capable d'accéder à un site Web ou à une application pertinente comme Uber et de naviguer dans son interface pour effectuer une action, comme demander un trajet ou en annuler un si vous changez d'avis.
Les LAM surpasseront les LLM, mais ils ne sont pas (encore) prêts
Le concept des LAM est passionnant, peut-être plus que celui des LLM. Les grands modèles d'action (LAM) seront l'avenir après l'IA générative, nous permettant de pouvoir compenser les tâches banales et de nous concentrer sur d'autres activités enrichissantes. Cependant, aussi excitant que cela puisse paraître, les LAM ne sont pas encore prêts.
Le premier produit commercial qui promettait d'exploiter le LAM (Rabbit r1) n'a pas pleinement tenu sa promesse marketing d'effectuer des actions au nom de ses utilisateurs. L'appareil a tellement échoué dans son argument de vente principal que de nombreuses critiques de première main l'ont décrit comme assez inutile.
Pire encore, une enquête menée par YouTuber Coffeezilla, en collaboration avec un groupe sélectionné d'ingénieurs logiciels ayant accès à une partie de la base Rabbit r1, a révélé que Rabbit utilisait des scripts Playwright pour exécuter des actions au lieu de LAM. Ainsi, au lieu d’une machine exécutant un modèle d’IA unique, elle exécutait simplement un tas d’instructions If > then ; On est bien loin du modèle LAM promis.
S'il y a une chose que vous pouvez retenir du Rabbit r1, c'est que oui, la vision est là. Cependant, le travail doit être fait avant la mise en œuvre, alors ne vous enthousiasmez pas trop vite.
Les commentaires sont fermés.