Types d'agents d'IA et leurs utilisations : une explication détaillée

Résumé:

Il existe 7 types différents d’agents d’IA, allant des simples agents réactifs aux systèmes multi-agents.
Actuellement, les principales entreprises d’IA se concentrent principalement sur la création d’agents basés sur des objectifs, parallèlement à des agents d’apprentissage.
À l’avenir, nous pourrions voir des agents d’IA véritablement autonomes capables d’interagir avec d’autres agents d’IA pour accomplir plusieurs tâches.

Il est clair que les agents d’IA axés sur l’action mèneront la révolution de l’IA, et les premiers signes sont déjà là. Des chatbots alimentés par l'IA aux agents IA capables de lire vos e-mails et de prendre des rendez-vous, nous sommes sur le point d'entrer dans l'ère des agents. Pour mieux comprendre les agents d’IA, j’ai expliqué en détail différents types d’agents d’IA. De plus, j’ai répertorié les principales entreprises et les agents d’IA existants déjà disponibles sur le marché. Alors, commençons.

1. Agents à réactions simples

Commençons par le type d’agent IA le plus simple : les agents avec des réactions simples. Comme leur nom l’indique, ces agents effectuent des actions en fonction des informations actuelles, en suivant une condition « si-alors ». Par exemple, un thermostat allume le chauffage lorsque la température descend en dessous d’un certain point. Il exécute simplement une action lorsque la condition est vraie.

Cependant, ce type d’agent IA présente plusieurs limitations. Elle ne prend en compte que les informations actuelles (appelées aussi « perceptions » ou perception). Il ne se souvient pas des relevés de température précédents ni ne prend en compte les relevés futurs : il agit uniquement en fonction de la température actuelle.

Les agents réactifs simples n’ont pas de mémoire et n’agissent que lorsque l’environnement est entièrement observable – un état dans lequel toutes les informations nécessaires pour prendre une décision sont disponibles. En conséquence, il ne conserve pas de représentation ou de modèle interne du monde.

2. Agents réfléchissants basés sur des modèles

Ensuite, les agents réfléchissants basés sur des modèles améliorent les performances des agents réfléchissants simples. Ce type d’agent maintient une représentation interne du monde et possède donc une mémoire. Essentiellement, ces agents suivent les actions et la manière dont elles affectent le monde, et mettent à jour le modèle/la représentation interne. Par exemple, une voiture autonome, lorsqu’elle navigue dans la circulation, se souvient de l’emplacement des véhicules même lorsqu’ils se sont éloignés de leur emplacement actuel. Cette représentation interne permet de prendre des décisions plus éclairées.

Désormais, sur la base d’observations passées et d’informations actuelles, l’agent crée une représentation interne du monde et entreprend l’action souhaitée. Cela signifie que les agents réflexifs basés sur des modèles peuvent fonctionner dans des environnements partiellement observables. Essentiellement, le modèle interne est utilisé pour prédire l’action suivante. Ce modèle est basé sur des algorithmes avancés d’intelligence artificielle.

3. Agents basés sur des objectifs

Comme leur nom l’indique, les agents axés sur les objectifs sont des agents axés sur les résultats, ce qui signifie qu’ils envisagent des actions futures qui les rapprocheront de l’objectif ultime. Ces agents peuvent mener des recherches, planifier des opérations et envisager différentes séquences d’actions qui les mèneront à l’objectif souhaité. Les agents basés sur des objectifs fondent leurs actions sur la prise en compte des conséquences futures.

Par exemple, un GPS qui planifie votre itinéraire doit rechercher et prendre en compte toutes les routes menant à la destination. Il prend en compte tous les itinéraires possibles en fonction de la distance, de la durée, du trafic actuel, etc. Maintenant, sur la base de ces informations, l'agent basé sur les objectifs planifie et choisit le meilleur chemin pour atteindre la destination souhaitée. Ce type d’agent est essentiel dans les applications d’IA qui nécessitent une planification stratégique.

4. Agents basés sur les avantages

Les agents basés sur l’utilité sont un type d’agents basés sur des objectifs, mais ils ne sont pas liés à un objectif spécifique. Par exemple, les agents orientés vers un objectif pensent uniquement en termes d’atteinte ou de non-atteinte d’un objectif – de manière binaire. Cependant, les agents basés sur l’utilité considèrent différents états du monde, évaluent différents résultats en fonction de préférences complexes, puis choisissent l’action qui maximise leur « utilité ».

Ce type d'agent fonctionne en attribuant un score numérique à différentes séquences d'actions et sélectionne uniquement l'action qui fournit le score d'utilité le plus élevé. Les agents basés sur l’utilité sont conçus dans des situations où le résultat est incertain. Par exemple, l’objectif d’un système de trading basé sur l’IA peut être de maximiser les profits, mais il doit également prendre en compte le niveau de risque que l’utilisateur peut tolérer et les conditions actuelles du marché. Cela nécessite une analyse minutieuse des risques et des rendements potentiels.

Essentiellement, les agents basés sur l’utilité prennent en compte différentes préférences et évaluent les résultats avant de prendre une décision. Leur objectif n’est pas seulement d’atteindre l’objectif, mais d’équilibrer différents facteurs pour trouver l’action optimale. Cela signifie qu’ils cherchent à maximiser « l’utilité attendue » sur la base d’une évaluation complète des circonstances.

5. Agents d'apprentissage : améliorer les performances des systèmes d'IA

Les agents d’apprentissage, par définition, sont capables d’améliorer leurs performances au fil du temps en tirant les leçons des expériences passées. La meilleure caractéristique des agents d’apprentissage est leur capacité à s’adapter à des environnements inconnus et à optimiser leurs actions en fonction des commentaires. Dans les agents d’apprentissage, il existe un composant « critique » qui fournit un retour d’information sur les performances de l’agent, ce qui est crucial pour le processus d’apprentissage.

Pour illustrer un exemple, considérons le fonctionnement des filtres anti-spam pour les e-mails. Les filtres anti-spam ont un ensemble de règles de base pour commencer ; Cependant, à mesure que vous continuez à marquer les e-mails comme spam, l'agent apprend grâce aux évaluations fournies (« critique ») et adapte son comportement. Désormais, à l’avenir, ces e-mails seront automatiquement marqués comme spam et déplacés vers un autre dossier. Ce processus s’appuie sur des algorithmes avancés dans le domaine du Machine Learning.

6. Agents pyramidaux

Les agents hiérarchiques sont un type d’agent qui divise les objectifs complexes en sous-objectifs. Il existe de nombreuses tâches complexes qui nécessitent des procédures en plusieurs étapes et la résolution de problèmes. Dans de tels cas, les tâches sont décomposées en sous-problèmes plus petits et plus faciles à gérer, qui sont organisés en hiérarchie. Désormais, ces tâches sont déléguées aux agents de niveau inférieur, et les agents de niveau supérieur contrôlent la stratégie et le résultat final.

Par exemple, lorsque vous demandez à un robot IA de préparer le dîner, l’agent de haut niveau planifie et divise la tâche, comme la préparation des pâtes et de la sauce. Ces tâches sont ensuite décomposées davantage, comme allumer la cuisinière et ajouter de l’eau dans la casserole. Maintenant, de cette manière hiérarchique, la tâche est accomplie, d’une couche à l’autre. Cette approche permet d’exécuter des tâches complexes de manière efficace et efficiente, ce qui est crucial dans les applications d’IA avancées.

7. Systèmes multi-agents

Enfin, nous arrivons aux systèmes multi-agents (SMA), qui combinent plusieurs agents indépendants pour atteindre un objectif commun. Ces systèmes permettent à plusieurs agents de communiquer, d’interagir, de coordonner des actions potentielles, de négocier et de coopérer entre eux. Dans de tels systèmes, chaque agent opère de manière indépendante et possède sa propre capacité à prendre des décisions.

Cependant, tous les agents doivent se conformer à un protocole commun de systèmes multi-agents pour éviter les conflits et atteindre un objectif commun. Par exemple, dans un système de chaîne d'approvisionnement, plusieurs agents suivent l'inventaire, un autre agent rend compte au service des achats en fonction des besoins en inventaire, un agent logistique trouve le meilleur itinéraire d'expédition, etc. Les systèmes multi-agents constituent une solution efficace aux problèmes complexes qui nécessitent une coordination et une coopération entre des entités indépendantes.

Agents d'IA actuels issus de grandes entreprises technologiques

Il existe déjà de nombreux types d’agents d’IA disponibles sur le marché. Des entreprises comme OpenAI, Google, Microsoft, Anthropic, Salesforce et bien d’autres créent des agents et des cadres d’IA pour exploiter efficacement la puissance de l’IA ciblée. Vous trouverez ci-dessous quelques agents d’IA que vous pouvez consulter, en gardant à l’esprit que ces outils sont toujours en développement et en amélioration continue.

OpenAI

OpenAI est la première entreprise à lancer Agent IA opérateur Orienté consommateur. Il s'agit d'un agent qui utilise un ordinateur pour automatiser des tâches sur le web. Un opérateur peut interagir avec les navigateurs web et effectuer des actions par simple clic, saisie et glissement. Vous pouvez l'utiliser pour remplir des formulaires, réserver des billets d'avion, commander des produits d'épicerie, et bien plus encore. Cependant, il n'est pas encore totalement autonome. Vous devrez effectuer manuellement les paiements et saisir des CAPTCHA si nécessaire. Cet agent constitue une avancée significative vers le développement d'une IA capable d'exécuter efficacement des tâches complexes.

L'opérateur est susceptible d'appartenir à la catégorie des agents basés sur des objectifs et des agents d'apprentissage. Il est axé sur les objectifs et apprend en interagissant avec les sites Web. De plus, il le fait Agent de recherche approfondie d'OpenAI Exécute des tâches de recherche complexes en plusieurs étapes et analyse du texte, des images et des fichiers PDF pour générer un rapport complet. Je dirais que c'est une combinaison d'un agent basé sur des objectifs, d'un agent d'apprentissage et d'un agent hiérarchique qui décompose les tâches en sous-tâches plus petites. Ces capacités en font un outil puissant pour les chercheurs et les analystes.

De plus, OpenAI indique que la dernière o3 et o4-mini Il ne s'agit pas seulement de modèles d'IA, mais de systèmes d'IA de type agent. Ces nouveaux systèmes d'IA se comportent comme des agents et peuvent interagir avec un large éventail d'outils, notamment la recherche web, les interpréteurs Python, l'analyse d'images et Plus. Ce sont des agents basés sur des modèles et des objectifs. Ces systèmes représentent une avancée significative en matière de capacités d'IA.

Enfin, le dernier outil Codex CLI d'OpenAI, qui permet aux développeurs de lire, de modifier et d'exécuter du code à partir du terminal, est un autre type d'agent IA. Il peut corriger automatiquement les erreurs, créer de nouvelles fonctionnalités et modifier les fichiers. Encore une fois, il s’agit d’un agent basé sur des objectifs, construit à l’aide de l’agent d’apprentissage. Cet outil améliore considérablement la productivité des développeurs.

Google

Jusqu'à présent, Google n'a lancé que Agent d'IA de recherche approfondie sur Gemini, qui fonctionne de manière similaire à l'agent d'OpenAI. Il peut parcourir le Web, répertorier les informations dont il a besoin et compiler ces informations pour créer un rapport complet sur n’importe quel sujet. Je classe cet agent comme un agent d'apprentissage basé sur des objectifs, ce qui le rend avancé dans le domaine de l'intelligence artificielle.

Ensuite, Google a dévoilé le projet Mariner, qui est toujours en cours de développement. Ce projet fonctionne comme l'agent Operator AI d'OpenAI et peut automatiser les tâches dans le navigateur Chrome. Il peut analyser l'écran actif et effectuer des actions sur les sites Web. Google indique que l'agent est actuellement testé par des testeurs de confiance et sera publié dans un avenir proche.

De plus, Google a introduit Protocole Agent2Agent (A2A) La nouvelle fonctionnalité permet à plusieurs agents IA de communiquer entre eux. Il ne s’agit pas d’un agent en soi, mais d’une norme/d’un cadre qui permettra des systèmes multi-agents (MAS).

Anthropique

Tout comme OpenAI, Anthropic a dévoilé son agent d’IA « Computer Use », actuellement en version bêta, capable d’interagir avec les environnements informatiques de bureau. Il peut analyser l'écran, cliquer, taper et effectuer des opérations sur les fichiers. Il ne se limite pas aux navigateurs Web, il peut également effectuer des actions au niveau du système d’exploitation. Il va sans dire qu’il s’agit d’un agent d’apprentissage basé sur des objectifs.

De plus, Anthropic a récemment publié un outil de recherche avec intégration Workspace on Cloud. Il peut se connecter à votre Gmail, à votre calendrier et à Drive, ainsi qu'au Web pour effectuer des recherches et extraire des informations. De même, Claude Code est un outil de codage proxy qui s'exécute dans Terminal. Comprend la base de code et peut également modifier des fichiers, exécuter des tests et interagir avec Git. Les deux sont des agents basés sur des objectifs.

Enfin, Anthropic a développé le Model Context Protocol (MCP), une norme ouverte permettant de connecter des modèles d'IA à des sources de données externes, permettant aux agents d'IA de fonctionner de manière fiable sur des services sans API. Bien qu'il ne s'agisse pas d'un agent, il permet la communication entre les modèles d'IA, les outils, les sites Web et d'autres sources de données. Vous pouvez découvrir comment Configuration de MCP dans le Cloud sur Windows et macOS.

Microsoft

Dans le domaine des services aux consommateurs, Microsoft a annoncé plusieurs nouveaux agents d’IA pour son chatbot, Copilot. Un agent peut Recherche approfondie dans Copilot Effectuez des recherches en plusieurs étapes pour créer des rapports complets sur des sujets spécifiques. De plus, il peut Actions du copilote Réservez des billets, faites des réservations et achetez des produits sur le Web. Cependant, cela ne fonctionne que sur les sites Web partenaires.

Pour les entreprises, Microsoft a récemment annoncé l’agent Computer Use AI dans Copilot Studio. Il peut interagir directement avec les sites Web et les applications de bureau pour effectuer des actions et ne s'appuie pas sur des API spécialisées. Microsoft a également dévoilé l'agent Security Copilot pour aider à gérer les alertes de phishing, la sécurité des données et la gestion des identités, des composants essentiels de la cybersécurité d'entreprise.

Microsoft a développé plusieurs agents Copilot pour les clients d’entreprise, et vous pouvez même créer un agent IA personnalisé pour votre flux de travail. Vous pouvez démarrer dans Copilot Studio et connecter des serveurs MCP, des API et des sources externes pour automatiser les tâches, augmenter la productivité du travail et réduire les erreurs potentielles.

Salesforce

En plus de Microsoft, Salesforce a développé la plateforme Agentforce pour les clients d'entreprise, qui fournit des agents IA autonomes et personnalisables. Les utilisateurs professionnels peuvent créer, déployer et gérer plusieurs agents IA sur Agentforce pour générer des prospects, optimiser les ventes, gérer le marketing, etc. Agentforce est une plateforme leader pour l'automatisation des processus métier utilisant l'intelligence artificielle.

Salesforce affirme que contrairement à Copilot de Microsoft, les agents Agentforce peuvent exécuter des actions de manière autonome en fonction d'événements ou de déclencheurs prédéfinis. Les agents Agentforce peuvent mettre à jour les enregistrements dans la base de données, envoyer des e-mails, réserver des réunions, résoudre les cas en attente, etc. Ces fonctionnalités font d'Agentforce un outil puissant pour automatiser le service client et les tâches de vente.

Voici donc les types d’agents d’IA que vous pouvez explorer et trouver les agents d’IA actuellement disponibles sur le marché. À mesure que nous progressons, les agents d’IA deviendront un élément essentiel de l’expérience Internet, que ce soit du côté du consommateur ou de l’entreprise. Le marché des agents d'IA devrait connaître une croissance significative dans les années à venir, tirée par la demande croissante d'automatisation et d'amélioration de l'efficacité.