Meta apprend à une IA à mentir, à élaborer des stratégies

Meta a formé un agent d’intelligence artificielle pour jouer à un jeu de société qui consiste à discuter avec d’autres joueurs pour les persuader de soutenir ses stratégies, puis de les trahir.

La société, qui possède Facebook, Instagram et WhatsApp, affirme que son Cicero AI pourrait avoir des applications généralisées dans un proche avenir, notamment le développement d’assistants virtuels plus intelligents avec l’utilisation combinée de technologies telles que le traitement du langage naturel (NLP) et le raisonnement stratégique, selon un article de blog publié par la société.

Dans un article de recherche paru dans la revue universitaire Science, Meta a déclaré que son Cicero AI avait atteint des performances de niveau humain au jeu de stratégie Diplomacy dans une ligue en ligne où il a joué 40 matchs contre 82 humains, se classant dans le top 10% des participants qui ont joué plus de une partie.

Diplomatie oppose sept joueurs les uns contre les autres pour le contrôle d’une carte de l’Europe. Chaque tour commence avec les joueurs négociant les uns avec les autres pour obtenir un soutien pour leurs plans et se termine avec eux essayant simultanément d’exécuter leurs mouvements. Sans le soutien des autres joueurs, bon nombre de ces mouvements échoueront.

Le jeu a posé un défi à l’agent de l’IA, a déclaré Meta, car gagner l’obligeait à comprendre si ses adversaires bluffaient ou élaboraient une stratégie d’une certaine manière pour gagner le match. L’IA devait étendre un certain niveau d’empathie tout en jouant au jeu pour former des collaborations avec d’autres joueurs, ce que les IA n’avaient pas besoin de faire lorsqu’elles jouaient à des jeux tels que les échecs contre des adversaires humains.

Les agents de l’IA se sont améliorés dans les jeux de stratégie au fil des ans : en 1997, le logiciel Deep Blue d’IBM a battu le champion du monde d’échecs Gary Kasparov, et en 2016, AlphaGo de DeepMind a battu le meilleur joueur de Go Lee Sedol. Facebook a également développé un autre moteur d’IA qui peut surpasser les humains au poker.

Raisonnement stratégique

Cicero repose sur deux composants technologiques principaux : le raisonnement stratégique et le traitement du langage naturel (TAL). Alors que le moteur de raisonnement stratégique prédit les mouvements des autres joueurs et utilise ces informations pour former sa propre stratégie, le moteur de traitement du langage naturel génère des messages et analyse les réponses dans les conversations avec d’autres joueurs pour négocier et parvenir à un accord, ont expliqué les chercheurs.

Afin d’aider l’agent d’IA à générer des conversations pertinentes, les chercheurs ont commencé avec un modèle de génération de langage naturel de 2,7 milliards de paramètres pré-formé sur du texte provenant d’Internet et l’ont affiné avec des conversations entre des joueurs humains dans plus de 40 000 jeux de webDiplomacy.net.

“Nous avons développé des techniques pour annoter automatiquement les messages dans les données d’entraînement avec les mouvements planifiés correspondants dans le jeu, de sorte qu’au moment de l’inférence, nous puissions contrôler la génération du dialogue pour discuter des actions spécifiques souhaitées pour l’agent et ses partenaires de conversation”, ont déclaré les chercheurs dans un rapport plus détaillé. article de blog.

Meta a ouvert le code de Cicero pour que d’autres chercheurs puissent s’appuyer sur les capacités de l’agent d’IA.

En outre, la société a créé un portail pour inviter des propositions de recherche dans le domaine de la coopération homme-IA via la PNL en utilisant la diplomatie comme concept de base.

Projets à long terme

Les grandes entreprises technologiques, telles que Microsoft, Google, Amazon, sont dans une course les unes contre les autres pour développer des assistants virtuels indépendants plus intelligents pour prendre en charge une variété de cas d’utilisation commerciale, allant des centres d’appels aux agents d’IA qui peuvent effectuer une analyse des sentiments et enseigner de nouvelles compétences à un individu. Le marché mondial du traitement du langage naturel (TAL), qui comprend ces assistants, devrait passer de 26,4 milliards de dollars en 2022 à 161,8 milliards de dollars d’ici 2029, selon un rapport de Fortune Business Insights.

Les chercheurs de Meta semblaient suggérer que le succès de Cicéron en diplomatie remplace les capacités des autres assistants virtuels disponibles aujourd’hui, déclarant dans un article de blog : « Par exemple, les assistants IA actuels peuvent effectuer des tâches simples de questions-réponses, comme vous dire la météo. mais que se passerait-il s’ils pouvaient tenir une conversation à long terme dans le but de vous enseigner une nouvelle compétence ? »

Il s’agit d’une fouille dans des outils comme Google Duplex, Amazon Alexa, Xiaoice de Microsoft et Siri d’Apple. Mais Cicéron n’est pas non plus prêt pour des conversations à long terme, car son raisonnement est strictement à court terme. Comme l’ont dit les chercheurs de Meta dans l’article de Science, « D’un point de vue stratégique, Cicéron a raisonné sur le dialogue uniquement en termes d’actions des joueurs pour le tour en cours. Il n’a pas modélisé comment son dialogue pourrait affecter la relation avec les autres joueurs sur le long terme d’un jeu. “

Copyright © 2022 IDG Communications, Inc.