Google accélère la course aux agents IA avec Gemini 2.0
Google a annoncé mercredi l'arrivée de Gemini 2.0, une nouvelle famille de modèles d'intelligence artificielle (IA) générative, censés permettre de créer des agents IA capables, non seulement de répondre aux questions des utilisateurs, mais aussi d'agir en leur nom.
"Ce n'est que le tout début", a assuré sur X Demis Hassabis, patron du labo d'IA de Google, DeepMind, et prix Nobel de chimie. "2025 sera l'année des agents IA", a-t-il prédit.
Depuis le lancement de ChatGPT par OpenAI il y a deux ans, les géants des technologies sont engagés dans une course aux modèles d'IA générative toujours plus performants, produisant sur demande des dissertations, invitations, contrats, illustrations, vidéos artistiques ou publicitaires, etc.
Mais le Graal de la Silicon Valley, ce sont désormais des "agents", quand la machine devient une sorte de secrétaire omniscient, disponible à toute heure et capable d'exécuter de nombreuses tâches, des messages à envoyer aux courses sur internet.
Selon le patron de Google, Sundar Pichai, Gemini 2.0 doit ouvrir "une nouvelle ère" de l'IA générative, qui facilitera directement la vie des usagers au quotidien.
"Gemini 2.0, c'est la capacité à rendre l'information bien plus utile", a-t-il souligné dans une note de blog annonçant Gemini 2.0, insistant sur la capacité du nouveau modèle à comprendre un contexte, anticiper et prendre des décisions, "sous votre supervision".
Navigation autonome sur internet
Les utilisateurs de Gemini sur ordinateur peuvent désormais tester Gemini 2.0 Flash, l'un des modèles de la nouvelle famille, tandis qu'une version expérimentale et multimodale a été mise à disposition des développeurs.
Certains ont d'ores et déjà publié des vidéos montrant leurs échanges avec le service. La multimodalité permet, par exemple, de montrer des objets à l'IA, qui peut les analyser et répondre à des questions à leur sujet, en temps réel et à l'oral.
Demis Hassabis a précisé que, grâce à Gemini 2.0, ses équipes avancent sur plusieurs projets. Notamment "Project Astra, notre vision pour un assistant IA universel", "Project Mariner" pour améliorer les interactions entre humains et agents numériques, et "Jules", un outil pour les codeurs.
Dans une vidéo publiée sur X par Google, Jaclyn Konzelmann, une cheffe de projet, montre comment l'agent "Project Mariner" peut extraire des données d'un document, et, à la demande, trouver des informations complémentaires.
L'agent navigue ainsi sur internet de façon autonome, décidant quels mots-clefs entrer dans la barre de recherche, sur quels liens cliquer, etc.
Il peut aussi sélectionner des produits à acheter, mais pas cliquer sur le bouton pour finaliser l'achat.
La recherche transformée par l'IA
Google compte intégrer Gemini 2.0 progressivement dans sa gamme de différents produits, du moteur de recherche aux applications mobiles, dans plusieurs langues.
"Aucun produit n'a été autant transformé par l'IA que la recherche", note le géant californien sur son blog.
L'IA générative constitue, en effet, la première menace de taille à son cœur de métier, la vente de publicités en ligne, depuis que Google est devenu synonyme de recherche sur internet.
La technologie permet de plus en plus de contourner cette tâche, en posant directement une question à un modèle d'IA.
Google a réagi en lançant les "AI Overviews": le moteur répond aux requêtes avec une réponse rédigée et différentes options, avant la traditionnelle liste de liens.
Le service "touche désormais 1 milliard de personnes", s'est félicitée l'entreprise, promettant d'ajouter bientôt "les capacités de raisonnement avancées de Gemini 2.0".
Meta (Facebook, Instagram), Microsoft, OpenAI, Google et, plus récemment, Apple et Amazon ont tous investi des sommes astronomiques dans le développement d'IA génératives susceptibles de faciliter les tâches de la vie quotidienne et d'améliorer la productivité.
Ils ont en ligne de mire un agent IA universel, qui interagirait au nom des personnes avec leurs logiciels et applications.