IA : Avec Gemini, Google veut damer le pion à ChatGPT
Avec son modèle puissant, Google assure battre GPT-4 sur de nombreux tests.
eLa course à l’intelligence artificielle (IA) gagne en vitesse. Mercredi 6 décembre, Google a commencé à déployer son nouveau modèle d’IA baptisé Gemini, et qui doit rivaliser avec OpenAI et Microsoft.
Eli Collins, l’un des vice-présidents de Google DeepMind, le laboratoire dédié à cette technologie, assure que « C’est notre modèle d’IA le plus conséquent, le plus doué et aussi le plus général ».
Bard bénéficie de Gemini
Sans plus attendre, une version « light » de Gemini a été intégrée à Bard, l’outil conversationnel et au smartphone Pixel 8 Pro. Mais l’Union européenne n’en bénéficie pas encore, et il faudra également attendre 2025 pour savoir si Gemini Ultra, version la plus puissante, est en passe de détrôner OpenAI.
Plus précisément, Gemini est un « large language model » dit multimodal, c’est-à-dire qu’il peut comprendre du texte, des images et vidéos et de répondre par écrit ou à l’oral.
Des experts humains dépassés
« Multimédia dès sa création, il a des capacités de raisonnement sophistiquées et il peut coder à un niveau avancé », avance encore Eli Collins.
Il assure qu’il s’agit du premier modèle à à surpasser des experts humains à un test standard dans l’industrie, le MMLU, lequel a pour but d’évaluer les capacités de ces programmes informatiques à raisonner dans différents domaines, des mathématiques à l’histoire et au droit.
Une démonstration impressionnante
À la fin de l’article, si vous regardez la vidéo démonstration, vous pourrez comment en quelques minutes Gemini commente ce que lui présente un utilisateur humain. Le modèle identifie des objets, répond à des questions demandant une certaine analyse, et justifie son « raisonnement ».
Sundar Pichai, le patron de Google, estime que « cette nouvelle ère de modèles représente l’un des plus grands efforts scientifiques et techniques que nous ayons entrepris en tant que société ». Au bout de cette course folle, et toutes les sociétés impliquées veulent y parvenir, se trouve une intelligence artificielle générale (AGI), qui pourra raisonner aussi bien, si ce n’est mieux, que les humains.
Let's go hands-on with #GeminiAI.
Our newest AI model can reason across different types of inputs and outputs — like images and text. See Gemini's multimodal reasoning capabilities in action ↓ pic.twitter.com/tikHjGJ5Xj
— Google (@Google) December 6, 2023