Gemma 4 : une nouvelle gamme de modèles ouverts dérivés de Gemini 3

Image d'illustration. Gemma 4Google / PR-ADN
Avec Gemma 4, Google combine puissance et ouverture pour transformer le développement IA.
Tl;dr
- Google lance Gemma 4 en open source Apache 2.0, offrant aux développeurs et entreprises plus de flexibilité pour adapter et déployer ses modèles.
- La famille comprend quatre variantes, des versions légères pour mobile et audio aux modèles puissants pour traitement multimédia avancé et infrastructures robustes.
- Gemma 4 prend en charge plus de 140 langues, le code hors-ligne et le traitement multimédia, tout en permettant un contrôle total sur les données et l’infrastructure.
La famille Gemma 4 débarque chez Google
La course à l’intelligence artificielle générative prend un nouveau tournant : Google vient d’annoncer la sortie de sa famille de modèles Gemma 4, cette fois sous licence open source Apache 2.0. Un choix stratégique qui marque une rupture, car jusqu’ici, l’entreprise conservait ses modèles précédents sous une licence maison plus restrictive. Désormais, développeurs et entreprises bénéficient d’une flexibilité accrue pour adapter, modifier et déployer ces systèmes selon leurs besoins.
Des modèles taillés pour tous les usages
À travers cette gamme, Google propose quatre variantes du modèle Gemma 4, chacune optimisée pour des cas d’usage spécifiques. Les deux versions « Effective », dotées de deux ou quatre milliards de paramètres, ont été pensées pour les appareils mobiles et l’informatique embarquée. De leur côté, les versions plus robustes, « Mixture of Experts » à 26 milliards de paramètres et « Dense » à 31 milliards, s’adressent aux infrastructures informatiques puissantes. Pour rappel, les paramètres sont au cœur du fonctionnement d’un modèle de langage : plus ils sont nombreux, meilleure sera la qualité des réponses générées… mais il faut aussi disposer d’un matériel capable de suivre.
Polyvalence technologique et performances inédites
La polyvalence fait partie des atouts majeurs mis en avant par Google. Tous les modèles sont capables de traiter des vidéos ou des images, une fonctionnalité idéale pour la reconnaissance optique de caractères ou l’analyse multimédia avancée. Les deux variantes plus légères peuvent même comprendre l’audio et reconnaître la parole. Selon le groupe californien, l’une des innovations phares réside dans « un niveau d’intelligence par paramètre jamais vu auparavant ». Sur ce point, les résultats sont frappants : sur le classement Arena AI dédié au traitement du texte, les modèles à 31 milliards et 26 milliards de paramètres se placent respectivement en troisième et sixième positions, surpassant parfois des concurrents bien plus volumineux.
Voici quelques points marquants concernant leur utilisation :
- Soutien multilingue : entraînement sur plus de 140 langues.
- Coding hors-ligne : possibilité de générer du code sans connexion internet.
- Mise à disposition facilitée : téléchargement via Hugging Face, Kaggle ou Ollama.
L’avenir ouvert du développement IA selon Google
Pour accompagner ce virage open source, Google insiste sur la notion de « souveraineté numérique totale » offerte aux utilisateurs. Que ce soit en cloud ou sur site, chacun pourra désormais construire ses propres solutions IA avec un contrôle complet sur ses données et son infrastructure. Un geste qui pourrait bien redéfinir la place du géant américain au sein de la communauté tech mondiale… en tout cas, un signal fort adressé à tous ceux qui militent pour davantage d’ouverture dans l’innovation numérique.