LipNet : L’intelligence artificielle de Google lit mieux sur les lèvres que l’homme
Grâce à l'intelligence artificielle, Google et des chercheurs de l’université d’Oxford ont mis au point un système de lecture labiale plus performant que l’homme.
Depuis les balbutiements de l’intelligence artificielle, l’être humain aime à se mesurer à la machine. Que ce soit aux échecs avec le match Kasparov vs Deep Blue ou plus récemment au jeu de go, il est inquiétant de voir que la machine prend de plus en plus souvent le pas sur le cerveau humain.
Google et l’université d’Oxford viennent une nouvelle fois d’en faire la preuve avec LipNet, une intelligence artificielle basée sur DeepMind qui permet de lire sur les lèvres, et qui serait plus efficace que l’être humain dans ce domaine.
L’apprentissage machine fait des miracles
Les résultats des travaux des équipes britanniques de Google ont été détaillés par les spécialistes de New Scientist. Pour développer leur intelligence artificielle, les chercheurs lui ont fait visionner des programmes de la BBC pendant 5000 heures sur 6 émissions différentes. En tout, cela représente plus de 110.000 phrases englouties par la machine.
Grâce à la méthode Watch, Listen, Attend, and Spell, le programme LipNet obtient un score de 46,8 % de mots reconnus en lisant simplement sur les lèvres. À titre de comparaison, un spécialiste de la lecture labial qui a participé à la recherche a atteint 23,8% d’exactitude.
Utile pour le sous-titrage
Bien entendu, grâce à ce programme, Google ne cherche pas simplement à mettre une pâtée à l’être humain, le programme sera également très utile pour sous-titrer automatiquement et le plus fidèlement possible les vidéos de YouTube par exemple, mais surtout, certaines émissions en live.
Le logiciel pourrait également être utilisé pour aider les personnes qui souffrent de handicaps auditifs. Les esprits les plus méfiants pourront également penser que Google tient là l’outil parfait pour franchir un nouveau cap vers un espionnage de masse.