Mon nom est LeCun. Yann LeCun. Ou comment les lunettes Meta sont la démonstration de la vision par ordinateur mise au point par FAIR sous LeCun.

Meta vient de lancer la deuxième génération de ses lunettes connectées Ray-Ban. Après les avoir essayées, une chose est claire : cet appareil n’est plus un simple gadget pour capturer des photos et écouter de la musique. C’est une plateforme matérielle conçue pour une seule chose : servir d’yeux à l’intelligence artificielle de Meta.

La première génération était essentiellement une caméra déportée. Cette nouvelle version est le premier véritable produit grand public qui incarne la vision de Yann LeCun, le scientifique en chef de l’IA chez Meta. C’est un raccourci : LeCun n’a probablement rien à voir avec ce produit. Mais l’expert en IA a mis au point la reconnaissance d’image qui anime si bien Meta AI, l’assistant intégré aux lunettes éponymes.

Ces lunettes sont la démonstration que les années de recherche fondamentale en apprentissage profond et en vision par ordinateur menées par son laboratoire, FAIR (Fundamental AI Research), sont enfin prêtes à sortir des serveurs pour entrer dans le monde réel.

Ces lunettes ne font pas que regarder, elles comprennent. Évidemment, elles ont aussi tout un volet ludique, puisqu’on peut écouter de la musique, prendre des photos et filmer des courtes séquences vidéo qu’on peut ensuite partager sur toutes les plateformes du groupe Meta (Facebook, Instagram, Whatsapp, Messenger…).

Ces lunettes sont aussi un accessoire mains libres très utile pour les appels reçus sur son téléphone. Le son est étonnamment clair. Meta planche d’ailleurs sur une utilisation des micros intégrés pour isoler les sons et les voix autour de l’utilisateur qui devraient les rendre plus polyvalentes encore dans l’interaction avec son environnement.

La forme des lunettes reste heureusement celle d’une paire de Ray-Ban classique. C’est un point essentiel, car la meilleure technologie est celle qui se fait oublier. Mais la magie de cette deuxième génération réside dans son intégration de l’IA multimodale. Les lunettes ne se contentent plus d’enregistrer passivement; elles voient, écoutent et comprennent activement ce que vous regardez.

L’expérience est à la fois simple et futuriste. En regardant un menu dans une langue étrangère et en posant la question « Hey Meta, peux-tu me traduire ça? », une voix discrète dans notre oreille nous lit la traduction. C’est une application directe de la vision par ordinateur et du traitement du langage naturel, deux piliers de la recherche de FAIR.

Cette intelligence contextuelle va plus loin. Les lunettes peuvent correctement identifier des bâtiments et des objets en tout genre et fournir un bref résumé de son histoire. Éventuellement, elles agiront comme un traducteur en temps réel, ce qui devrait les rendre utiles jusque dans les voyages à l’étranger.

FAIR dans un produit de consommation

Ce qui se passe en coulisses est le véritable exploit. Pour qu’une telle interaction fonctionne, les lunettes doivent capturer une image, l’analyser, la comparer à une base de connaissances, comprendre la requête vocale et générer une réponse audio, le tout en quelques secondes.

Là où la première génération ne faisait que capturer la réalité, cette version l’augmente. L’IA peut voir les ingrédients sur votre comptoir et vous suggérer une recette, ou identifier la race d’un chien que vous croisez dans la rue. Ce ne sont pas des fonctions accessoires; c’est la raison d’être de l’appareil.

Meta vend cette paire de lunettes à partir de 520 $. C’est peut-être un premier point d’accès à une intelligence artificielle qui vous libère des écrans. La stratégie est claire : habituer le public à interagir avec une IA qui voit le monde à travers ses yeux. C’est une étape cruciale, bien plus que le métavers, pour intégrer l’IA dans notre quotidien.

Bien sûr, tout n’est pas parfait. L’autonomie reste un défi, et l’IA fait encore des erreurs d’identification. Meta devra également naviguer les questions inévitables sur la vie privée. Mais d’un point de vue purement technologique, ces lunettes sont une belle réussite.

Ces nouvelles Ray-Ban sont la preuve que la vision à long terme de gens comme Yann LeCun n’est plus seulement académique. C’était le plan directeur pour la prochaine génération d’informatique, une informatique ambiante où l’IA n’est plus dans notre poche, mais littéralement devant nos yeux.