La reconnaissance d’objet d’une vidéo offerte par un nouvel API de Google Cloud

Par Laurent LaSalle – le dans Actualités
Google a dévoilé aujourd'hui une nouvelle technologie d'apprentissage automatique ayant la capacité de reconnaître les objets et éléments d'une vidéo.

Cette trousse d’outils, nommée Video Intelligence API, permettra aux développeurs d’obtenir le détail des contenus d’une vidéo grâce à ses «puissants modèles d’apprentissage automatique» qui peuvent y identifier des éléments avec précision. Alors que la reconnaissance d’objet n’est pas une nouvelle technologie en soi, les systèmes l’exploitant se limitaient toutefois jusqu’à présent qu’à des images statiques.

La reconnaissance d’objet se limitait jusqu’à présent qu’à des images statiques.

On peut ainsi imaginer l’intégration de ces outils dans un portail vidéo comme YouTube, qui pourrait alors offrir des résultats de recherche beaucoup plus fidèles à la réalité en puisant également ses informations des métadonnées générées par la reconnaissance d’objet, plutôt que la seule description et mots-clés (parfois trompeurs) attachés aux vidéos pouvant correspondre à la requête.

«Google collabore depuis longtemps avec les plus grandes entreprises médiatiques au monde en les aidant à trouver de la valeur à partir de données non structurées comme la vidéo», explique Fei-Fei Li, scientifique en chef de l’intelligence artificielle et de l’apprentissage automatique pour Google Cloud. «Cet API est destiné aux grandes entreprises médiatiques et aux entreprises technologiques grand public qui souhaitent construire leur catalogue multimédia ou trouver des moyens faciles de faire la gestion de contenu généré par les utilisateurs, mais aussi pour des partenaires comme Cantemo, qui pourra l’intégrer dans son propre logiciel de gestion vidéo.»

Un aperçu de l'API Video Intelligence en action (Image : Google Cloud).
Un aperçu de l’API Video Intelligence en action (Image : Google Cloud).

Offerte aujourd’hui en version bêta fermée, l’API Video Intelligence viendra s’ajouter aux autres API d’apprentissage automatique (ou machine learning) offerts par Google Cloud, dont Vision, Speech, Natural Language, et Translation. Avec cette initiative, Google souhaite démocratiser les technologies d’apprentissage automatique qu’elle a développé à l’interne.

Si vous êtes curieux de voir l’API en action, vous pouvez l’essayer directement sur la page qui lui est consacrée sur le site de Google Cloud.

Reste à voir maintenant si l’arrivée d’une telle technologie parviendra à mieux positionner Google dans le secteur des services cloud dominé par Amazon et Microsoft.

Les dernières nouvelles

Un iPad à écran pliable à l’horizon 2024 pour Apple?

Un iPad à écran pliable à l’horizon 2024 pour Apple?

On a des mauvaises nouvelles pour le métavers…

On a des mauvaises nouvelles pour le métavers…

Facebook draine-t-il la pile de votre téléphone à votre insu?

Facebook draine-t-il la pile de votre téléphone à votre insu?

Plus d'actualités

Samsung Galaxy S23 : de la «grosse» photo, de la «belle» photo

Samsung Galaxy S23 : de la «grosse» photo, de la «belle» photo

Huawei sur le point d’être banni aux États-Unis

Huawei sur le point d’être banni aux États-Unis

OnePlus 11 et Buds Pro 2: au tour d’Android adopter l’audio spatial

OnePlus 11 et Buds Pro 2: au tour d’Android adopter l’audio spatial

Populaires

25 objets technos de votre enfance qui valent une fortune aujourd’hui

25 objets technos de votre enfance qui valent une fortune aujourd’hui

Avec Google Drive, regardez gratuitement des films en streaming

Avec Google Drive, regardez gratuitement des films en streaming

Test de la DualSense Edge: Le haut de gamme de Sony, mais à quel prix ?

Test de la DualSense Edge: Le haut de gamme de Sony, mais à quel prix ?

Laurent LaSalle

Depuis qu'il a tapoté sur son Commodore Vic-20 à l'âge de 3 ans, Laurent est (un peu trop) obsédé par la technologie. Passionné d'informatique et de jeux vidéo, il a notamment été blogueur pour Radio-Canada et chroniqueur techno pour MusiquePlus .