mercredi 25 novembre 2009

YouTube vers un sous-titrage automatique des vidéos

Youtube va prochainement tenter de mettre en œuvre un sous titrage automatique des vidéos via un processus de reconnaissance vocale.

Outre l'avancée qu'offre ce développement pour les malentendants et la facilité qu'il offrira dans la compréhension des vidéos en langues étrangères (Google Translate permettra de traduire les textes en 51 langues), le "Speech to text" pourrait permettre d'accroître le périmètre d'action des outils se basant sur des analyses sémantiques, c'est-à-dire les moteurs de recherche et les logiciels de veille pour l’essentiel.

Google dès 2008, avait démontré l'intérêt que le « Speech to text » revêtait à ses yeux, à l’occasion des présidentielles américaines (période propice au buzz). En effet, le n°1 du « Search » sur internet permettait via un gadget iGoogle de réaliser des recherches textuelles au sein des discours audio des candidats.

« How does it work ? »

You tube s'appuie sur deux technologies : Automatic Captions et Automatic Timing. Le premier génère automatiquement des sous titres via un système de reconnaissance vocale utilisée par Google Voice. Ce système ne se limite pas seulement à la retranscription des voix humaines mais permet également celle des sons ambiants sur la vidéo. Ainsi l'ensemble des traits sonores captés est retranscrit en bas de l'écran.

Automatic Timing, permet d'éditer la vidéo par l’entrée manuelle de fichiers texte, permettant la retranscription des propos tenus de manière synchronisée avec la lecture du contenu audiovisuel. Cette technologie est actuellement disponible pour l'ensemble des vidéos You Tube, mais en anglais uniquement...

Aujourd’hui le sous-titrage automatique n'est en vigueur que pour les vidéos des 13 chaînes disposant d'un partenariat avec You tube.

...un petit pas pour You Tube, un bond de géant (potentiel) pour la veille

Grand bon "potentiel", car si la technologie permettant le passage de l'audio à l'écrit est en phase d'affinage, il n'est pas certain que les logiciels de veille dont nous disposons aujourd'hui soient en mesure d'isoler et de capter ces textes au sein des vidéos.

Je vous encourage à visiter le blog officiel de Google (et oui YouTube appartient à Google, depuis 2006...) ou une petite vidéo montre les fonctionnalités qui sont offertes par cette mini révolution dans le speech to text...

Il est à souligner que Google n’est pas le seul acteur à se lancer dans le « Speech to text ». France 24 s’est également essayé à appliquer cette technique à ses programmes durant l'année.

On peut également suggérer que de nombreuses dérives sont à venir, dans les retranscriptions textes qui seront faites des contenus audiovisuels. Pour exemple nous pouvons reprendre l'une des parodies les plus populaires du moment, inspirée du film « La Chute »…extrait choisi...

Yoann Rodriguez

Pour en savoir plus:

Aucun commentaire:

Enregistrer un commentaire