SubTil : comment afficher les sous-titres au bon endroit à l’aide d’une intelligence artificielle – 1ère partie

Traditionnellement, les sous-titres d’un programme apparaissent centrés au bas de l’image. Mais bien souvent, des éléments graphiques (synthés, textes défilants, etc.) associés au programme lui-même occupent déjà la place. Résultat : les sous-titres se superposent au point de ne plus être lisibles. L’intelligence artificielle nous permet aujourd’hui de pallier cet inconvénient en plaçant les sous-titres au meilleur endroit tout en offrant le meilleur confort de lecture (image + sous-titres).

Démocratisé par CNN dans les années 90, l’habillage graphique fourni des chaînes d’information est désormais pensé pour les téléspectateurs privés du son du programme comme dans les lieux publics (cafés, gares) en ajoutant volontiers du texte supplémentaire sur l’image. France Info a notamment vulgarisé cette écriture visuelle propice à la circulation des contenus sur les réseaux sociaux, où l’utilisateur consulte souvent son application sans activer le son. D’autres programmes insèrent systématiquement un sous-titrage dès que la vidéo est publiée sur les réseaux sociaux. Il faut donc savoir jongler avec toutes ces informations visuelles.

Une solution a été mise en œuvre grâce au projet SubTil(*). Voici comment cela fonctionne :

  • au départ, il faut le programme (audio + vidéo) et le fichier de sous-titrage produit en direct
  • la vidéo est analysée par une fonction d’Intelligence Artificielle qui sait reconnaître la présence de caractères (motifs semblables à des chiffres ou des lettres) dans l’image
  • en sortie de cette analyse, les différentes zones de l’image occupées par du texte préexistant sont connues
  • en fonction de la taille des sous-titres, tout en conservant l’objectif de les afficher dans le tiers inférieur de l’image pour ne pas recouvrir les visages ni trop « chercher » les sous-titres du regard, l’algorithme les déplace afin qu’ils apparaissent dans un espace libre
  • dans le cas où aucune place suffisante ne s’avère disponible, un cache opaque est ajouté derrière les sous-titres pour garantir leur lecture confortable en masquant le texte préexistant.

Voici ce que ça donne :

(*) Le projet SubTil réunit France Télévisions innovations & développements, Perfect Memory, l’Institut Mines-Telecom et Mocaplab pendant deux ans, dans le cadre de travaux collaboratifs de recherche et développement visant l’amélioration de l’accessibilité des programmes TV : qualité du sous-titrage, intelligibilité sonore et interprétation en langue des signes.

Ce contenu a été publié dans Audio, Diffusion, IA. Vous pouvez le mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *