IBC 2018 – audio

Next Generation Audio : derrière ce slogan marketing se cachent les solutions technologiques pour la production et la réception d’audio immersif et interactif, sur tous les écrans. Très active sur la question, l’Union Européenne de Radio-Télévision (EBU) a organisé un test grandeur nature cet été lors des championnats d’Europe d’athlétisme à Berlin avec le partenariat de plusieurs industriels. Plus tôt cette année, le codec MPEG-H a été déployé sur la TNT UHD Coréenne, tandis que Dolby testait sa solution concurrente AC4 Atmos pendant les jeux olympiques d’hiver. Après les logiciels de post-production, ce sont les consoles de mixage qui commencent à apprivoiser les objets. Enfin, à la croisée de l’audio sur IP et des micro-ondes, Alteros repense les liaisons sans fil.

Par Matthieu Parmentier – France Télévisions – innovations&développements

Cet IBC 2018, versant audio, a témoigné de l’effervescence ambiante grâce à la conjonction imminente de trois bascules technologiques. Les infrastructures classiques migrent de plus en plus facilement vers l’IP, les diffuseurs font face aux défis de l’hyper-distribution (comment faire « sonner » correctement un programme à la fois sur une TV et sur un smartphone) et la demande en contenus immersifs croît grâce à l’explosion de l’écoute au casque et l’arrivée sur le marché de barres de son 3D surprenantes et design. Une seule réponse technologique vise à relever tous ces défis : la production audio orienté objets. Mais pour paraître plus sexy, on parle plus volontiers de Next Generation Audio.

Si vous découvrez ou souhaitez approfondir ce concept, voici un lien vers le compte-rendu de la conférence co-organisée par France TV à l’EBU en mai 2017.

À la pointe de l’anticipation dans ce domaine, les États-Unis ont mis au point un nouveau standard de diffusion, l’ATSC 3.0, pour faire face aux nouveaux défis de la consommation grand public : éclatement de l’audience sur de multiples réseaux, déploiement de l’Ultra HD, combinaison des moyens de réception pour optimiser le rapport coût/qualité et… Next Generation Audio. Dolby apparaît évidemment en position de force sur ce futur marché. Les Jeux Olympiques d’hiver 2018, à Pyongcheang en Corée du Sud – autre pays à avoir choisi l’ATSC 3.0 pour ses chaînes Ultra HD toutes neuves, ont ainsi constitué un terrain de jeu favorable à de multiples expérimentations. Si les Coréens ont choisi le codec concurrent MPEG-H pour l’encodage de l’audio associé à l’Ultra HD, Dolby y a mené sa première expérimentation AC4 Atmos d’envergure, dans le cadre d’une dizaine d’épreuves olympiques spécifiquement produites en audio 3D.

Côté NBC, le principal diffuseur des JO – au point qu’un département entier de l’entreprise n’a que cette mission – il faut absolument relever l’impressionnant dispositif déployé, sans oublier les nombreuses innovations apportées à chaque édition. Parmi les plus impressionnantes, 5 micros spéciaux « coulés » dans l’épaisseur de la glace de la patinoire olympique, ont permis – en exclusivité pour les téléspectateurs des 33 chaînes de TV éditées par NBC – de suivre le bruit inimitable des patins glissant et freinant. Ces JO ont permis d’éprouver la capacité des ingénieurs du son de NBC d’appréhender la fabrication d’une ambiance immersive autant que l’auto-génération de différentes versions du même mixage à destination d’autres réseaux : en multicanal 5.1, en stéréo comme en binaural, en déclinant ces versions selon différentes langues de commentaire. C’est ici toute la force de l’audio orienté objets : produire un mixage unique associé aux métadonnées nécessaires à sa déclinaison en qualité optimale, sur tous les écrans.

L’Europe n’est pas en retard, l’édition 2017 Roland Garros avait déjà été produite en audio orienté objets et diffusée sur la Tour Eiffel et le satellite à l’aide du codec Dolby AC4 Atmos. Pour l’édition 2018, c’est le codec MPEG-H que France Télévisions a mis en oeuvre à l’occasion de la première production Ultra HD commerciale de l’événement.

Démonstration de contenus Next Generation Audio encodés en MPEG-H sur le portail OTT de VEWD et la barre de son Sennheiser Ambeo

Comment produire des contenus « Next Generation Audio » ? C’est ici que l’Union Européenne de Radio-Télévision (EBU) agit concrètement depuis près de 5 ans à l’initiative de ses principaux membres : BBC, France Télévisions, IRT (ARD, ZDF, ORF), NHK, Radio France et RAI, accompagnés de l’Institut de Recherche Technologique français b<>com et du laboratoire danois spécialisé dans les tests perceptifs Force Technology.

En 2016, l’ITU a standardisé le format ADM publié par l’EBU deux ans plus tôt pour permettre le stockage et l’échange de masters audio orienté objets. Ce format ouvert et gratuit est déjà supporté par plusieurs logiciels d’édition dont Avid Pro Tools, Magix Sequoia et Merging Pyramix.

En avril dernier l’EBU a publié en open-source un moteur de rendu audio orienté objets de référence, le bien nommé EAR (EBU ADM Renderer). Ce logiciel permet de jouer un contenu ADM et le « rendre » dans un format d’écoute donné qu’il suffit de spécifier : nombre de haut-parleurs et positions de ces haut-parleurs dans un espace 3D. Ce logiciel est à destination des professionnels – libre à n’importe quel fabricant de console ou d’éditeur de l’intégrer dans sa section de monitoring – pour permettre à l’ingénieur du son d’anticiper le rendu sonore de son programme dans différentes conditions d’écoute.

En appui de ces travaux de développement et d’évaluation des outils de production, l’EBU a organisé une grande opération de terrain à l’occasion des Championnats d’Europe d’Athlétisme 2018 de Berlin. En partenariat avec SSL, Qualcomm, Fraunhofer, Dolby, Klang, Schoeps, Areitec, b<>com et Ateme, quatre journées d’épreuve ont été mixées, encodées et distribuées en direct en audio orienté objets par quatre ingénieurs du son qui découvraient le matériel : Stephan Müller de la ZDF, Chris Roberts de la BBC, Anne-Dominique Termont et Jean-René Hwasik de France Télévisions.

Mise en place du Schoeps ORTF-3D au Stade Olympique de Berlin

La réalisation sonore, à partir de deux micros d’ambiance 3D (l’Eigenmike et le Schoeps ORTF-3D) et les micros individuels mis à disposition par l’organisateur des épreuves, a été produite simultanément au format ITU 4+7+0 (soit un son multicanal 7.0 surmonté d’un carré de 4 haut-parleurs supplémentaires placés en hauteur) et High Order Ambisonics d’ordre 3, afin de comparer les intérêts respectifs de ces deux formats 3D. 4 objets sonores ont été combinés à ce son d’ambiance 3D pour former le master : 1 commentaire en français, 1 autre en anglais, puis 2 commentaires d’audiodescription en français et en anglais. En matière d’interactivité, l’utilisateur final devait pouvoir choisir sa langue, ajuster le niveau des commentaires, ajouter et ajuster le commentaire d’audiodescription à la demande, mais surtout percevoir un ressenti le plus fidèle possible dans plusieurs configurations d’écoute grand public : sur haut-parleurs, sur barre de son ainsi qu’au casque.

La régie audio 3D expérimentale mise en oeuvre à Berlin

L’encodage Next Generation Audio de cette production a ensuite été confié simultanément aux 3 solutions industrielles disponibles (le format DTS-X n’est toujours pas prêt) : encodage 4+7+0 + 4 objets en AC4 Atmos (Dolby) et MPEG-H 3D audio (Fraunhofer) et encodage HOA + 4 objets en MPEG-H 3D audio (Qualcomm). Ce sont 3 encodeurs Ateme qui ont été mis à contribution pour associer ces flux audio aux flux vidéo, Ateme a en effet intégré l’encodage MPEG-H à l’occasion de Roland Garros 2018, et sait faire transiter l’AC4 Atmos (pass-through) depuis 2017.

Sur les stands des partenaires de cette opération, ces séquences d’athlétisme produites par ailleurs en Ultra HD à 100 images/seconde ont été mises à l’honneur, notamment sur l’immense écran Crystal LED du stand Sony. L’EBU leur a dédié une salle de démonstration équipée de 2 barres de son pour une expérience immersive à la hauteur. L’aventure continue pour l’audio orienté objets, avec 2 nouveaux standards soumis à l’ITU dès octobre par l’EBU : une version sérialisée du format de métadonnées open-source ADM (nommée sADM) pour permettre son usage en direct ainsi qu’un standard pour créer des profils ADM plus ou moins complexes, nécessaires à établir des relations d’interopérabilité stables entre les équipements de marques différentes. Ces 2 standards sont indispensables à l’établissement d’une chaîne de production complètement agnostique vis à vis de la solution d’encodage choisie.

Les standards sADM et ADM profile sont les derniers nécessaires à l’établissement d’une chaîne complète de production gratuite et agnostique.

Pour conclure ce tour d’horizon audio, il faut souligner la naissance d’Alteros (spin-off d’Audio-Technica) qui part à la conquête du marché des liaisons sans fil sur scène et plateau grâce à l’Ultra Wide Band. Cette technologie utilise le principe de très courtes impulsions émises sur une fréquence radio partagée dans le temps. En conséquence, la portée est limitée mais la captation des « paquets » peut être confiée à un réseau d’antennes peu coûteux. Alteros utilise l’UWB pour synchroniser jusqu’à 24 émetteurs HF en occupant 500 MHz dans le domaine des GHz sur une surface restreinte et à très faible puissance, par exemple un studio de tournage ou une scène de concert (les USA autorisent une telle excursion autour de la fréquence porteuse, mais pour l’instant l’Europe se limite à 250 MHz).

Le système GTX d’Alteros, jusqu’à 24 micros HF simultanés sans planification de fréquence.

Aucune planification de fréquence n’est donc nécessaire pour faire cohabiter ces 24 micros sans fil, ils émettent simplement des impulsions de 2,5 nano-secondes chacun leur tour, ce qui aurait aussi des vertus en matière d’autonomie des batteries, puisque l’émetteur ne fonctionne que 2% du temps. Tout autour de l’espace scénique ou du plateau de tournage, jusqu’à 32 « antennes » micro-ondes reliées au récepteur en RJ45 recueillent les impulsions. Multiplier les antennes permet de s’affranchir des perturbations, certains murmurent que le tracking des émetteurs dans un espace en 3 dimensions serait dès lors possible, après tout l’UWB est surtout utilisée aujourd’hui pour la géolocalisation de précision. En sortie de récepteur, les 24 signaux micros sont directement disponibles en numérique, par exemple en AES67 (audio sur IP).

Ce contenu a été publié dans audio. Vous pouvez le mettre en favoris avec ce permalien.

Une réponse à IBC 2018 – audio

  1. Deperthes dit :

    Merci Matthieu pour ce super compte-rendu !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *