NAB 2017 : Audio

2017 est l’année des premiers déploiements commerciaux en diffusion pour les codecs MPEG-H 3D et AC4 Atmos. La grande évolution consiste à déléguer une part du process audio au récepteur de l’utilisateur par l’envoi d’éléments sonores séparés : les objets. Cette fonctionnalité de process local s’appelle un moteur de rendu, le moteur de rendu est associé au décodeur et fait donc l’objet d’un « package technologique ».

Par Matthieu Parmentier – France Télévisions – innovations&développements

Dolby, Fraunhofer et Qualcomm mettent justement l’accent sur les fonctionnalités de leurs packages Audio Orienté Objets qui font la différence avec les techniques actuelles :

Une incomparable faculté d’adaptation :

  • Au nombre de haut-parleurs et à leurs positions, audio 3D en prime
  • À l’écoute au casque (son binaural)
  • À l’écoute en milieu bruyant

Quelques fonctions d’interactivité bien utiles :

  • Hausse du rapport dialogues/ambiance à la demande
  • Ajout/suppression de commentaire d’audiodescription
  • Rotation des scènes sonores en réalité virtuelle

Une rationalisation importante des débits :

  • 32 kbps pour une voix mono
  • 128 kbps pour du 5.1
  • 192 kbps pour du son 3D, des dialogues séparés et un commentaire d’audiodescription

2017 est également l’année des premières barres de son résolument spectaculaires, qu’il s’agisse des technologies Dolby Atmos ou MPEG-H 3D. La formidable énergie dont les haut-parleurs de dernière génération sont dotés – malgré leur taille modeste – associée aux process d’élargissement, d’enveloppement et de stabilisation de l’image sonore, permettent d’envisager des restitutions 3D surprenantes dans une pièce d’habitation classique, à encombrement réduit.

DOLBYMPEG HQualcomm,  b<>comAVIDMergingFairlight



L’américain Dolby propose le package AC4 Atmos, aux débits nettement inférieurs à son codec actuel E-AC3 et moyennant l’ajout d’objets sonores capables d’évoluer dans les 3 dimensions.
A l’instar des nombreux modes d’écoute contrôlés par l’ingénieur du son, l’écoute binaurale au casque des flux AC4 Atmos offre un véritable rendu 3D virtuel, sans possibilité de personnalisation pour l’instant.
Du côté des équipements de production, le processeur de monitoring DP590 et les encodeur DP591/décodeur DP592 abandonnent la connectique AES de leurs prédécesseurs au profit du MADI (DP590) et du 3G-SDI (DP591/592) pour mieux répondre à l’inflation du nombre de canaux à traiter. Dolby poursuit les consultations auprès de ses primo-utilisateurs pour faire évoluer l’interface de ses outils de création des mixages Atmos. Les contraintes s’avèrent nombreuses devant le nombre de possibilités offertes. On retiendra les 2 grands principes que Dolby met en œuvre sur la totalité de sa chaîne de production AC4 Atmos :

  • Les présentations : une présentation correspond à un « preset » activé par l’utilisateur final, tel que « version française » ou « version originale ». Grâce aux objets on peut créer plusieurs présentations alternatives telles qu’une version dont le niveau des dialogues est renforcé, ou encore une retransmission sportive sans commentaire journalistique. La multiplication des présentations d’un même programme n’a théoriquement pas d’impact sur le débit du flux AC4 Atmos, tant qu’elles partagent les mêmes sources.
  • Les exceptions de rendu : l’ingénieur du son peut choisir d’exclure certaines sources dans le cas d’une écoute utilisateur particulière. Par exemple, les sources sonores en élévation utilisées pour le rendu de la 3ème dimension à destination des barres de son 3D Atmos ou de l’écoute binaurale au casque peuvent être supprimées d’un rendu 5.1 ou stéréo.


Dopé par le lancement des chaînes Ultra HD coréennes qui ont choisi cette technologie d’encodage audio orienté objets, le consortium MPEG-H 3D présente sur le stand de Fraunhofer IIS plusieurs solutions pour le direct et la post-production.

A l’instar du Dolby AC4 Atmos, MPEG-H 3D distingue également les notions de programme (= présentations) et les exceptions de rendu.

Après le prototype de processeur Jünger à l’interface beaucoup trop chargée, destiné à simuler le rendu téléspectateur depuis la régie de production, c’est l’américain Linear Acoustic qui lance son AMS (Authoring and Monitoring System), un outil à l’ergonomie beaucoup plus aboutie qui n’est pas sans rappeler le DP590 de Dolby. Au menu, un processeur capable de créer les métadonnées MPEG-H 3D et les associer à 15 canaux audio. L’occupation de ces 15 canaux permet d’envisager une ambiance 9.1, des objets « dialogues stéréo » dans 2 langues différentes ainsi qu’un objet « commentaire d’audiodescription ».

Contrairement à Dolby, MPEG-H ne commercialise pas directement d’encodeur hardware mais noue des accords d’intégration avec les fabricants d’encodeurs vidéo.

Autre partenariat technologique, l’allemand New Audio Technologies a fait évoluer son plugin de panning 3D « Spatial Audio Designer » compatible Pro Tools, Pyramix, Nuendo… Désormais ce plugin permet de signaler l’usage d’objets et génère le flux complet de métadonnées MPEG-H destiné à l’encodeur.



L’américain Qualcomm est l’autre membre moteur de MPEG-H, mais contrairement à Fraunhofer IIS centré sur le rendu multicanal + objets, Qualcomm se concentre sur le rendu de scènes sonores matricées en High Order Ambisonics (HOA).

Avec l’avènement des contenus en VR, de même que l’adoption du HOA par YouTube et Facebook pour le transport d’audio multicanal, cette technologie déjà ancienne vit une seconde jeunesse grâce à ses équations efficaces de rotation et de zoom dans la scène sonore, deux besoins essentiels en Réalité Virtuelle.

Réaliser un master en HOA n’est pas encore trivial, et Qualcomm propose naturellement des plugins pour créer et rendre ce type de contenus sur des stations de travail. L’accent est mis sur la capacité d’approvisionnement de tous les dispositifs, depuis le home-cinéma 5 .1, la barre de son 3D, le rendu binaural au casque et jusqu’au dispositif de réalité virtuelle à partir du même master HOA. Pour l’instant les plugins de rendu binaural ne sont malheureusement pas « personnalisables ».



L’Institut de Recherche Technologique breton, par ailleurs brillant lauréat du NAB Technology Award 2017 pour sa conversion vidéo SDR/HDR, ne démérite pas non plus du côté de la R&D audio. A l’instar de Qualcomm, une volée de plugins de traitement b<>com permet de créer des masters HOA et contrôler leur rendu sur haut-parleurs et au casque. Avantage décisif côté b<>com, le process binaural peut être personnalisé au format AES-69/SOFA et permettre à l’ingénieur du son d’utiliser ses propres paramètres de binauralisation, de même que contrôler le rendu binaural proposé par YouTube.



Une fois n’est pas coutume, Pro Tools s’offre un greffon utile pour prendre le train de l’immersion et du mixage orienté objets. Preuve de la prudence légendaire de l’éditeur face à l’innovation, toutes les contraintes du logiciel actuel sont conservées, mais l’intégration profonde des plugins Dolby Atmos permet d’opter pour un panner 3D ainsi que la gestion des objets et des modes de rendu prévus par Dolby. Il faudra donc patienter quelque temps encore pour l’arrivée des modes « rendu binaural » et « réalité augmentée », que Dolby s’apprête à sortir.
Néanmoins, cet effort d’intégration doit être salué, il permet enfin d’utiliser Pro Tools facilement pour du rendu audio 3D… en attendant qu’une gestion des différents formats de mastering audio orienté objets soit associée (tel que l’ADM, proposé par l’Union Européenne de Radio-Télévision).

Côté interfaces de mixage et de transport, il faut saluer l’évolution des S3 et S6, issues du rachat déjà ancien du fabricant de consoles Euphonix. La S3 s’annonce sans compromis sur la qualité des faders et la rapidité du protocole de commande, en revanche c’est un iPad qui sert d’interface visuelle lorsque la S6 – 5 fois plus chère – bénéficie d’un écran vertical intégré.



Le principal souci de Merging, cette année, consiste à trouver une remplaçante performante à l’interface Tango dont la commercialisation s’est arrêtée. Du fait des collaborations historiques entre l’éditeur suisse et Euphonix, Merging conseille étonnamment d’associer son logiciel de mixage Pyramix aux interfaces S3 et S6 de son concurrent AVID.

Côté IP, Merging présente un nouveau logiciel de gestion des périphériques audio présents sur le réseau, permettant la découverte, la visualisation et l’assignation des ressources entre les équipements. Ce « patch » virtuel répond au besoin grandissant de connecter des périphériques très divers (Mac, PC, machines dédiées) qui n’ont que le standard AES 67 – audio over IP en commun. Ce logiciel tourne sur un Windows connecté au réseau.



Lors du salon IBC, en septembre 2016, l’ogre Blackmagic Design avait fait sensation en s’offrant Fairlight, son compatriote australien. Blackmagic est réputé pour s’enrichir par la vente de matériel low-cost associé à des logiciels de haute qualité à prix cassé. Son logiciel-phare, DaVinci Resolve, l’une des références mondiales pour l’étalonnage des programmes, comptait déjà un éditeur audio-vidéo assez complet depuis 2 ans. Au NAB, Resolve passe en version 14 (la version 13 n’existera jamais, l’Australien serait-il superstitieux ?) et accueille désormais un onglet dédié au mixage qui intègre l’interface de Fairlight.

L’argument est massif : Fairlight conserve sa gamme de produits hardware associé au logiciel, mais pour le prix de Resolve (0€), Fairlight est désormais à la disposition de tous.

Ce contenu a été publié dans audio, binaural, codecs, Normes, son 3D. Vous pouvez le mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *