MPEG Surround

MPEG Surround

Résumé

La plupart des technologies de codage dédiées à l’audio multicanal utilisées aujourd’hui font appel à ce qu’on appelle un encodage discret des canaux audio, c’est à dire que chaque canal est encodé séparément dans un flux de données. C’est ce flux de données qui est transporté jusqu’au téléspectateur (en France en Dolby Digital Plus pour la diffusion TNT), un décodeur se chargeant à l’arrivée de restituer chacun des canaux indépendamment. Moyennant un débit d’encodage suffisant et les pertes dues à la compression de données mises à part, ce principe présente l’avantage de restituer assez fidèlement le signal d’origine, chaque canal étant encodé séparément, mais présente l’inconvénient d’un coût élevé en débit (256 kilobits par seconde en diffusion TNT en DD+ 5.1, généralement 384 kilobits par seconde sur un DVD).

Les technologies alternatives les plus courantes sont basées sur le matriçage, c’est à dire le mélange de l’ensemble des canaux selon des règles précises (rotation de phase et niveau) sur les deux canaux d’une stéréo. A l’arrivée le signal est dé-matricé suivant l’opération inverse pour recréer l’ensemble des canaux. La version la plus ancienne de cette technique est le Dolby Surround apparu au cinéma dans les années 70, dont les formats Dolby Pro Logic sont issus, et la plus récente est le système Neural de DTS. L’avantage est certain du point de vue du gain en débit, puisque concrètement on ne transporte qu’une stéréo, mais aussi du point de vue de la compatibilité avec tous les canaux de transport (les canaux stéréo peuvent être lus par n’importe quel récepteur à l’arrivée, les canaux supplémentaires ne sont reconstitués que si le décodeur contient un dématriçeur). En revanche, compte tenu de sa nature, et même si les derniers développements de DTS dans son procédé Neural ont apporté des progrès notables, ce principe reste limité dans sa fidélité de restitution du signal d’origine, notamment pour des signaux peu corrélés (sources localisées précisément sur des canaux différents).

Les évolutions technologiques permettent aujourd’hui d’envisager d’autres techniques de codage alternatives aux canaux discrets. Il est possible par exemple d’extraire du signal multicanal original des informations de spatialisation, qui seront codées sous forme de données peu volumineuses et transportées dans un flux annexe au flux stéréo principal. Ce principe a été développé conjointement par Coding Technologies et Fraunhofer suite à un appel à propositions du Moving Pictures Expert Group puis normalisé et publié en 2007 sous le nom de MPEG Surround.

MPEG Surround est également utilisé plus avant dans le standard MPEG SAOC, Spatial Audio Object Coding publié en 2010, et qui permet à l’auditeur de replacer un objet à sa guise dans l’espace sonore, ainsi que dans USAC, standard en cours de définition proposant un codage unifié pour la musique et la parole à bas débit. L’ensemble de ces technologies ouvre la voie à de nombreuses évolutions à venir pour le codage audio bas débit, qui sont suivies par innovations & développements.

Comme les codages matricés, MPEG Surround permet d’assurer la compatibilité avec l’ensemble des décodeurs, avantage de taille puisque cela permet d’éviter une double diffusion, le signal pouvant être décodé comme une simple stéréo par un récepteur standard, ou comme un signal multicanal par les décodeurs compatibles.

Il est en revanche beaucoup plus efficace en débit du fait de la technologie employée, ce qui permet d’envisager une diffusion multicanale là où les limitations en bande passante ne permettent pas l’option canaux discrets (TNT SD, services de streaming, de VOD etc.).

Enfin, ce format n’est pas limité en nombre de canaux d’entrée, et ouvre la voie à des possibilités de transport des formats audio du futur : 3D, 22.2… qui pourraient être transportés à travers un signal 5.1 associé à un flux de données spatiales.

Le format MPEG Surround nous apparaît prometteur, c’est pourquoi nous vous en proposons un tour d’horizon dans ce document.  Après une introduction sur les principes psycho-acoustiques utilisés, une présentation de la technologie puis de  quelques résultats subjectifs, nous nous attacherons à évaluer les possibilités actuelles d’intégration pratique dans la chaîne de diffusion, mais également les freins actuels au développement de cette technologie.

 

COMMENT L’OREILLE HUMAINE PERÇOIT L’ESPACE SONORE

Avant d’enter dans la description détaillée de MPEG Surround il apparaît nécessaire de préciser quelques notions sur la façon dont le cerveau humain analyse l’espace sonore à partir des signaux acoustiques qui proviennent à chacune de ses deux oreilles. En effet, pour être efficace, MPEG Surround utilise un certain nombre de clés psycho-acoustiques essentielles dans la localisation d’une source sonore par l’auditeur.

Tout d’abord, l’ILD, ou différence de niveau interaurale : une source sonore, si elle est plus proche de l’oreille gauche que de l’oreille droite, arrivera avec un niveau plus élevé à l’oreille gauche, et ce d’autant plus que la fréquence de cette source est élevée, car aux fréquences élevées va s’ajouter un phénomène d’ombre de la tête pour l’oreille située en position opposée à la source.

L’ITD, ou différence de temps interaurale est également essentielle : la même source sonore, proche de l’oreille gauche, arrivera plus tôt à l’oreille gauche qu’à l’oreille droite.

Ces différences de temps d’arrivée et de niveau entre les signaux arrivant à chacune des oreilles sont utilisées par le cerveau  pour localiser une source sonore dans le plan horizontal.

Une autre clé permettant au cerveau d’interpréter l’espace sonore est constituée par le degré de cohérence entre les signaux arrivant à chacune des oreilles. En effet, dans un environnement acoustique naturel, une source sonore va subir de nombreuses réflexions avant d’arriver à l’auditeur, chacun des deux signaux reçus par les oreilles ayant suivi un chemin différent, il aura des caractéristiques propres. En pratique, une diminution de la corrélation interaurale conduire à une perception d’élargissement de la source. Le degré de cohérence interaurale (IC) est donc un troisième paramètre de perception de l’espace.

Dernier élément: le pavillon de l’oreille, dont la forme essentiellement asymétrique va opérer un filtrage acoustique de la source dépendant de la provenance de celle-ci. Particulièrement efficace dans la zone de 6 à 10 kHz, ce filtrage va permettre à l’auditeur de différencier l’avant de l’arrière, ainsi que de localiser une source dans le plan vertical.

Si l’on parvient à analyser et quantifier de façon précise certaines de ces caractéristiques pour un signal multicanal  donné, on peut alors les transporter sous forme de données en parallèle de ce signal qu’on aura par ailleurs réduit à une plus simple expression (downmix stéréo). Il suffira à l’arrivée de les utiliser pour reconstituer un signal très proche du signal multicanal d’origine à partir du signal stéréo. Le codage sous forme de données de spatialisation est plus largement connu sous le nom de Spatial Audio Coding et également utilisé dans sa version stéréo paramétrique par HE-AAC v2.

C’est cette capacité à encoder non pas les formes d’onde des canaux latéraux et arrière, mais une description des caractéristiques spatiales des sources présentes dans le signal qui permet à MPEG Surround d’être très efficace en terme de débit.


DESCRIPTION DE MPEG SURROUND

Principe

MPEG Surround repose donc sur la décomposition du signal d’origine en deux signaux : un signal stéréo (ou mono[1]) d’une part, et un canal de données de spatialisation d’autre part.

 

Chaîne d’encodage/décodage MPEG Surround (source Fraunhofer)

Pour créer ce canal de données, l’encodeur MPEG Surround utilise un ensemble de procédés complexes qui combine des fonctions de filtrage, des blocs de downmix et d’analyse et des blocs de synthèse.

 

Composition d’un encodeur MPEG Surround (source JAES Vol.55 N°5, Mai 2007)

Les banques de filtre numériques décomposent chacun des canaux d’entrée en simulant la résolution spectrale et temporelle de l’oreille humaine, et en extraient un certain nombre de « bandes paramétriques » qui vont être exploitées par l’encodeur spatial. Le nombre de bandes paramétriques définit la finesse de restitution de l’ensemble, et la résolution temporelle utilisée correspond à la résolution de l’écoute binaurale, paramètre par paramètre. L’encodeur spatial, dans le cas d’un signal 5.1 downmixé vers une stéréo, est composé d’un premier étage de trois down mixer 2 vers 1 (L, Ls / R, Rs / C,LFE) puis d’un étage de downmix 3 vers 2. Chaque bloc réalise une analyse des signaux d’entrée filtrés et convertis dans le domaine fréquentiel, dont il extrait à la fois un ou deux canaux de downmix et un flux de données de spatialisation. Deux types de données de spatialisation sont extraites : la différence de niveau inter-canal (ILD) et la corrélation inter-canal (IC). A l’issue du codeur spatial, le downmix stéréo est reconverti dans le domaine temporel par une banque de filtres de synthèse, tandis que les informations paramétriques de spatialisation sont quantifiées en un seul flux de données après élimination des redondances.

Structure du codeur spatial pour un downmix 5.1 (source JAES Vol.55 N°5, Mai 2007)

En sortie d’un encodeur MPEG Surround, on obtient donc un signal stéréo qui peut être encodé avec n’importe quel codeur perceptuel, le codeur le plus souvent utilisé est MPEG AAC, mais on pourrait utiliser du MPEG1 Layer2 ou tout autre format ; ainsi qu’un flux de données de faible débit. Celui – ci peut être transporté dans les données auxiliaires du signal principal. De cette façon la réception est compatible avec un décodeur non-MPEG Surround, qui va se contenter de restituer la stéréo, tandis qu’un décodeur MPEG Surround reconstruira le signal 5.1 en reproduisant les opérations inverses à celle de l’encodage[2].

 

Débit et transport du canal de données

Le débit minimum pour transmettre les informations paramétriques de spatialisation est 4kbps, mais pour une bonne qualité de restitution la valeur nominale est généralement 32kbps[3].

 

Formats d’encodage et débit du signal audio

A la sortie de l’encodeur le signal stéréo peut donc être encodé sous différents formats : MPEG AAC, HE-AAC, MPEG Layer 2 etc. et à n’importe quel débit. Le plus efficace en terme de complexité d’encodage (et donc de charge processeur) est HE-AAC, car les deux encodeurs partagent la même banque de filtres. Les débits usuels vont de 32kbps à 96 kbps en HE-AAC, et de 128 à 192 kbps en AAC-LC. Les choix de débits dépendent évidemment des contraintes de bande passante relativement au niveau de qualité souhaitée.

Pour une diffusion de qualité on peut par exemple utiliser un encodage stéréo en HE-AAC à 96kbps associé à un canal de 32kbps, ce qui donnera un débit total de 128 kbps pour une diffusion sur Internet, en TNT HD ou un téléchargement VOD. On peut ainsi envisager le transport d’un signal multicanal de qualité satisfaisante dans un débit habituellement utilisé pour une stéréo. Si l’on compare aux 256 kbps utilisés pour un Dolby Digital Plus, le gain en débit par rapport à un codage discret de l’ensemble des canaux même en utilisant les techniques les plus avancées de codage perceptuel est donc très important.

 

Fonctionnalités additionnelles

La paramétrisation spatiale ouvre également la porte à d’autres fonctionnalités, il est ainsi possible de créer un downmix compatible avec les dé-matriceurs surround (Dolby ProLogic etc.), mais qui bénéficie des informations paramétriques dynamiques (à la place du matriçage statique des systèmes classiques). Toutefois l’efficacité de cette fonctionnalité, qui peut être utilisée aussi bien dès l’encodage que seulement au décodage n’a pas pu être testée.

Autre possibilité : celle de générer au décodage un signal binaural pour la virtualisation au casque. MPEG Surround contient en effet une fonction d’encodage binaural au niveau du décodeur. A partir des informations paramétriques contenues dans le flux de données auxiliaires, le décodeur peut construire ce signal binaural simulant l’écoute du signal multicanal sans passer par sa reconstruction en canaux discrets, ce qui consomme moins de ressources processeur[4].

 

Evolutivité

Le MPEG Surround n’est pas limité au transport d’un signal 5.1 sous forme d’une stéréo et d’un canal de donnée. Il supporte en fait jusqu’à 32 canaux d’entrée dans son plus haut niveau d’implémentation, pourquoi pas imaginer le transport d’un signal 3D 22.2  sous forme d’un downmix audio 5.1 et d’informations de spatialisation ? Fraunhofer travaille actuellement avec plusieurs labos de R&D sur ce type d’expérimentations et est ouvert à d’autres partenariats de recherche sur le codage du son 3D…


DÉMONSTRATION FRAUNHOFER – AVRIL 2011 A MISTRAL

Nous avons eu l’occasion d’écouter le résultat d’une chaîne d’encodage / décodage en MPEG Surround à partir d’une source 5.1 lors d’une journée de démonstration de Fraunhofer dans les locaux de France Télévisions Innovations, début avril.

Les sources utilisées étaient très variées, parmi lesquelles des fictions TV, des enregistrements musicaux de référence édités par l’AES, et une bande test contenant des signaux discrets localisés sur chacune des voies. Le signal était lu depuis un Pro Tools, encodé en HE-AAC MPEG Surround via le logiciel de démo « ShoutCaster » sur un PC externe, puis décodé à travers Winamp, et réenregistrée dans la station Pro Tools. Deux différents débits ont été testés, 128 kbps et 160 kbps. Il était ainsi possible de comparer en relecture le signal PCM multicanal original et le signal codé/décodé dans notre système d’écoute à deux débits différents.

Les résultats furent très surprenants, tant en terme de qualité audio globale que de restitution de la spatialisation. Les sources discrètes de la bande test étaient restituées très précisément sur chacun des hauts-parleurs, avec une légère diaphonie sur les canaux adjacents mais audible uniquement en activant les « solo ».

A 128kbps on obtient une qualité très satisfaisante, qui permet d’envisager l’utilisation d’un tel codage pour de la VOD ou autre service de streaming.

A 160kbps, les améliorations n’étaient pas nettement perceptibles dans les conditions de la démonstration. Par ailleurs à ces débits il est préférable d’envisager un encodage des canaux discrets en HE-AAC, qui commence à donner de bons résultats à partir de 128 kbps (voir paragraphes suivants).

Ces tests ont été réalisés de façon informelle lors d’une démonstration, et seront donc  complétés par des évaluations plus rigoureuses. Un certain nombre d’évaluations des performances de MPEG Surround ont été réalisées et publiées par ailleurs, en voici quelques résultats.

 

RESULTATS SUBJECTIFS

MPEG Surround versus stéréo matricée

Le Journal de l’AES a publié en mai 2007 des résultats obtenus par des équipes de Philips/Coding Technologies ayant contribué au développement du standard[5]. Ces tests avaient pour but de comparer les performances de MPEG Surround notamment avec le matriçage en Dolby Pro Logic 2.

Ces tests menés suivant la méthodologie ITU MUSHRA[6] en double aveugle ont montré que le résultat obtenu avec une stéréo AAC à 128 kbps accompagnée d’un flux de données MPEG Surround à 32kbps, était nettement meilleur qu’avec une stéréo AAC à 160 kbps matricée en Dolby Pro Logic 2 (note moyenne de 84/100 pour AAC/MPEGSurround et de 42/100 pour le DPL2).

Par ailleurs ces tests ont montré que les performances de cet encodage AAC + MPEG Surround dépendent de la complexité du signal, les signaux d’applaudissements étant les plus difficiles à coder parmi les extraits, mais pour les signaux les moins complexes les résultats obtenus étaient proches de la référence non compressée.

Il faut néanmoins pondérer les résultats de ces tests par leur ancienneté, les encodages matricés ayant fait quelques progrès depuis 2007 (ainsi que MPEG Surround), il serait intéressant de mener une nouvelle comparaison notamment avec DTS Neural.

 

MPEG Surround versus codages perceptuels discrets

L’UER a publié en septembre 2007 une étude comparative de différents codages destinés au multicanal[7]. Parmi les codages testés on trouvait : Dolby Digital Plus à différents débits, AAC et HE-AAC, MPEG1L2 associé à Dolby Pro Logic 2 et à MPEG Surround, HE-AAC associé à MPEG Surround, et Windows Media.

En moyenne sur l’ensemble des tests,

  • A 256kbps, Windows Media Audio 10 arrive devant Dolby Digital Plus avec une moyenne de 82/100 (échelle MUSHRA) contre 74/100, MPEG1 L2 matricé en Dolby Pro Logic 2 étant loin derrière avec 48/100.
  • A 224kbps MPEG1 L2 associé à MPEG Surround obtient casiment la même note moyenne que DD+ à 256kbps, et une note bien supérieure à DD+ à 224 kbps qui obtient une moyenne de 58/100.
  • MPEG Surround associé à HE-AAC à 96 kbps obtient une moyenne de 72/100, soit à peine moins que DD+ à 256 kbps (à noter néanmoins que c’est une note moyenne et que sur le cas le plus critique parmi les signaux de tests la qualité obtenue à ce débit est nettement plus basse que pour DD+ à 256kbps). Si l’on abaisse le débit de HE-AAC + MPS à 64 kbps, on diminue la qualité, mais en restant à une moyenne de 68/100, soit bien au-dessus des 58/100 de DD+ à 224 kbps (même remarque que précédemment).
  • Autre enseignement de ces tests même si cela sort du cadre de ce document, HE-AAC en canaux discrets obtient de meilleurs résultats à partir de 128kbps que Dolby Digital Plus à 256kbps.
  • Enfin, les encodeurs MPEG Surround utilisés dans les 2 phases des tests correspondaient à des implémentations différentes qui semblent conduire à des résultats différents (le MPEG Surround Encoder V1.0 de la phase 1 semblant obtenir de meilleures notes que l’encodeur DAB utilisé dans la phase 2), par ailleurs la version de DD+ a été modifiée entre les deux phases, il n’est donc malheureusement pas possible de croiser l’ensemble des résultats.

 

Courbe d’efficacité de MPEG Surround en fonction du débit.

Toujours en 2007, une étude publiée par l’AES[8] s’est portée sur la pertinence des différents encodages AAC, HE-AAC et MPEG1 L2 avec ou sans MPEG surround en fonction du débit. Le tableau suivant en résume les résultats :

 

Qualité en fonction du débit pour différentes configurations d’encodage (source AES Convention Paper 7219)

Principal enseignement concernant MPEG Surround : si l’écart de qualité obtenue entre HE-AAC + MPEG Surround et  HE-AAC en canaux discrets est nettement en faveur de MPEG Surround à 64 et 96 kbps, il se réduit nettement au-delà de 100kbps, la courbe s’inversant un peu avant 160kbps, débit auquel l’encodage en canaux discrets est plus pertinent.

 

Conclusions des résultats subjectifs

Si les résultats de ces tests doivent être pondérés d’une part par leur ancienneté, chacune des technologies ayant pu bénéficier d’évolutions, et d’autres part par les alea ne manquant pas d’arriver lors d’une campagne de test conséquente comme l’était celle de l’UER (entre le début et la fin des tests, des évolutions de software entraînent des écarts réduisant les possibilités de comparaison), on peut néanmoins en dégager la confirmation par des méthodes de tests standardisées de l’intérêt de l’encodage MPEG Surround à faible débit conjointement avec l’HE-AAC. Un débit d’environ 100kbps permet en effet d’obtenir une qualité presque équivalente à un encodage Dolby Digital Plus à 256kbps, et meilleure qu’un MPEG1 Layer 2 matricé Dolby à 192 kbps.

 

Intérêts de futurs tests.

Pour compléter ces différents résultats, il serait intéressant de mener des tests comparatifs incluant les dernières évolutions de codage matricé (DTS Neural), Dolby Digital Plus, et MPEG Surround associé à HE-AAC en versions 2011.


MPEG SURROUND EN PRATIQUE

Production

Le downmix stéréo issu du 5.1 est par défaut fabriqué automatiquement par l’encodeur MPEG Surround. Mais il est également possible d’injecter une stéréo produite séparément par le mixeur (mode « downmix artistique »). Dans ce cas, l’encodeur calcule et transmet sous forme de données les écarts entre le downmix automatique et le downmix externe, de façon à optimiser le décodage relativement au downmix réalisé par le mixeur. Cela requiert la parfaite synchronisation des signaux d’entrée, et le downmix externe doit contenir toutes les sources significatives contenues dans le 5.1 original.

Concrètement, ce downmix peut être fabriqué automatiquement par un autre process. Dans un contexte où l’on envisage comme unique signal utile sur le PAD la piste  5.1, le downmix « ITU » est réalisé juste avant la diffusion pour les vecteurs le nécessitant. Cette solution serait pertinente seulement dans le cas où le résultat obtenu  est plus qualitatif qu’avec le downmix réalisé par l’encodeur MPEG Surround.

Autre cas possible, mais tendant à disparaître des chaînes de diffusion actuelles : le downmix est maîtrisé par l’opérateur de mixage et transmis en parallèle du signal 5.1, les deux étant utilisés respectivement par les différents vecteurs de diffusion.

Pour ce cas de figure, un plug-in, « Fraunhofer Pro-codec » édité par Sonnox (Oxford Plug-ins), et compatible avec la majorité des stations de travail audio, permet l’encodage et le contrôle temps réel, simultanément dans plusieurs formats, dont MPEG Surround. L’opérateur peut ainsi délivrer à la diffusion un downmix stéréo et des données auxiliaires contrôlées par ses soins, transmises dans les données auxiliaires du signal audio, et qui alimenteront l’encodeur de sortie.

Nous n’avons pas pu entendre les résultats de ce mode « Artistic Donwmix » comparativement au mode automatique.

Diffusion

Compte tenu des débits auxquels MPEG Surround est pertinent, son adoption en diffusion terrestre présenterait peu d’intérêt, sauf à vouloir drastiquement réduire la place de l’audio dans les multiplexes, ou bien ouvrir les canaux SD à une diffusion compatible 5.1 tout en restant simple flux[9] ! Il est plus réaliste ( ?) d’envisager une évolution vers HE-AAC en canaux discrets qui détrônerait Dolby dans les futures normes de diffusion HD.

MPEG Surround prend tous son sens potentiellement dans les applications où une diffusion en canaux discrets n’est pas envisageable compte tenu du coût en débit : VOD, diffusion vers les mobiles etc. Sur ces vecteurs il serait alors possible de bénéficier d’un signal « 5.1 » pour un débit équivalent à celui d’une stéréo.


FREINS ACTUELS AU DÉVELOPPEMENT DE MPEG SURROUND

LIMITES

Le seul problème, mais de taille, c’est la très faible pénétration de MPEG Surround du côté des récepteurs grand public. Aujourd’hui, du côté des lecteurs logiciels, seul Winamp supporte MPEG Surround en lecture, ce n’est pas encore le cas des lecteurs Apple (ITunes, QuickTime) ni Windows (Windows Media Player, SilverLight), quant aux set top boxes, point de MPEG Surround. Est-ce que MPEG Surround va devenir une technologie efficace mais oubliée comme d’autres avant elle, ou va t’elle trouver sa place parmi les fortes présences de Dolby et DTS pour les marchés de la VOD et de la réception mobile ? Seul l’avenir, et peut-être notre intérêt, le dirons.

 

LICENCES

La technologie MPEG Surround a été développée par Fraunhofer IIS, et normalisée par le Moving Pictures Expert Group en 2007, sous le nom ISO/IEC 23003-1. Fraunhofer propose des implémentations optimisées de MPS pour l’électronique embarquée (Set Top Boxes, récepteurs portables etc.) ou pour les systèmes logiciels.

Ce codec implique donc des coûts de licences qui limitent son intégration dans les équipements grands publics, tant que l’usage n’en est pas répandu (mais c’est la question de la poule ou de l’œuf)…

Fraunhofer ne dispose pas d’exclusivité sur ce standard mais sont concrètement les seuls fournisseurs de logiciels MPEG Surround, ce qui est facilité par leur domination dans le domaine du codage HE-AAC.

Les coûts de licences sont gérés via la société ViaLicensing http://www.vialicensing.com/licensing/mpegsurround-overview.aspx.



[1] La norme permet pour les applications très bas débit l’usage d’un signal mono associé au canal de données, mais les performances sont évidemment moindres qu’avec un signal stéréo (voir AES Convention Paper 7667 « A study of MPEG Surround Configurations and its performance Evaluation »), nous ne considérerons donc pas ce cas de figure ici.

[2] En plus des données paramétriques et de leur marquage temporel, un certain nombre de données sont transportées, notamment les coefficients de gain appliqués à chaque étage afin de permettre une reconstruction fidèle du signal.

[3] Pour des applications où la transparence complète est souhaitée, le débit du canal de données peut monter jusqu’à 100 kb/s, atteignant ainsi les performances d’un codage discret, mais également son coût en bande passante, ce qui n’est donc pas pertinent pour nos applications. Dans ce cas de figure au lieu d’être détruit à l’encodage et synthétisé par calcul au décodage, le signal résiduel issu de chaque opération de downmix est compressé et transmis avec les informations paramétriques.

[4] Nous n’avons pas eu l’opportunité de réécouter ce signal binaural lors des derniers tests, mais les résultats entendus précédemment sur des applications pour mobile n’étaient pas très convaincants.

[5] Voir JAES Vol.55 N°5, Mai 2007

[6] MUSHRA est une méthode d’évaluation subjective qui signifie : « multiple stimuli avec référence cachée et ancre », elle est définie par la norme ITU 1534-1 et est bien adaptée pour la comparaison de codecs perceptuels, comprenant généralement des écarts de qualité significatifs.

[7] Voir le document UER TECH3324 « Evaluations of multichannel audio codecs ».

[8] Convention Paper 7219 : « A study of the MPEG Surround quality versus bit-rate curve »

[9] Bien que très hypothétique, ce cas de figure est techniquement possible, moyennant l’ajout d’un encodeur MPEG Surround à l’encodeur de diffusion, le format d’encodage et le débit, donc le coût de diffusion restant égaux par ailleurs, à une modification de la signalisation près pour que les décodeurs compatibles puissent décoder le signal 5.1.