Roland Garros 2015 : 3D VMS, un microphone virtuel à 360°

Vignette 3D vmsLe tournoi de Roland Garros a été l’occasion pour France Télévisions de tester un micro expérimental à 360° en collaboration avec la R&D de la RAI.

Le système 3D-VMS est une nouvelle approche de l’enregistrement audio multicanal, orienté vers la musique classique, les pièces de théâtre et opéras, sur la base d’un seul microphone composé de 32 capsules. Une unité de traitement peut synthétiser en temps réel jusqu’à 7 microphones virtuels dont la directivité et la direction peuvent êtres paramétrées en temps réel grâce à une interface visuelle, et également en post production.

Avec ce système, le processus de captation d’événements est sensiblement simplifié, car le nombre de microphones et les connexions nécessaires est considérablement réduit. Deux ou trois systèmes de 3D-VMS peuvent aisément remplacer tout un parc de microphones. Cela a déjà été utilisé avec succès dans plusieurs productions de musique classique.

Le système 3D-VMS

Le système 3D-VMS (Système Microphones virtuel 3D) est un système audio multicanal qui propose une approche différente de la captation sonore.

Grâce à un seul microphone muni de 32 capsules connecté via un câble unique à sa carte son située en régie son, jusqu’à 7 microphones virtuels peuvent être synthétisés en temps réel ou encore, en post-production.

Sur Roland Garros, ce système de Microphone a été installé à proximité du court Chatrier (Court Central) à 2 positions différentes, et relié via un câble RJ45 cat 6 directement à la carte son Emib située dans un car régie à une distance de 120 mètres.

Les caractéristiques de position et de directivité de chaque microphone virtuel peuvent être choisies par l’intermédiaire d’un logiciel.

Le système 3D-VMS a été conçu et développé par l’Université de Parme sur une idée initiale du Centre de recherche de la RAI.

Comment en est-on arrivé là ?

D’abord, il a été réalisé qu’il était possible de développer un système capable de mettre en œuvre un microphone capable de zoomer dynamiquement et en temps réel en utilisant une matrice de microphones dont les signaux sont multiplexés avec une matrice de filtres, afin d’obtenir des microphones virtuels, pour simplifier le placement des micros sur la scène ; d’autre part, des études à l’université de Parme ont montré qu’il est avantageux de calculer les coefficients de la matrice de filtres numériques sur la base des données mesurées, au lieu d’une formulation théorique telle que la théorie Ambisonics.

Une méthode a donc été imaginée à partir de calcul des filtres issus de mesures de réponse impulsionnelle réalisés en chambre anéchoïques, en utilisant la formule de Kirkeby. Le principal avantage de cette approche est que l’utilisation des données de mesure permet une compensation automatique des anomalies géométriques ou électriques, des petites déviations provoquées par des transducteurs et des réflexions ou diffractions dues au corps de l’ensemble du microphone.

  • La première version de ce système est basée sur un microphone sphérique, où 32 capsules Sennheiser à électret d’un demi pouce ont été régulièrement disposées sur la surface d’une sphère de 80 mm de diamètre. Cette configuration permet une analyse égale de la pression acoustique autour de la sphère. La sortie de chacun des signaux issus des 32 capsules est enregistrée numériquement et filtrée par un processeur de signaux à travers une matrice de filtres numériques dont les coefficients sont calculés à partir des mesures effectuées dans la chambre anéchoïque sur une matrice comprenant 362 positions différentes sur une demie sphère. Grâce à la matrice de filtrage, les microphones virtuels peuvent être pointés dans l’ensemble du champ sonore (360 ° x 180 °) et calculés. Alors que le système actuel est capable de synthétiser en temps réel jusqu’à 7 microphones, en post-production le nombre de ceux-ci peut être pratiquement illimité car il suffit de « rejouer » la scène pour en ré-extraire 7 micros à chaque fois. Il est également possible de changer le « zoom », défini par les caractéristiques de directivité, ou plutôt diagramme polaire, d’omni-directionnel à l’ultra-directionnel (Ambisonics d’ordre 6, cardioïde). Avec le système sphérique, des microphones virtuels peuvent être synthétisés à l’arrière de la scène pour obtenir un son surround, les sources sonores situées au-dessus ou en dessous de la scène sonore captée par le microphone peuvent également être capturées.
  • La seconde configuration de microphone développée s’est faite sur un axe plan, les 32 capsules sont placées sur un panneau 50 x 30 cm, selon un modèle semblable à une spirale. Cette disposition a été choisie après une étude par simulation logicielle des différentes manières d’optimiser l’échantillonnage spatial, tout en minimisant l’interférence entre les capsules. Dans ce cas, les microphones virtuels peuvent être utilisés pour extraire les différentes parties de l’avant-scène, la configuration typique de mixage multipiste, comme si de vrais micros avaient été placés à différents endroits de la scène. Le principal avantage de cette configuration est que la capacité de zoom du microphone est plus importante par rapport au système sphérique. Il est alors possible d’obtenir des microphones cardioïdes à l’ordre 16. Ce système comprend une caméra au centre du système, ce qui permet à l’utilisateur de positionner les microphones virtuels sur la scène en utilisant une interface graphique intuitive de commande, où chaque microphone est représenté par un cercle dont la dimension est proportionnelle au champ capturé.
  • Le modèle le plus récent est conçu sur un système cylindrique, les capsules sont montées sur un cylindre de 34 cm x 11 cm . Un rapport entre les axes de 1:3 a été choisi pour obtenir un plus grand détail dans le plan horizontal (ordre 10) par rapport au plan vertical (ordre 3), en fournissant une plus grande précision des sources sonores situées sur un plan horizontal, souvent proches les unes des autres (par exemple, musiciens de l’orchestre). Comme le système plan, il comporte une caméra. Celle ci pointe vers un miroir hyperbolique de manière à fournir une image 360°, et permet de placer correctement les microphones virtuels dans une scène étendue à 360 ° par 120 °.
  • Actuellement, une deuxième génération du système cylindrique plus petite (80 x 270 mm) ne comporte pas de caméra intégrée, on peut cependant la rajouter si nécessaire.

3D VMS1 3D VMS2

C’est ce système là qui a été mis en œuvre à Roland Garros. Placé tout d’abord dans la position face à l’arbitre (position A), et enregistré via sa carte son reliée à un Mac situé dans la fosse photographe.

RAI experience

RAI mac

Ont été enregistrés les sons provenant des 32 Capsules tels quels sur le Mac Book pro ainsi que la synthèse des 7 microphones en sortie de carte son et transmis au car de Lille via le stage box relié au car par une fibre, puis transmis par le car de Lille au car de Toulouse via le couplage car.

RAI exp 2Le 6 Juin, ce microphone a été utilisé positionné à l’arrière du court Philippe Chatrier, relié directement à la carte son et au Mac situés à 120 m de là dans le car de Lille. Le car de Toulouse, grâce à un deuxième ordinateur a ainsi pu piloter en direct les placements des 7 micros virtuels, lancer l’enregistrement et visualiser le court en direct. Les sons eux provenaient toujours du car de Lille via un couplage car différent du précédent.

Micro muni de sa bonnette anti-vent à l'arrière du court Chatrier

Micro muni de sa bonnette anti-vent à l’arrière du court Chatrier

Chemin de câbles allant du court Chatrier à la zone Technique

Chemin de câbles allant du court Chatrier à la zone Technique

Les sons issus de ces 7 microphones virtuels, ont été mixés aux autres sons pour fabriquer le signal binaural qui a été diffusé sur la réalisation en 4K.

RAI mixage

 

Bientôt :

Actuellement, il y a 2 nouveaux modules logiciels en cours de développement pour augmenter la facilité d’utilisation du système :

Le premier, le module de suivi, est orienté vers le suivi automatique des acteurs et des chanteurs sur la scène, par l’intermédiaire d’un moteur de reconnaissance du visage qui détecte et suit les visages humains captés par la caméra.

Les coordonnées spatiales extraites sont ensuite utilisées pour piloter la position d’un microphone virtuel.

Le second, le module de mise au point, vise à optimiser la vue de la couverture spatiale du son en additionnant 2 axes : la vue du dessus et une vue de côté à la vue de face déjà présente.

Annexe :

Deux configurations alternatives avaient été prévues pour répondre à la contrainte de distance qui existait entre le micro et la carte son ainsi qu’aux contraintes liées à Ethernet.

En effet il est difficile d’évaluer les distances précises entre deux éléments tant les chemins de câblage peuvent engendrer des détours, on ne connait la distance réelle qu’au moment où les éléments sont posés.

Première contrainte :  la distance entre le micro et la carte son qui ne devait pas dépasser 120m. Pour réduire cette distance au strict minimum, il a été envisagé de placer la carte son dans la fosse photographes, au plus proche du micro. La carte son étant connectée en FireWire au Mac de la RAI, cela nous contraignait à placer ce Mac fonctionnant en permanence dans la fosse photographe, en compagnie de la carte son. Ce Mac était raccordé au réseau et une machine déportée le contrôlait à distance au travers du réseau IP.

Deuxième contrainte : la distance maximale supportée par le réseau Gigabit Ethernet. Afin de pallier à l’éventualité d’une distance trop grande, une fibre MX-MX a été posée en plus des câbles Ethernet Cuivre 4 paires catégorie 5e, les jarretières et transceivers Fibre/Cuivre ont aussi été prévus, “au cas où”.

RAI annexe

Ce contenu a été publié dans audio, son 3D. Vous pouvez le mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *