NAB 2017 : UHD HDR

L’omniprésente thématique Ultra Haute Définition, dont l’impact est visible sur plus de la moitié des stands (caméras, moniteurs, éditeurs, optiques, lumières) insiste à présent lourdement sur la Haute Dynamique – High Dynamic Range – désormais mieux maîtrisée et associée sans tabou aux contenus en haute définition : après 3 années de bataille pour faire reconnaître la supériorité du HDR sur la 4K auprès des téléspectateurs, les industriels se rangent à l’évidence. A noter justement l’attribution du Technology Award 2017 aux Français de b<>com pour leurs travaux sur la conversion SDR-HDR. 1 an après l’obtention de cet « oscar » technologique par notre consortium 4EVER-2, l’Amérique renouvelle son soutien à la recherche française.

Côté diffusion, HEVC tremble, ses récurrentes problématiques de coût de licence ont découragé les grands opérateurs à l’heure d’ouvrir les canaux Ultra HD phase 2. Ils ont décidé de financer AV1, une alternative purement open-source.


Une projection 8K décevante au NHK Theater, il faut bien l’avouer, passé les formidables contenus de démonstration produits il y a quelques années, les récentes réalisations « en conditions réelles » (mondial de football, concerts, documentaires) laissent apparaître un niveau de bruit particulièrement élevé sur grand écran : la 8K se regarde sur des écrans de plus de 4 mètres de base.

La NHK se met doucement à la haute dynamique, pas encore prête sur les dalles 8K exposées, ainsi qu’au 120 images/seconde. Ces 2 caractéristiques historiques de la Super Hi-Vision sont en revanche prévues pleinement opérationnelles pour les JO de Tokyo.

A l’écart du NHK Theater, le département « mesure » de la NHK R&D présente le MTF, une nouvelle mesure sous la forme d’un indice de « définition » dont les applications promettent :

  • Pour la maintenance, à l’aide d’une simple mire bicolore filmée par l’ensemble optique/caméra, la mesure s’effectue directement sur le signal vidéo. L’indice MTF permet de juger la définition réelle de l’optique (avec une caméra de référence) ou d’un capteur (avec une optique de référence). Surtout, cette mesure en temps réel permet d’apprécier les différences de contraste au centre comme aux extrémités de l’image, et tient compte des conditions d’ouverture de l’iris : ceci permet également de jauger la définition d’un capteur soumis à différentes expositions.
  • Pour l’exploitation, cet indice a d’ailleurs été créé pour assister la mise au point dans le cadre d’une captation 8K tandis que le cadreur ne bénéficie que d’un monitoring HD.

Visite du car GearHouse basé à Los Angeles. Car vidéomobile full 4K HDR avec un accueil de 24 caméras. Les enregistrements se font sur des systèmes EVS compatibles 4K (aïe, un upgrade encore dispendieux) et éventuellement enregistrement du flux PGM sur disques SSD via un écran 19 pouces avec enregistreur intégré (Atomos / Sumo).


Depuis sa création en 1993, la société américaine nous a habitué à des produits de qualité : du player/recorder Ki Pro aux cartes d’acquisition KONA accompagnées de suites logicielles multi-plateformes, en passant par les convertisseurs de formats broadcast jusqu’aux cartes OEM pour développeurs, tout ceci dans une gamme tarifaire se situant entre les concurrents Blackmagic Design et BlueFish ou Matrox. Ce NAB est l’occasion pour eux de dévoiler des mises à jour de produits ainsi qu’un nouvel équipement focalisé sur la conversion SDR / HDR : le FS|HDR.

Ce rack 1U, bien que physiquement présent sur le stand, n’est encore qu’une “Tech’ Preview“, en attendant une sortie officielle cet été. Il propose une conversion HDR/WCG temps réel en embarquant le moteur de process vidéo de l’éditeur ColorFront. L’alliage avec la partie d’Up et Down-Conversion de leurs équipements existants leur permet de proposer un couteau suisse –conversion HDR vers HDR, HDR vers SDR, SDR vers HDR- tout en supportant en entrée/sortie les formats 4K/UHD et ou 2K/HD, le tout en YUV 4:2:2 10 bits. Du côté des espaces colorimétriques, les combinaisons EOTF/colorspace sont assez larges en entrée :

  • SDR BT.709 100 Nits ;
  • PQ BT.2020 1000 Nits ;
  • PQ P3D65 1000 Nits ;
  • Hybrid Log Gamma BT.2100 ;
  • Sony® S-Gamut3/SLog-3 ;
  • ARRI® Log C Wide Gamut ;
  • Panasonic V-Log ;
  • RED® Log3G10 Wide Gamut ;
  • Canon Log 2 ;

De quoi accepter les flux des caméras les plus utilisées, qu’elles soient broadcast (Sony, Panasonic) ou cinéma (ARRI, RED). En sortie, trois choix possibles : SDR BT.709 100 Nits, PQ BT.2020 1 000 Nits ou HLG BT.2100.

La démonstration fait mouche, reste à tester l’équipement sur d’autres contenus SDR…

La gamme Ki Pro® s’enrichit d’une version “Ultra Plus”. Il s’agit toujours d’un enregistreur portable/rackable (2U demi-largeur et poignée de transport intégrée) enregistrant au format Apple ProRes 422HQ multicanal, cette mouture pouvant monter jusqu’à 4 canaux d’enregistrement HD en simultané. En mode Single-Channel, l’équipement devient un player/recorder au format 4K/Ultra HD ou 2K/HD compatibles avec les codecs Apple ProRes® ou Avid DNxHD® enveloppés dans un format MXF. Notons aussi le support des dernières connectivités 3G-SDI, fibre ou HDMI 2.0, et des flux à cadence “élevée” (jusqu’à 4K 60p, pas de 100p hélas…).

Du côté des mini-convertisseurs qui ont largement contribué au succès de la marque, les entrées/sorties 12G arrivent, le module Hi5-4K-Plus reste le fer de lance de la gamme. Bien connu des équipes qui souhaitent caractériser le rendu HDR sur des téléviseurs grand publics compatibles, ce boîtier convertit un flux 4 x 3G HD-SDI en HDMI 2.0 tout en signalisant la courbe EOTF utilisée (PQ / HDR10, HLG ou mode custom).

Dans le monde IP, AJA commence à supporter la norme SMPTE 2110 avec sa carte KONA IP et la dernière version logicielle. Une licence JPEG 2000 optionnelle apparaît pour satisfaire des workflows VSF-TR01 JPEG 2000 over IP relativement populaires.


Après le consortium 4EVER en 2016, les français sont à nouveau au rendez-vous de l’innovation cette année dans le Future Park du Convention Center. Après moins de 5 ans d’existence, l’institut de recherche public/privé b<>com (230 chercheurs basés à Rennes, Lannion et Brest) obtient le Technology Innovation Award du NAB pour sa conversion SDR / HDR temps réel. Déjà présenté sur l’IBC 2016, le procédé met en œuvre un algorithme désormais mature, packagé cette fois dans un prototype de SFP Embrionix afin d’être utilisé très simplement dans un nodal, une régie finale, après une mise à l’épreuve dans les départements R&D des broadcasters.

Technologie de conversion SDR / HDR de b<>com, empaquetée dans un module SFP Embrionix. Une possible intégration par les industriels de la chaine audiovisuelle qui permet aux diffuseurs de se projeter dans un retraitement de leur live feed broadcast SDR…

Le module est équipé d’entrée/sortie 12 G HD-SDI mais ne retraite pour l’heure que des signaux full HD. Au delà de la conversion SDR vers HDR, le module assure le changement d’espace colorimétrique (mapping Rec.709 –> Rec.2020), en cohérence avec l’augmentation de la dynamique :

Sur les flux sélectionnés par b<>com et sans doute aidé par l’utilisation de moniteurs SONY BVM-X300, le résultat est plus que convaincant. Néanmoins, les problématiques qui entourent le sujet de la conversion HDR restent nombreuses : quid du color shift, quel impact après upconversion 4K, quel rendu final espérer sur une TV grand public après encodage ? Le mode “tout automatique” posera assurément à chaque broadcaster la question de l’interopérabilité pour tous les contenus sur tous les écrans.

Avec cette récompense, b<>com précise sa position avant-gardiste sur les innovations vidéo et conforte son positionnement basé sur une proposition de valeur concrète, leurs travaux de recherche en audio 3D, AR/VR et réseaux ultra haut débit plus agiles n’étant pas en reste.


L’approche de Technicolor sur le HDR est assez proche du Dolby Vision, un encodage de la couche SDR BT.709 avec  extraction de la partie haute dynamique codée sous la forme de métadonnées (dynamiques elles aussi). Bien qu’à ce jour, la technologie Advanced HDR pénètre moins le marché que son concurrent solidement ancré dans le monde du cinéma, les réflexions sur les questions d’économie de bande passante, d’adaptation aux capacités de chaque téléviseur et de retraitement de flux à dynamique standard sont particulièrement pertinentes, face à l’hétérogénéité des scénarios (mélange de contenus HD Rec.709 et UHD Rec.2020 par exemple). Avec un solide background en colorimétrie, la division vidéo de Technicolor basée à Rennes (ex Thomson) s’est alliée à Philips pour développer une méthode de traitement HDR temps réel basée sur la mise en œuvre des principes de préparation / alignement des sources vidéos broadcast et de déconstruction / encodage / reconstruction du signal HDR :

  • La version temps réel (CPU) de leur logiciel ITM (pour Intelligent Tone Mapping) est au cœur du procédé propriétaire de conversion SDR / HDR. L’ITM analyse image par image le flux HD ou 4K entrant, puis le prépare pour l’encodage en sortie : application d’une EOTF (PQ, S-Log3 ou Gamma 2.4) et d’un espace colorimétrique (Rec.709 ou 2020), gestion du pic de luminance maximum, paramètres d’étalonnage finement choisis… Plusieurs presets peuvent être travaillés offline puis chargés dans la station qui héberge le logiciel, un mode automatique existe également. Afin de l’utiliser au mieux, il convient de définir des courbes de retraitement qui fonctionnent sur la majorité des contenus d’un broadcaster particulier, tout en respectant l’intention artistique. En ce sens, les ingénieurs proposent d’ingérer une quantité de programmes de stock, puis de les passer à la moulinette du Machine Learning.

  • la solution PRIME, elle aussi brevetée, permet l’extraction de la partie HDR de chaque image analysée et son mapping en un flux de métadonnées dynamiques selon la norme SMPTE ST : 2094 – Dynamic Metadata for Color Volume Transforms (DMCVT). L’encodeur HEVC live “compatible” (ATEME ou Elemental à ce jour) n’a plus qu’à traiter la couche vidéo de base (SDR Rec.709) et à placer le contenu des métadonnées HDR dans les messages SEI du flux TS de sortie. Ces derniers, standardisés SMPTE ST : 2086 sont les mêmes qui servent à signaliser le type de HDR présent. L’économie en bande passante est évaluée à 20 %, comparée à la transmission d’un signal HEVC UHD complet.
  • côté réception, le prototype de Set Top Box Technicolor permet de reconstruire le flux HDR d’origine en cas de présence d’un téléviseur HDR “natif”, ou au contraire de ne diffuser que la couche SDR sur des modèles plus anciens. Cette technologie backward compatible opère un rescaling pour pallier aux écarts de reproduction de luminance en fonction des téléviseurs. Au delà de la box Technicolor, la technologie de reconstruction est implémentée dans des puces Broadcom, Mstar, Sigma… pour une future intégration par des équipementiers ou FAI. Cerise sur le gâteau, le Display Adaptation, rendu possible par une maîtrise de la chaîne complète par Technicolor, permet de régler le niveau de HDR en fonction des capacités réelles du téléviseur à le reproduire. Par exemple, la dernière SONY KD-65ZD9 monte à quelques 2 000 nits, tandis qu’une l’OLED65E7V LG tourne aux alentours de 650 nits seulement. De quoi limiter aussi la fatigue visuelle induite par la consommation soutenue de contenus HDR à forte luminance, ou au contraire de compenser un éclairage ambiant conséquent.

Comme chaque année sur le NAB, Technicolor n’a pas de stand officiel dans le Convention Center, mais propose des démonstrations dans une suite d’hôtel, sur invitation seulement. Sur cette édition, la solution end-to-end était décrite à travers la démonstration d’une opération réalisée sur un match des Lakers et impliquant le cablo-opérateur américain Spectrum SportsNet. Avant la fabrication du flux HEVC/TS destiné au grand public (en ATSC 3.0 l’équivalent américain de notre DVB-T2/S2), le signal de contribution entre le site de production et le broadcaster était encodé au format JPEG2000 à 200 Mbps.

La comparaison des rendus entre le HDR “traditionnel” et l’Advanced HDR faisaient la part belle à la solution Technicolor, une qualité supérieure largement impactée par les technologies ITM et PRIME et une réduction de la bande passante nécessaire à la transmission.

Au retour de Las Vegas, sur le site de Rennes, une première tentative de retraitement de contenus francetélévisions HD SDR fut testée. Les résultats semblent prometteurs, si tant est que l’automate de diffusion du groupe puisse un jour pousser des TOP à un ITM pour lui suggérer une bascule entre un mode automatique et l’usage d’un preset adapté à un programme en particulier :

La seconde prérogative se situe au niveau des récepteurs TNT ou Set Top Box qui devront obligatoirement embarquer des chipset compatibles pour bénéficier du rendu HDR et du réglage manuelle de la dynamique.


Sur le salon du NAB, Sony n’a certes pas son propre hall comme à l’IBC, mais l’espace réservé leur permet largement d’exposer l’ensemble des derniers produits. C’est la traditionnelle démo’ privée que nous retiendrons puisque le convertisseur HDRC-4000 y était dévoilé. Un équipement très attendu des cars régie pour s’affranchir d’une double production HDR / SDR, sans compromis sur la qualité de la dynamique standard qui reste la plus “vendue”.

Avec son firmware en version 1.0, cette unité permet d’entrer / sortir des flux 4K HDR SLog-3, PQ, HLG ou SDR dans un workflow de production “labellisé” SR Live ;

Une fonctionnalité supplémentaire, baptisée adaptation AIR (Artistic Intent Rendering) vise à convertir le master de production intermédiaire vers n’importe quel autre format de distribution avec une restitution fidèle à la perception de l’œil humain. Lorsque cette fonctionnalité est activée, le HDRC-4000 est censé conserver l’intention artistique du producteur sur le moniteur de référence du car régie. En pratique, les ingénieurs se sont concentrés sur le milieu de la fonction de transfert afin de relever légèrement les niveaux, de façon à évacuer les problématiques décelées dans la version bêta du produit présenté en 2016 (en mode Hybrid Log Gamma notamment). Des contrôles de gain séparés pour les niveaux de noir et de blanc permettent de maîtriser finement les versions HDR et SDR produites. Côté rendu, il s’agit d’une version qu’on saurait qualifier de “PQ amélioré”. Pour la production HDR, Sony recommande encore et toujours d’utiliser exclusivement la résolution 4K UHD avec EOTF S-Log3 et l’espace colorimétrique BT.2020, afin de capturer la plus grande dynamique possible (4 000 %). De fait, il s’agit également de la combinaison qu’ils maîtrisent le mieux, depuis leurs propres caméras jusqu’à leur moniteur de référence BVM-X300.

Côtés téléviseurs, Sony a bien compris que la seule définition 4K n’était pas satisfaisante, comparée aux dimensions HDR ou même HFR de l’UHD Phase 2, des écrans HD HDR sont présentés.

Au niveau des codecs, X-OCN (comprenez 16-bit Extended Tonal Range Original Camera Negative) fait son entrée. L’enjeu pour Sony consiste à proposer des workflows plus rapides et moins coûteux qu’avec le format RAW, tout en préservant la meilleure qualité d’image possible : impossible de distinguer une différence avec le RAW issu d’une F55. Très orienté haute dynamique, ce codec quantifie le signal sur 16 bits linéaires, bien au dessus du meilleur format de distribution HDR PQ / SMPTE ST-2084 (12 bits, 10 bits sont heureusement supportés). Sony recommande X-OCN pour les workflows de production file based “premium”. Lorsque la production exige une distribution HDR 10 bits en mode Hybrid Log Gamma, l’enregistrement en mode XAVC doit être préféré. Le HLG resterait donc moins maîtrisé par la firme ?

Comparaison de débit entre les codecs X-OCN, XAVC… et ProRes. Sony tente de démontrer les vertus de son nouveau format pour les workflows file based. À la clé, l’envie de détrôner Apple, particulièrement bien implanté sur ce créneau.

Point de vue caméra, Sony présente son nouveau modèle 4K HDR WCG, la HDC-4800. Elle héberge un nouveau grand capteur CMOS Super 35 mm capable de profiter pleinement des objectifs à monture PL, avec la prise en charge des objectifs B4 via un adaptateur optionnel pour la production HD. Il est doté d’un double filtre de correction des couleurs à densité neutre et peut être manœuvré à distance pour différents contrôles d’exposition. Pensé pour les événements sportifs, le dispositif propose des modes super slow motion 4K 8x et HD 16x.

Le complément idéal de cette nouvelle mouture est le BPU-4800, ce processeur combine un traitement bande de base et des fonctions de serveur UHFR en un seul boîtier compact rackable. Le système propose toujours le fameux mode “HD Cutout” permettant de zoomer dans l’image 4K sans bouger la caméra.

Avec le Content Management Station PWS-110CM1 et le serveur PWS 4500 en fin de chaîne, Sony propose un workflow de production live complet. Une mise à jour de firmware autorise l’adjonction d’un manager de métadonnées pour l’annotation, la recherche et le transfert de contenus. Les connexions au serveur s’effectuent par liaisons Ethernet 10 Gigabit.


Bien qu’en pointe sur l’encodage HEVC en Ultra HD phase 2 (4K, High Dynamic Range selon les technologies HLG, PQ et Dolby Vision), Ateme présente également sa solution de multiplexage statistique désormais mature et déployée notamment en Europe de l’est, ainsi qu’une des toutes premières implémentations d’encodage AV1, l’initiative open-source de l’Alliance for Open Media cofondée par Microsoft, Amazon, Cisco, Google, Intel, Mozilla et Netflix. Cette alliance vise l’existence d’une alternative gratuite au codec HEVC pour la distribution de contenus en Ultra Haute Définition. AV1 reste néanmoins un gigantesque « work in progress » dont le premier standard stable est prévu pour la fin d’année 2017. Google (YouTube) et Netflix visent son adoption dès que possible pour s’éviter de négocier l’usage d’HEVC avec ses détenteurs de brevets. Les objectifs d’AV1 sont identiques à ceux de HEVC : 50% d’économie de bande passante par rapport à H.264/MPEG-4 à qualité équivalente. Pour autant AV1 poursuit 2 objectifs complémentaires :

  • une sélection des différents « outils » de compression au regard d’un rapport efficacité/complexité favorable, pour conserver des implémentations efficaces,
  • une économie de débit visible dès les bas débits (basses résolutions pour le web) tandis qu’HEVC offre une vraie réduction de débit pour les hautes résolutions, notamment UHD.

Le marché broadcast américain et sa future migration vers le standard ATSC 3.0 d’ici 2 à 3 ans pousse Harmonic à démontrer son agilité pour révolutionner les infrastructures de diffusion. L’accent est mis sur le Cloud et la possibilité d’encoder, packager et distribuer des flux dans un environnement IP virtualisé.


Comme à l’accoutumée, la firme californienne propose des démonstrations impeccables de son High Dynamic Range / Wide Color Gamut “maison” avec une mise en condition digne des studios hollywoodiens : faible lumière ambiante, qualité de leurs moniteurs PULSAR surpassant n’importe quel téléviseur grand-public, oscilloscopes permettant de comparer les niveaux de chaque signal HDR / SDR en entrée/sortie du workflow.

La stratégie de Dolby reste basée sur une reproduction en salle de cinéma ou chez le téléspectateur au plus proche de l’intention artistique. À l’origine, le premier prototype de moniteur Dolby Vision était le résultat du démontage d’une dalle LED d’un écran LG couplé au plus gros projecteur NEC de l’époque. Résultat : jusqu’à 20 000 candelas par mètre carré était proposés, de quoi faire transpirer le public en diffusant des images de flammes, ou bien le rafraîchir nettement avec leurs célèbres extraits de glaciers. Depuis cette époque, les itérations entre les avancées technologiques et les études d’acceptabilité du “niveau” de HDR admissible ont aiguillé les équipes de recherche pour la mise au point du procédé définitif. Des spectateurs ont été invités à analyser les niveaux de noir, de blanc diffus et de surbrillance… Selon les résultats obtenus, 90 % du panel mobilisé a considéré qu’une plage dynamique de 0 à 10 000 nits était une condition nécessaire et suffisante, même dans une pièce fortement éclairée : la courbe PQ / SMPTE ST-2084 était née, l’apport substantiel du procédé propriétaire de Dolby résidant -entre autres- sur une quantification sur 12 bits au lieu des 10 utilisés par d’autres technologies HDR.

Au niveau production, les recommandations de Dolby poussent les étalonneurs à valider leur travail sur des moniteurs de référence compatibles Dolby Vision, pour assurer un mastering le plus élevé possible en luminance. La limitation de la dynamique des téléviseurs et l’hétérogénétité du parc UHD / HDR confortent Dolby dans l’utilisation de métadonnées dynamiques pour une restitution au plus proche des capacités d’affichage. La première étape est une passe d’analyse vidéo en temps réel qui pilote l’extraction de la partie HDR de chaque image. Les algorithmes sont enfermés dans un équipement hardware Dolby : le CMU Content Mapping Unit (un mode de traitement offline existe également). Côté transmission, le procédé Dolby Vision se satisfait des codecs HEVC ou même AVC. Dans la foulée du pré-traitement, le signal complet peut être encodé au choix dans un seul flux HEVC Main-10 ou en deux couches AVC ou HEVC 8 bits, accompagné des fameuses métadonnées. Le moteur de rendu utilise ensuite ces données pour reconstruire et jouer le signal complet, en utilisant un décodeur standard pour la couche HEVC Main-10, puis le module de post-processing Dolby Vision (HPU) pour la reproduction d’un signal pleine dynamique 12 bits.

Lors du rendez-vous sur le stand Dolby, le bagage technologique accumulé depuis des années par les ingénieurs entraîne des discussions d’experts autour du traitement de l’image, de la captation à l’étalonnage, en passant par un débat sur l’utilisation de courbes EOTF PQ ou HLG. Dolby restent assez persuadés que la proposition Hybrid Log Gamma de la BBC et la NHK -certes rétro-compatible- se fait au détriment du respect de la colorimétrie dans certaines conditions. Finalement, cette solution ne constituerait qu’une étape transitoire jusqu’à l’avènement d’une chaîne UHD end-to-end réaliste, plutôt basée sur la courbe PQ. L’argument est appuyé par la proposition Dolby Vision, ainsi qu’un procédé de conversion HDR PQ BT.2020 vers SDR Rec.709 sans paramétrage ni métadonnées, pour une cohabitation de flux vidéo variés et de formats hétérogènes (caméras, habillage, gestion des extérieurs…). Comme en 2016, la comparaison s’effectue à partir d’une source caméra, de plusieurs marques cette fois (Grass Valley, Canon, SONY). Elles sont installées sur les stands des constructeurs concernés, le workflow offre une comparaison entre 3 signaux :

  • la sortie UHD HDR d’une caméra, retraitée en Dolby Vision ;
  • la sortie SDR “hardware” proposée par cette même caméra ;
  • le flux UHD SDR Rec.709 provenant du convertisseur Dolby ;

Le rendu est annoncé supérieur à ce que propose la concurrence, leur moniteur de référence PULSAR aidant largement la manœuvre car il offre 4 000 cd/m2 de pic luminance, au prix d’un refroidissement des cartes de backlight par watercooling. Ce procédé propriétaire remplit correctement la fonction contre une latence induite d’une image seulement. La métrologie permet de valider les seuils de lumière et de couleurs pour les deux signaux, et de démontrer in fine les bienfaits du processeur Dolby comparé au flux SDR généré directement par les caméras.

 

Au niveau du grand public, quelques plates-formes, essentiellement américaines, proposent un début de catalogue SVOD 4K “Premium” / Dolby Vision, VUDU en tête (http://www.watchvudu.com/uhd/), des pourparlers sont en cours avec Netflix

Ce contenu a été publié dans Ultra-HD. Vous pouvez le mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *