De la salle de cinéma au portable, la diffusion du son : Nouvel enjeu ?
OUVERTURE DU COLLOQUE
Jacky Evrard – Directeur du Ciné 104 à Pantin : Bonjour. Je suis très heureux de vous accueillir pour la quatrième fois consécutive au Ciné 104, et pour ces 9ème Rencontres Art et technique du Festival l’Industrie du Rêve, « Quel son pour le cinéma d’aujourd’hui ? ». C’est une manifestation que je connais bien, je le dis chaque année, puisque j’accompagnais déjà l’équipe voici neuf ans, lors du lancement de cette manifestation, à Épinay. C’est un plaisir de vous retrouver ici tous les ans, et je passe la parole à Anne Bourgeois, qui est la directrice artistique de cette manifestation.
Anne Bourgeois – Directrice artistique du Festival l’Industrie du Rêve : Merci Jacky de nous accueillir depuis quatre ans avec autant de chaleur et de fidélité. Merci à vous tous, aux intervenants — dont certains sont venus de loin, d’Angoulême même — merci au public toujours fidèle du Festival. Pour cette neuvième édition, nous avons voulu parler de la bande son. Je crois que c’est le premier colloque du genre uniquement consacré au son dans sa globalité. J’espère que vous apprécierez les interventions, j’en suis même sûre !
Je voudrais remercier nos partenaires, qui nous soutiennent depuis longtemps : le Conseil Régional d’Ile-de-France, le Conseil Général de Seine-Saint-Denis, partenaire fidèle depuis 2000 — le département est un bassin des industries techniques du cinéma ; les Conseils Généraux du Val de Marne et de l’Essonne, et, évidemment, le CNC, sans lequel ce Festival n’existerait pas, puisqu’il en est le parrain depuis le début.
Je voudrais remercier aussi les industries techniques qui nous soutiennent : Eclair et Télétota, représentés par Christophe Massie, ainsi que la société Piste Rouge cette année, représentée par Bruno Seznec, et toutes les industries qui nous amènent, comme TSF, des aides en nature afin que le Festival continue.
Je passe la parole à Brigitte Aknin avec laquelle nous avons conçu le colloque, et qui va vous en dire plus sur le programme de ce matin et de cet après-midi.
Brigitte Aknin — Chargée de mission colloque : Bonjour à tous. Je tiens à souligner que, dans cette conception, nos partenaires, Télétota, Piste Rouge et les intervenants, nous ont beaucoup aidés.
La différence par rapport aux colloques précédents, c’est que les interventions sont concentrées sur une même journée. En quelque sorte, c’est un fil rouge que nous allons dérouler, toute la journée.
Je vous présente, et je vous demande d’applaudir très fort notre grand témoin, Monsieur Georges Prat, qui participera au colloque toute la journée. Nous le retrouverons en début d’après-midi, quand nous reprendrons la séance. Il fera la liaison entre les deux tables rondes, nous donnera ses impressions, son avis éclairé sur ce qu’il aura entendu le matin.
La troisième table ronde, cet après-midi, est organisée autour de deux réalisateurs. Cédric Klapisch et Philippe Grandrieux seront là, avec leur équipe — mixeur, ingénieur du son, monteur son — pour des échanges concrets sur la bande son.
Le principe de ces Rencontres, c’est de vous laisser un temps de parole. A l’issue de chaque table ronde, vous aurez une trentaine de minutes pour poser les questions de votre choix à nos intervenants. N’hésitez pas, le micro circulera !
Je vais enfin vous présenter notre Maître des cérémonies, qui va dérouler toute la journée ce fil rouge. C’est Monsieur Franck Ernould, journaliste spécialisé. Avec Franck, nous avons convenu qu’il y avait tellement à dire sur le son, que nous avons fait le choix de ne pas faire de table ronde en ouverture du colloque, sur l’état des lieux : c’est lui qui nous le dresse, en s’appuyant sur son expérience et les différentes enquêtes qu’il a pu faire sur le sujet. Nous entrerons immédiatement après dans le vif du sujet, dans les problématiques du programme.
Je nous souhaite une bonne journée ! Maintenant nous sommes tous dans le même bateau !
Franck Ernould
– modérateur : Merci Brigitte.
Table ronde n°1
DE LA SALLE DE CINEMA AU PORTABLE, LA DIFFUSION DU SON : NOUVEL ENJEU ?
INTERVENANTS : Alain Besse, Responsable du secteur diffusion de la Commission Supérieure Technique de l’image et du son (CST) Christophe Jankovic, Producteur de Prima Linéa Jean-Paul Loublier, Directeur de Dovidis et Mixeur Alexandre Mahout, Directeur des productions musicales de Europacort Christophe Massie, Directeur général adjoint de Télétota Dominique Schmit, Consultant des laboratoires Dolby Bruno Seznec, Directeur de Piste Rouge Eric Tisserand, Ingénieur du son et Mixeur.
Franck Ernould : Bonjour, et bienvenue aux Rencontres Art et Technique du 9e colloque du Festival l’Industrie du Rêve « Quel son pour le cinéma d’aujourd’hui ? »
J’ai moi-même été ingénieur du son, essentiellement à l’image, pendant une quinzaine d’années. J’écris maintenant sur le son dans différents magazines professionnels français et anglo-saxons. J’ai du coup acquis un certain recul et une double, voire une triple vision sur certains aspects du métier et du son.
Quelle que soit la manière dont on envisage la situation, il m’apparaît de plus en plus qu’en France, on est culturellement beaucoup plus axé « image » que son. Nous avons eu beaucoup de peintres majeurs, mais peu de grands compositeurs. Charles Cros a inventé l’enregistrement phonographique avec des rouleaux, mais c’est Edison qui en a imposé sa version dans le monde entier, avec le gramophone et ses disques plats. Le cinéma a été inventé en France, mais le cinéma sonore est venu des Etats-Unis. La radio, le téléphone sont nés outre-Atlantique. Pierre Schaeffer a inventé la musique concrète, mais c’est l’électro-acoustique, dans tous les pays, qui s’est imposée ensuite sur ses traces.
On peut aussi citer l’exemple du SECAM : un format de télévision d’une excellente qualité d’image, mais possédant un son médiocre, mono en modulation d’amplitude, comme les grandes ondes — là où nos voisins allemands ou anglais utilisaient le format PAL, d’image à peine moins belle, mais d’un son FM de bien meilleure qualité et permettant la stéréo. Il faudra attendre 1994, pour voir apparaître la stéréo à la télé chez nous, avec le NICAM. Bref, à la télévision, le signal audio n’était pas bien servi, ce qui a dû se répercuter sur les conditions de production des bandes son de l’époque.
En France, on constate une dominante du regard sur l’écoute. Mes enfants, au collège ou à l’école, reçoivent un enseignement musical insuffisant et ne sont pas du tout incités à pratiquer la musique, alors que dans de nombreux pays européens, chaque école, chaque lycée, possède son auditorium, sa chorale, son orchestre. Une sensibilisation précoce qui conditionne par la suite les relations à l’univers sonore.
Mais ne soyons pas trop pessimistes : le talent de nos ingénieurs du son « direct » au cinéma est reconnu dans le monde entier. Nous avons gardé quelques noms célèbres dans le domaine des enceintes acoustiques, de la sonorisation, de la hi-fi audiophile ou des consoles numériques. Nous avons des luthiers célèbres, tout n’est pas perdu !
Au cinéma, il y a toujours de l’argent pour l’image. Sur le plateau, on peut refaire plusieurs fois la prise pour l’image ou la lumière, personne ne s’y opposera. Pour le son, c’est beaucoup moins évident : on n’ose pas forcément demander une nouvelle prise, alors que pour l’image on le demande plus facilement… Ceux qui ont déjà vu un preneur du son direct se battre pour imposer le silence sur le plateau, afin d’enregistrer trente secondes de son seul, savent de quoi je parle ! Et quand on arrive au mixage, le budget de production du film est déjà dépensé ; il est hors de question de rallonger une durée de mixage ou de bruitage, même si c’est justifié. Nous y reviendrons probablement plus tard, mais les outils actuels servent plus souvent à « réparer » des éléments audio médiocres, qu’à gagner un ou deux degrés de qualité.
Les moyens ne sont pas toujours réunis pour créer une esthétique sonore, on cache souvent les défauts !
Heureusement, la génération des réalisateurs de 40/50 ans semble beaucoup plus concernée par les problématiques sonores et paraît parfaitement consciente de ce qu’un beau son peut « apporter » à l’image et au film. On voit souvent des photos où le réalisateur porte un casque pour écouter le son capté pendant la prise. Certains conçoivent même leur scénario et leur découpage en fonction d’éléments sonores ! Cédric Klapisch — que nous aurons le plaisir d’accueillir cet après-midi — en est un bel exemple : l’image de ses films est renforcée par une vraie présence sonore, aux éléments originaux et recherchés. Son équipe est motivée quand elle le voit se rendre en montage son, en bruitage, en mixage… Il y a d’autres réalisateurs qui suivent ainsi toutes les étapes de la création sonore de leur film.
Avec la numérisation, la « consommation » de cinéma est en pleine évolution depuis quelques années. Après la banalisation de la musique, qu’en est-il de celle de l’image ? Je suis servi par l’actualité : hier, le magazine Télérama a sorti un numéro dont la couverture est consacrée à « la vie numérique ». Le concept : aller voir dans des familles avec enfants — des gens d’une quarantaine d’années, aisés sans être fortunés — comment on regarde les images et l’on écoute les sons ? Le journaliste a commencé par compter les écrans, au sens large : téléviseur, bien sûr, mais aussi moniteur d’ordinateur, iPod, téléphone portable, console de jeux, ordinateur portable… Les résultats sont étonnants. « Famille X : 3 enfants, 12 écrans ». « Famille Y : 1 enfant, 9 écrans, 3 consoles de jeux fixes ». N’oublions pas que certaines consoles de jeux peuvent lire des DVD, voire des Blu-ray. Les frontières sont floues. « Famille Z : 13 écrans, 2 consoles fixes ». Il y a des photos à chaque fois. Cherchez les enceintes, il n’y en a pas de visibles, ou ce sont celles des ordinateurs, à 10 euros la paire. C’est intéressant, ça fait peur aussi, au niveau de la place du son par rapport aux images.
Un autre enseignement intéressant de cet article : le fractionnement du visionnage des films. L’acte d’écouter un disque ou de regarder un film n’est plus forcément continu. On peut commencer un film sur le téléviseur et (ou) le lecteur de DVD du salon, le poursuivre sur son ordinateur portable, et le terminer sur l’iPod le lendemain matin. Dans tous les cas, on est loin des conditions de référence : la salle, puisqu’on sait que les films sont mixés dans des auditoriums, dont les propriétés acoustiques et les dimensions sont voisines de celles d’une salle d’exploitation.
À cette évolution des modes de « consommation » — je n’aime pas du tout ce mot, mais hélas il est de plus en plus approprié, les contenus culturels devenant des marchandises, voire des produits associés — vient se greffer une révolution technologique dans les méthodes de production, en audio notamment. Le cinéma numérique en salle arrive à grands pas, mais l’ordinateur est omniprésent dans la fabrication des images — montage, trucage, enregistrement — et des sons. Il y a, semble-t-il, de moins en moins d’argent consacré aux budgets techniques, même si les coûts des films restent stables ou augmentent. Du coup, on voit se créer beaucoup de petites structures : il y a de plus en plus de petits auditoriums, équipés en numérique, pour beaucoup moins cher qu’avant, le ticket d’entrée a baissé. Ces prestataires arrivent-ils à maintenir une qualité suffisante ? Quelle sera la différence entre un « petit » auditorium, un auditorium « moyen » et un « grand » auditorium, au niveau du rendu final du mixage du film ?
Comment, à partir d’un contenu « de référence », accompagner sa transposition vers des formats de qualité inférieure, comment faire en sorte qu’il « perde » le moins possible en passant du 5.1 au Dolby Surround, en stéréo, en mono, sur Internet, sur l’iPod ?
C’est le thème de notre première table ronde. Les intervenants sont tous là, je les invite à prendre place sur scène. Dans l’ordre alphabétique :
Alain Besse, Responsable du secteur diffusion de la Commission Supérieure Technique de l’image et du son ( CST). Alain a contrôlé un grand nombre de salles de cinéma dans sa vie, notamment celles du Palais du Festival de Cannes. En ce moment, il travaille d’arrache-pied sur des recommandations pour le son en TVHD, la télévision numérique haute définition, qui a commencé récemment à diffuser ses programmes, et qui apporte le son 5.1 à domicile. Ce qui est plus compliqué à gérer qu’on ne le croit.
Christophe Jankovic, est Producteur pour la société de production Prima Linéa. A son actif, pas mal de films d’animation : La peur du noir, U, Marie Caillou… Il est amené à gérer un grand nombre de supports différents pour accompagner le parcours de ses productions, de la salle au DVD.
Jean-Paul Loublier, est Directeur des auditoriums parisiens Dovidis et mixeur. Il travaille au cinéma et sur des téléfilms. Cherchez son nom sur Internet Movie Database, vous le trouverez, associé à des centaines de films, et encore, il en manque.
Alexandre Mahout, Directeur des productions musicales de Europacorp, société honorablement connue dans la production cinématographique, et qui possède aussi une activité musicale fournie. Alexandre travaille pas mal à la Digital Factory, où se trouvent de nombreux studios d’enregistrement. Il gère souvent plus de dix formats différents pour un même contenu de départ et nous racontera ça…
Christophe Massie, présent avec une double casquette : Directeur général adjoint chez Télétota et Vice-président du « stock télévision » à la FICAM — Fédération des Industries techniques du Cinéma, de l’Audiovisuel et du Multimédia — qui représente environ 10 000 salariés et 1 milliard d’euros de chiffre d’affaire par an.
Dominique Schmit est consultant pour les Laboratoires Dolby. Le format Dolby Digital est majoritaire sur le son multicanal des copies de films projetées en salle. Dominique fait tout pour que le son issu du mixage du film « passe » le mieux possible en salle. Il commercialise des outils divers et variés pour s’en assurer et le mesurer — notamment pour établir des métadonnées qui suivent les données audio. Dolby entend bien être un acteur de poids dans la TVHD, et se lance aussi sur le marché des téléphones portables. Dominique a un « scoop » pour nous.
Bruno Seznec, est Directeur de Piste Rouge et mixeur. Sa société possède plusieurs auditoriums cinéma sur Paris et des salles de montage à Angoulême — inaugurées récemment. Il travaille beaucoup pour le cinéma d’animation : Kirikou et les bêtes sauvages, U, Futurikon, Chasseur de dragons, notamment avec Christophe Jankovic de Prima Linéa, ici présent. Il assure aussi pour ses clients des activités de conseil de post-production audio.
Eric Tisserand, ingénieur du son et mixeur a été nominé aux Césars pour L’ennemi intime. Il a certainement des choses à raconter sur le passage d’un support à un autre, et sur la façon dont il redécouvre, parfois, et pas pour le meilleur, son mixage en salle ou sur DVD.
Maintenant procédons dans l’ordre : partons d’un son mixé dans un auditorium, projeté dans une salle de cinéma comme celle-ci par exemple. Ce sont des conditions « de référence », et pourtant… Alain, tu as contrôlé beaucoup de salles de cinéma, et même s’il y a des recommandations, des valeurs à respecter, finalement, chaque salle est différente, et la notion de « référence » est un peu écornée…
Alain Besse – Responsable du secteur diffusion de la Commission Supérieure Technique de l’image et du son ( CST) – Je crois que c’est vrai sur toute chose : l’idéal n’existe pas. On essaie de l’atteindre ! Avant de parler de la salle de cinéma, je voudrais apporter un complément à propos de l’article de Télérama que tu citais. Je ferai une simple remarque : sur la télécommande de notre téléviseur, tout le monde sait où se trouvent les touches de réglage du niveau sonore, mais peu savent où se trouvent les réglages de l’image… C’est assez paradoxal : on ne s’occupe jamais de régler l’écran, on considère qu’il est bien comme ça, qu’il n’y a rien à retoucher. Alors que sur le son, tout le monde va se mêler de régler le niveau, les aigus, les graves, etc. Il y a une assez forte contradiction là-dessus, qui est sans doute assez intéressante à analyser sur notre rapport à l’écoute.
Pour en revenir à la salle de cinéma, l’idéal est théoriquement de travailler en 1/1, à l’échelle 1, de redonner au spectateur ce que le créateur, le mixeur a voulu faire, en toute transparence. L’outil de diffusion d’une œuvre cinématographique doit être le plus transparent possible.
Pour se faire, on dispose d’un certain nombre d’outils et de références qui sont un héritage de nombreuses expériences. La seule « vraie » norme existante sur le son a été établie dans les années 1940. C’était assez empirique à l’époque, mais on a quand même abouti à quelque chose qui a donné satisfaction depuis : on garantit des zones d’écoute. Il existe en France une norme concernant les caractéristiques dimensionnelles des salles de cinéma, appliquées à toutes les salles. Cette norme définit une zone d’écoute qui positionne le spectateur/auditeur — autre contradiction d’ailleurs, au cinéma on parle toujours de spectateur, jamais d’auditeur, encore une prédominance de l’image sur le son — dans une situation à peu près cohérente par rapport aux sources sonores. Ce qui nous conduit à une autre difficulté fondamentale dans la reproduction sonore : l’immense majorité des recherches menées depuis 30/40 ans, notamment autour de la stéréophonie, ont été centrées autour d’un individu. On doit être à la pointe du triangle équilatéral avec les enceintes. Ce point d’écoute idéal est devenu, avec le multicanal, une zone, le sweetspot, mais, très clairement, on a peu réfléchi aux problèmes soulevés par une écoute collective. Garantir que celui qui se trouve au deuxième rang, à droite, et celui qui est assis dans le fond à gauche entendent la même chose, voient le même film, éprouvent les mêmes sensations, n’est pas évident.
Là aussi, on essaie de trouver des solutions indicatives pour aider les concepteurs de salle, en liaison avec ce qui s’est fait en production, pour offrir au spectateur un son qui soit le plus proche possible de ce qui a été créé. Ces réglementations concernent la position des enceintes acoustiques identique à celle qui est adoptée en auditorium de mixage, mais aussi le respect d’un certain nombre de concepts. Dans l’ordre des priorités pour la reproduction sonore, la première condition demandée à une salle de cinéma, c’est de garantir l’intelligibilité du message sonore. Comme je le dis souvent, d’un théâtre à un autre, l’acteur va adapter son jeu à l’acoustique du lieu, mais dans un film, la bande son est figée. On doit pouvoir passer de Funès ou Jouvet dans une salle de cinéma, sans rien changer, ce qui demande des caractéristiques acoustiques particulières.
Il n’existe pas de norme, ni de loi, mais uniquement des réglementations techniques professionnelles. La seule norme existante porte sur la courbe de réponse en fréquence, l’ISO2969, courbe X, et courbe N (Academy pour le son mono — encore 10% de salles en France, et 25% en Dolby Stéréo analogique matricé). On doit aussi respecter un certain temps de réverbération, qui varie en fonction du volume de la salle. Par rapport à l’ensemble des autres lieux de diffusion — salle de concert de musique classique, théâtre — la salle de cinéma est un milieu relativement mat. Rien d’étonnant, parce qu’une réverbération excessive est l’ennemi de l’intelligibilité. Le traitement acoustique d’une salle de cinéma est d’une importance capitale pour le respect de l’œuvre. Enfin, le matériel de diffusion lui-même — amplificateurs, enceintes acoustiques — a suscité un certain nombre de réflexions et de recommandations. Il y en a eu voilà 30 ans. Il serait nécessaire de les revoir aujourd’hui avec l’arrivée du cinéma numérique, où, grosso modo, on amène la sortie de la console du mixeur directement dans la salle de cinéma, sans encodage, sans matriçage, sans aucun intermédiaire technique, sans consultant Dolby qui effectuait un contrôle et une validation lors de l’encodage du son multicanal en Dolby Digital. Quand ce sont des mixeurs expérimentés qui travaillent, dans de bonnes conditions, il n’y a pas trop d’inquiétudes à avoir ; mais quand on voit arriver des mixages faits parfois, pour caricaturer, dans des cuisines, sur un Pro Tools installé sur la table de nuit de la chambre — ce qui peut se faire techniquement aujourd’hui, mais où disparaît toute notion de niveau de référence et d’alignement — on peut avoir des surprises désagréables.
Tout ça pour dire que c’est l’ensemble « matériel de diffusion, plus acoustique de salles » qui est important. Si on se trouve, par exemple, dans une salle très réverbérante, le premier réflexe sera de descendre le niveau sonore de reproduction du film. Dans ce cas, on perd les équilibres entre la voix, les ambiances, la musique et les rapports voulus par le mixeur et le réalisateur ; on perd d’un coup 50 voire 80% du sens de la bande sonore. Ce qui me rappelle une anecdote qui s’est déroulée à Cannes où je descends tous les ans pour la durée du Festival, puisque j’ai la chance d’être responsable de l’ensemble de toutes les projections du Festival. On fait des répétitions — Dominique Schmit est souvent présent d’ailleurs – et parfois des réalisateurs ou des mixeurs nous demandent de descendre le niveau d’écoute de « 0,1, ou 0,2 », avec des dB de valeurs très faibles. On a l’impression qu’ils exagèrent un peu, mais on le fait quand même. Et parfois, quand le niveau est descendu de 0,2 ou 0,3 dB réellement — même pas 1 dB — sur une salle de 2500 places, on a vraiment une perception acoustique qui change, la perception du film change, ce n’est plus le même. Ça m’est arrivé plusieurs fois. Preuve que la notion d’alignement des niveaux est excessivement importante pour garantir le respect de l’œuvre, sa compréhension.
Franck Ernould : Tout ce que tu as expliqué sur les propriétés des salles de cinéma, en termes de dimensions, d’acoustique, d’équipement, on le retrouve dans tous les auditoriums de mixage, que ce soit, par exemple, chez Bruno Seznec, ou chez Jean-Paul Loublier ?
Alain Besse : C’est l’objectif, effectivement. Il doit y avoir une correspondance entre l’auditorium de mixage et la salle de cinéma.
Franck Ernould : Mais de plus en plus souvent, on voit des auditoriums qui n’ont plus de grands volumes. Si on mixe dans des auditoriums d’un volume insuffisant, on perd la reproductibilité du mixage…
Alain Besse : C’est clair… La salle de cinéma, c’est la notion de spectacle collectif, à opposer au visionnage/écoute individuel. Qui dit collectif, dit dimensions importantes. Il est évident que si le mixage se fait dans un autitorium de « petit » volume, on va mixer différemment.
Évidemment, l’expérience, le savoir-faire du mixeur lui permettront de pondérer un certain nombre de choses. Mais il aura, quand même, une tendance à mixer « plus petit », que s’il était dans le grand auditorium de la Digital Factory, qui est l’exemple même de ce qu’on aimerait tous avoir ! Après, il y a des questions de moyens, de place, de volume ; il ne serait pas évident de construire à Paris, aujourd’hui, un auditorium de mixage de ces dimensions-là. Dolby établit des recommandations et « homologue » des auditoriums — comme la CST d’ailleurs — dans le cadre des autorisations d’exercice délivrées aux industries techniques pour les auditoriums. Ils ont, comme nous, établi des dimensions minimales. Si un prestataire nous demande une autorisation d’exercice, et que son auditorium a des dimensions insuffisantes, nous ne délivrons pas de quitus technique, car nous considérons que ce lieu ne permettra pas de finaliser convenablement une bande sonore de film de cinéma.
Dominique Schmit : Pour apporter un complément sur les auditoriums, Dolby ne donne son agrément que si les auditoriums remplissent un certain nombre de critères, notamment en termes de distance de la console de mixage à l’écran, de répartition des haut-parleurs, d’équipements de mixage, console, etc. Quand un producteur paye une licence pour utiliser le son Dolby sur son film, nous sommes là pour garantir que le résultat dans la salle de cinéma sera équivalent à ce qui a été validé, d’un point de vue artistique, dans l’auditorium de mixage.
Franck Ernould : Bruno, à Piste Rouge, tu es donc dans les critères, les normes, les recommandations ?
Bruno Seznec : Je suis pile à la limite ! J’apporte une petite restriction à ce qui a été dit. On parle toujours de la petite taille d’un auditorium. Parlons aussi de la grande taille : ce n’est pas toujours sympathique de mixer dans un très grand auditorium. Clairement, pour avoir pratiqué les deux, il m’est arrivé aussi de me planter dans des grands volumes ; parce que, justement, l’approche et l’appréhension du son ne sont pas forcément comparables à ce que sera la diffusion derrière. Quand je vois une salle comme celle qui nous accueille ce matin — qui est sans doute l’une des plus communément rencontrées au niveau du volume — un auditorium pourrait être plus grand. On peut donc inverser la problématique : quel va être le résultat si la salle est plus petite ?
Je crois qu’à un moment, il faut aussi s’arrêter sur le fait qu’il y a des hommes travaillant avec des outils, qu’ils connaissent parfaitement, et qu’ils sauront les utiliser en fonction de leurs expériences précédentes. Parce qu’il n’y a que l’expérience qui puisse donner une idée du rendu de ce qu’on mixe, dans un autre environnement : dans une salle plus grande, ça va faire ci, ça va faire ça, et même principe pour une salle plus petite ; du même coup, on remet un peu de professionnalisation au milieu de tout ça, sans s’arrêter sur le fait que seul l’outil intervient pour faire des choses qualitatives.
Franck Ernould : Parce que dans tes auditoriums de mixage, tu peux réaliser aussi bien le mixage d’un film Dolby Digital, que celui d’un produit spécifiquement dédié à la vidéo ?
Bruno Seznec : Tout à fait ! Et le plus bel exemple dans ce domaine, c’est quand j’ai mixé Chasseur de dragon dans mes auditoriums, qui ne sont pas terriblement grands ni franchement petits…
Franck Ernould : Tu as une idée de leurs dimensions, de leur volume ?
Bruno Seznec : environ 50 m², en gros 4 m de hauteur sous plafond. On est à un peu moins de 200 m³.
Franck Ernould : Un « petit » auditorium ferait donc 200 m³, un moyen, 600 ou 700 m³, Alain Besse ou Dominique Schmit, combien en compte la Digital Factory, plusieurs milliers, j’imagine ?
Alain Besse : Je ne connais pas les valeurs par cœur, mais on est dans ces ordres de grandeur-là. Bruno, je me permets de t’interrompre quinze secondes… Nous avons dans la salle Miguel Adelise, ingénieur du son chez Télétota, qui est un des acteurs très importants et très actifs sur le travail des recommandations pour la TVHD, évoquées par Franck Ernould tout à l’heure. C’est une des problématiques que nous avons fréquemment soulevé dans les réflexions concernant la gestion de la dynamique, les écarts de son, à la télévision, pour la TVHD 5.1 qui va arriver. Sur les déclinaisons de films — et là on a vraiment besoin de l’avis des mixeurs sur cet aspect-là des choses — on doit valider le mixage cinéma, sa version DVD, sa version télévision 5.1, sa version 2 canaux, éventuellement sa version mono. Est-ce que tout ça peut se faire ou pas dans le même auditorium ? Ça pose des problématiques, c’est un des sujets qui n’est pas encore tranché et qui va faire l’objet des débats à suivre sur cette gestion de la dynamique.
Bruno Seznec : Je vais juste finir mon histoire sur Chasseur de dragon qui est typiquement un film façon blockbuster, un gros truc, avec du son « qui envoie » comme on dit. Donc, apparaît la problématique de se dire : « Bon, si on travaille dans un environnement plus modeste, on risque de commettre des erreurs d’appréciation, d’interprétation quant au volume sonore, à l’action réellement physiologique qu’on recherche sur le spectateur, par des poussées de basses ou d’aigus, etc ». Résultat : J’ai eu le plaisir d’assister à une projection du film dans une très grande salle, et j’ai retrouvé vraiment les sensations que j’avais eues en le mixant dans mon auditorium. Ce qui prouve très clairement qu’on peut adapter sa méthodologie de travail…
En fait, je dirais que ce sont plutôt des notions de fatigue qui entrent en jeu. Sur des outils plus modestes la fatigue se fait sentir plus vite, parce qu’on est dans une écoute de semi-proximité. Avec un niveau sonore fort, on a rapidement la sensation de s’en « prendre plein la tête » tout le temps. Mais sorti de ce contexte — et du coup avec la possibilité de l’adapter éventuellement — on retrouve quand même des sensations assez identiques. Ce qui laisserait entendre aussi que l’outil — à partir du moment où l’on a une approche professionnelle des choses — peut s’adapter totalement au résultat final qu’on souhaite.
Christophe Massie — Directeur général adjoint de Télétota, Vice-président du « stock télévision » à la FICAM : Je vais commencer par la FICAM… tout le monde ici connaît. Autrefois, il existait des chambres syndicales ou techniques : les laboratoires d’un côté, les auditoriums de l’autre. Le regroupement de toutes les activités techniques a mis fin à ce cloisonnement, signe intéressant par rapport à notre discussion. Les professionnels se sont dit : plutôt que d’avoir affaire à des chambres syndicales techniques, procédons par type de programme. Nous avons donc une chambre « long-métrage » et une chambre « stock » qui est celle dont je m’occupe, et qui inclut notamment les fictions. Avec, à côté, une chambre « flux », pour répondre à une évolution : nous ne sommes pas que des techniciens, on travaille aussi pour un certain type de programmes.
Pour en venir à Télétota — au nom de qui j’interviens ici — nous possédons les auditoriums Auditel que beaucoup connaissent, ceux de Jackson et, récemment, ceux de Postmoderne, ex-GL PIPA. Des auditoriums de tailles différentes (en tout 14 auditoriums). Nous avons en plus ce que nous appelons, dans notre jargon, des « studios » (de plus petite taille), qui travaillent sur des documentaires, voire du doublage.
Quand nous avons préparé ensemble cette journée, j’ai insisté sur l’intérêt d’expliquer cette notion d’évolution. Ça fait vingt ans que je travaille, d’abord dans le son. A une époque, avec Franck Ernould, on travaillait sur des mixages de documentaires, par exemple sur de l’opéra, au début d’Arte. On faisait un mixage, Franck savait de quoi il parlait, moi aussi, on faisait un beau programme… Ensuite, on tirait un PAD — Prêt A Diffuser — dans un autre service de Télétota, le laboratoire. Un PAD qui allait être diffusé en SECAM, en tenant compte des normes, donc en mesurant les différents signaux. Et là, le technicien du laboratoire, avec ses normes, parfois baissait le niveau audio, pour « ne pas écrêter ». Résultat : on livrait un opéra où l’on n’entendait plus les récitatifs… C’était un de nos premiers problèmes.
Ce problème est toujours là… En tant que prestataires des industries techniques, nous essayons d’offrir au producteur, au réalisateur, au mixeur les plus beaux outils pour faire les plus beaux programmes : taille d’auditorium, puissance de consoles, différentes gammes de prix… C’est notre métier, on le fait depuis longtemps, on continue à le faire. Par ailleurs, on a d’autres métiers où le rôle — que ce soit en termes de copies, de PAD ou autres — est d’apporter aux consommateurs — je n’aime pas ce mot non plus, mais il faut l’employer — les programmes, selon le choix qu’il a fait de les regarder : copie 35, PAD télévision sur HDCAM ou HDCAM SR, avec le Dolby E, mais aussi la VOD, le DVD, y compris les VHS. On est donc toujours dans cette dualité : comment répondre aux personnes qui veulent faire des programmes, avec une certaine exigence de qualité, et comment trouver un compromis, avec les supports que nous fabriquons, pour apporter ces programmes aux consommateurs, aux spectateurs. On navigue un peu entre le marteau et l’enclume, parce qu’on doit gérer au mieux cette question de transparence. La transparence, voilà l’objectif ! On assiste — je le vois depuis quinze ans — à une déviation. On s’écarte de cet idéal, car nous avons d’un côté des mixeurs, des réalisateurs ou des producteurs, qui veulent des auditoriums de plus en plus grands, de mieux en mieux équipés, avec de plus en plus de pistes à gérer ; et de l’autre côté, un son qui, finalement, doit être compatible avec de la VOD et, demain, avec le téléphone. Cette difficulté d’obtenir la transparence du son, je pense qu’elle interpelle un peu tout le secteur. La question à traiter dans cette table ronde, c’est : « Comment on fait ? » On nous demande de faire un son de plus en plus sophistiqué, mais ce son doit être ramené à des modes d’écoute de plus en plus simples.
Notre réponse concrète comme prestataire de service, est de dire : « Nous allons vous apporter les moyens de contrôler en auditorium le son sur les différents supports ». On rejoint le souhait de certains mixeurs : donner les moyens – en mixage, et en repiquage — de valider le son, ou plutôt les sons : salle, DVD 5.1, demain un stéréo ou un Dolby E qui sera couché sur la HDCAM qui part en diffusion, et, de la même manière, en VOD. Ces différentes étapes, c’est du temps, de l’argent, mais c’est très important pour éviter les conflits entre un technicien vidéo qui appellerait par exemple un mixeur : « Ton son ne passe pas sur mon PAD ». Ça veut dire quoi : Ton son ne passe pas ? Il n’est pas bon, il y a des problèmes de niveau, de dynamique ?… Toute la question de cette acceptation, c’est vraiment notre quotidien, dans l’industrie technique. C’est cette problématique que j’aimerais approfondir avec vous.
Franck Ernould : Passons la parole aux mixeurs… Eux sont les premiers confrontés à ce souci. Ils ont mixé un film, ça sonne d’une certaine manière, et ils le redécouvrent ensuite pas mal modifié. C’est déjà le cas quand vous faites la tournée des salles à la sortie d’un film. Certains « anciens » m’ont fait part de cruelles désillusions dans des salles pourtant bien connues et fréquentées. Même déception pour la version DVD, pour les PAD chez TF1, France 2, Canal+ ou Arte. Evidemment, chaque chaîne possède son cahier des charges et ses propres critères en matière de PAD. Jean-Paul, tu as beaucoup travaillé pour le cinéma et sur des « téléfilms de prestige » ces dernières années. Je me souviens de ton reportage sur le téléfilm Dalida, que tu avais passé au Forum du Son Multicanal, dans un « petit » auditorium à la SFP…
Jean-Paul Loublier — Directeur de Dovidis et mixeur : Je dirais plutôt, auditorium « moyen ». J’ai passé un certain nombre d’années dans ce métier, d’abord au cinéma. A l’époque, le son des copies projetées en salle était couché sur une piste optique mono, à côté des perforations de la pellicule. On travaillait sur support magnétique en auditorium, bien entendu, mais nous assurions nous-mêmes, mixeurs, le report optique de notre mixage sur 35 magnétique. On était donc liés à des normes. La première, c’était la fameuse courbe Academy, dont Alain Besse a parlé tout à l’heure. Mais surtout, nous n’avions qu’un canal son. Les éléments sonores ne pouvaient être placés que dans le sens de la profondeur. Pas question d’envoyer quelque chose à gauche ou à droite, ça n’existait pas, l’enregistrement optique trouvait vite ses limites. Il fallait savoir, qu’un coup de feu ou un coup de canon, devait se calibrer de façon à ce qu’il puisse passer, afin d’éviter sur la bande optique, ce qu’on appelait le « flash » à l’époque : le galvanomètre restait fixe, et ça produisait un blanc. Là où il devait y avoir du bruit, on avait du silence ! On s’adaptait, et voilà !
Le son au cinéma a considérablement évolué, et quand on a vu arriver le système Dolby Stereo, c’était une vraie révolution. Quinze ans plus tard, on a même inventé en France — Franck Ernould ne l’a pas rappelé tout à l’heure — le précurseur du format DTS, le LC Concept. Ce sont les Américains qui l’ont imposé sur le marché, ça arrive très souvent chez nous. Bref, grâce au Dolby, le champ sonore s’est ouvert : on avait un centre à l’écran, on pouvait envoyer des éléments à gauche, à droite, et même dans la salle, sur les côtés des spectateurs. Cette base technique nous a permis de travailler différemment nos mixages : les paroles au centre, mais la musique, les ambiances et d’autres effets pouvaient se répartir de façon plus latérale, et ainsi donner un effet de largeur intéressant.
Autre aspect intéressant avec le Dolby : on avait en auditorium les mêmes outils que ceux utilisés en exploitation. Les normes fixées à l’époque en auditorium faisaient qu’on se trouvait comme dans cette salle de cinéma. J’avais eu l’occasion dans ce qu’on appelait les « grands auditoriums » de l’époque : Boulogne-Billancourt, qui était énorme, 2000 m³ peut-être — c’était le seul où on aurait pu jouer au badminton sans problème — avec ce paradoxe chez Jean Neny, le directeur technique ; il avait toujours chaud, il ne mettait jamais de chauffage. L’auditorium n’était donc pas chauffé, et c’était assez surprenant de constater que le matin, on écoutait un son, c’était bien — surtout l’été d’ailleurs — et le soir, on le réécoutait, ce n’était plus le même ! La différence de température — on était peut-être passé de 15° à 25° pendant la journée, voire 30°, le toit de l’auditorium était en tôle — donnait des sensations différentes. On avait donc pris l’habitude de réécouter les bobines déjà mixées le matin, mais pas le soir.
Bref, grâce au Dolby, on a eu tous les grands auditoriums qui existent encore aujourd’hui, avec le même matériel qu’en exploitation, les similitudes étaient grandes. En mixage cinéma, je pense qu’on ne peut pas descendre en dessous d’un certain volume, parce que sinon ça devient un peu délicat. Pour un film long-métrage, je considère que 200 m³ représentent un strict minimum pour mixer en toute tranquillité. En revanche, pour le DVD ou la télévision, on peut se permettre de travailler dans des volumes un peu plus restreints, à condition qu’ils soient adaptés en niveau et en acoustique, qu’il y ait compatibilité avec le lieu de diffusion. Évidemment, on ne peut pas adapter un auditorium aux dimensions d’un salon chez les gens (d’un particulier), mais on peut connaître certains critères et s’y adapter – quitte à ce que le mixeur aille écouter ailleurs, ou chez lui, ce que ça donne.
À l’échelle DVD ou télévision, il faut faire attention aux limites de diffusion qui nous sont imposées par les laboratoires et les systèmes de transport de signal utilisés, que ce soit le Dolby E ou autres. Si les limites sont respectées, si l’on s’y tient, il n’y a pas de problème particulier. C’est mon avis. On est toujours entre le marteau et l’enclume, entre le metteur en scène et le film. Avec ceux qui travaillent avec nous, on a toujours l’impression de faire Ben Hur, alors qu’en réalité, ça finit, comme on dit vulgairement, sur deux casseroles posées de chaque côté d’un téléviseur. L’objectif est de travailler en fonction de la finalité du produit — voilà aussi un mot que je n’aime pas — éviter de se voiler la face et savoir ce qu’on peut faire passer.
Autre aspect, qui n’a pas changé au cours de mes quarante ans de carrière : s’il y a du dialogue, il est incontournable de le comprendre ! Ça c’est la base. Si on ne veut pas le comprendre, on le noie vraiment très facilement : il faut que ce soit une volonté de mise en scène, qu’il n’y ait aucun quiproquo possible. Grâce au Dolby Stereo, et au 5.1, on isole, techniquement, la piste des dialogues sur une seule enceinte, la centrale. Les autres éléments sont le plus souvent envoyés à gauche ou à droite. C’est du mixage, voilà.
Franck Ernould : Ce qui est paradoxal, c’est qu’avec tous les progrès réalisés ces vingt dernières années au niveau du son multicanal — et notamment au niveau des moyens de production : consoles numériques, multipistes numériques, puis stations de travail audio sur ordinateur, avec des centaines de pistes à disposition, le virtuel qui s’impose partout, de l’image au son — on demande de faire passer de plus en plus d’éléments dans des tuyaux de plus en plus petits… Eric, tu as suivi cette évolution, tu as été confronté à ce problème ?
Eric Tisserand — mixeur : Oui, tout à fait. On est bloqué par différents facteurs. Il faut adapter les mixages, notamment en les vérifiant sur des systèmes plus représentatifs des différents matériels d’écoute, du téléviseur à l’iPod. C’est bien, c’est une avancée. Selon le format pour lequel on mixe, les balances, les équilibres seront différents. On ne peut pas se contenter de « vérifier », il faut aussi, souvent, rééquilibrer les choses, modifier nos balances. Sinon, le travail qu’on a effectué avec le réalisateur — en partant de ses demandes artistiques — sera totalement déformé. On le sait tous, et il est essentiel de nous donner la possibilité de retoucher notre travail initial.
Il y a un problème de coût qui n’a jamais été prévu par les productions. Aujourd’hui, pour finaliser un film, c’est compliqué, tu en as parlé, le son est un peu le parent pauvre du cinéma. Les finitions et les déclinaisons de formats ne sont pas budgétées. On a donc une bande sonore réalisée pour être exploitable au cinéma le mieux possible, même si les réalisateurs ne sont pas forcément satisfaits de ce qu’ils entendent en exploitation sur l’ensemble de l’hexagone. Je tiens à le dire aussi, la maintenance des salles n’est souvent pas assez régulière, pas assez précise, en comparaison des studios pour lesquels on travaille, qui sont vérifiés par les consultants Dolby à chaque nouveau film : les niveaux, la bande passante des enceintes, le matériel… La salle de cinéma lambda est vérifiée, en France, au mieux une fois par an.
On se bat face à quelque chose qu’il est difficile de faire accepter à un réalisateur, qui nous fait confiance et souhaite que le résultat de notre travail soit le plus transportable possible, uniquement dans les salles de cinéma. Il y a déjà là des choses à revoir.
Pour en revenir aux déclinaisons, il est capital que ce travail soit budgété, afin que nous puissions adapter notre mixage dans les meilleures conditions. Quand je fais la déclinaison d’un mixage « salle » pour la télévision, je fais poser un téléviseur devant moi, installer de petites enceintes, et je modifie toutes les balances de mon mixage, parce que je sais que la restitution ne sera pas la même. Ensuite, comme le disait justement Alain Besse, chacun touchera à la télécommande de son téléviseur. Mais si on envoie directement aux chaînes le signal 5.1 issu de notre mixage, avec les compresseurs et traitements d’antenne, on sera forcément déçu. La solution est de s’adapter, elle a un coût et ça prend du temps pour le faire.
Franck Ernould : Christophe est du côté de la production. Tu es donc aussi confronté à des demandes de la part des chaînes, ou des éditeurs de DVD. De quelle façon gères-tu ces demandes ? Arrives-tu à trouver des arrangements pour caser ces manipulations en fin de mixage salle, par exemple ?
Christophe Jankovic – Producteur, Prima Linéa : Dans un premier temps, je ne vais pas parler d’argent, au risque de vous décevoir ! Parce qu’en fait, je ne crois pas qu’il s’agisse en particulier d’un problème d’argent et de budget — même si je suis en partie d’accord avec ce qui a été évoqué sur la difficulté d’arriver en fin de course. Ce n’est pas tant que le son est mal servi, c’est qu’il arrive en bout de course sur un film.
A mon avis, il existe plusieurs problèmes, notamment parce qu’on se trouve à une époque-charnière. Depuis ces trente dernières années, les possibilités d’écoute dans le meilleur endroit, la salle de cinéma, n’ont cessé de se perfectionner. Le travail des réalisateurs a donc consisté à utiliser cette richesse dans le spectre sonore et la spatialisation, pour produire des bandes son de plus en plus nuancées, de plus en plus subtiles, etc.
Et il y a un premier problème : alors que la qualité potentielle d’écoute du son s’est enrichie, l’écoute dans d’autres circonstances s’est appauvrie, me semble-t-il. On se retrouve à faire des sons aux petits oignons, alors qu’en fait, les spectateurs écoutent ça dans des salles de cinéma qui — je partage l’avis — sont beaucoup trop nombreuses à présenter des défauts au niveau de la restitution sonore. Le nombre de souris qui bouffent des haut-parleurs est incroyable en France.
Alain Besse : On a mis des produits toxiques dans les membranes, maintenant…
Christophe Jankovic : Je ne sais pas si ça va être utile comme indication, mais il y a extrêmement peu de salles dont la restitution sonore est parfaite, même parmi les meilleures, même à Paris, même dans le réseau Art et Essai. Je ne parle pas des vendeurs de soupe qu’on peut avoir, notamment dans le Sud-Ouest — pour ceux qui comprennent, je me permets là une allusion à un réseau dont je n’aime pas beaucoup la politique. Je connais des salles classées Art et Essai, dont le son est encore projeté en mono. Alors ce son qui gagne en richesse et en qualité en amont, dans l’auditorium de mixage, se retrouve à l’arrivée, terriblement appauvri. C’est certainement un vrai problème d’argent, mais aussi de logique de travail.
Nous avons démarré récemment dans le long métrage d’animation, avec Piste Rouge et Bruno Seznec, nous nous sommes lancés ensemble dans ce secteur. On a mis en place des habitudes de travail — je ne sais pas si c’est la bonne technique, mais le réalisateur travaille sur les sons dans les meilleures conditions, le 5.1. Vous n’avez d’ailleurs pas évoqué un sujet qui, selon moi, pose un autre problème : le travail en 24 ou en 25 images/seconde. Nous avons fait le choix du 24 images/seconde, puis de décliner le son pour les autres utilisations.
On n’a pas encore inclus l’iPhone dans les autres utilisations, il sera peut-être nécessaire d’y venir, mais on décline la stéréo et le DVD, stéréo et 5.1. A partir de ces propositions, on a de quoi faire face aux différentes demandes. Ces demandes, d’ailleurs, font rarement référence à des conditions sonores. Quand une télévision nous demande quelque chose, ou quand on vend le film, on nous précise si on veut le format 16/9 ou 4/3, ou 1,66… Sur l’image, ou le support Beta num, HDCAM SR, les critères sont précis, sur le son, beaucoup moins. On nous demande une bande antenne ; il y a deux ou trois endroits à Paris, notamment chez Télétota, qui en fabriquent sérieusement, mais à nos yeux, c’est purement technique. Cela dit, j’ai pu le remarquer pour les publicités que nous faisons aussi, sur la bande antenne, tout d’un coup, certains sons disparaissent. Peut-être y avait-il un problème de niveau, mais on constate un changement lors de cette étape. Et j’ai la forte impression que les diffuseurs, les télés en régie finale, pratiquent aussi des traitements et uniformisent tout. J’ai pu également le constater sur l’image. Sur le son, il y a encore des égaliseurs et des compresseurs au niveau de la régie finale. Dans ces conditions, avant même de savoir combien ça coûte, on règle quoi pour quoi ? On n’en sait trop rien… C’est vrai aussi qu’on aimerait bien avoir un support unique, uniforme.
Christophe Massie : C’est un des grands chantiers qui est en cours aujourd’hui entre la CST et la FICAM : le travail de normalisation, avec édiction de normes techniques s’appliquant aux PAD. Ce chantier a commencé voilà un an, il est en train de se terminer pour le son. A l’issue de ces travaux, il existera des normes communes régissant l’acceptation d’un PAD.
Par rapport à ce qui vient d’être dit, il faut savoir qu’il y a eu récemment une considérable augmentation du nombre de refus de PAD à cause du son. On a organisé récemment une rencontre à la Rochelle, CST/FICAM/TF1 et Arte : la part de refus pour le son est en train de devenir prépondérante pour tout ce qui est livraison de PAD HD. C’est le problème aujourd’hui. Pourquoi ? Le Dolby E est quand même assez difficile à manier. Ce n’est plus du tout une technique, il intègre toute une dimension subjective. Miguel Adelise, qui travaille à Télétota et collabore à l’étude de la CST, a écrit récemment un article de trois pages sur le sujet dans Sonovision. Du coup on en arrive à se dire que c’est le mixeur qui devrait le faire. Mais le mixeur n’en a pas forcément les moyens, ni l’envie, ni le temps. Dans quatre semaines de mixage d’un film long- métrage — durée déjà limite — il est impossible de réserver deux jours à des finitions et au Dolby E. Lançons la polémique : on peut peut-être réfléchir différemment ?
On sort d’un système qui était somme toute assez simple, pour entrer dans un autre hyper compliqué. On ne peut plus dire : « Il existe une norme purement technique d’acceptation des PAD », c’est terminé ! Autrefois, on avait un SECAM qui était basique, unique et de l’optique, c’était facile. Aujourd’hui, il y a plein de manières de faire du son, du gros ou du petit, et de multiples façons de l’écouter. Comment fait-on face à ça ? Il y a des mécontentements, parce que les techniciens du son ne retrouvent leur son nulle part : ni en salle, ni à la télé, ni sur leur téléphone portable. Nous sommes avec des gens qui nous disent, tous les jours « tu travailles mal ! ». Ça devient super compliqué.
En revanche, là où c’est intéressant, c’est de se poser à nouveau les bonnes questions : qu’est-ce qu’on veut faire, à quoi ça sert, qu’apporte-t-on au final ? S’il n’y a pas de prise de conscience de la profession elle-même, les diffuseurs remonteront le niveau, changeront le mixage et bientôt le montage ou l’étalonnage. Ah, vous tournez de telle façon ? Mais vous savez — quand l’image passe en MPEG4, décompression/compression/décompression/compression — votre image qui était travaillée surcouche graphique après surcouche graphique, ne « passe » pas dans les tuyaux du prestataire d’accès Internet. Eux veulent une image claire, RVB, propre, clean, pas compliquée, du simple. Et c’est ce qui nous arrive maintenant, en image comme en son. D’un côté, on est en train de développer des machines d’étalonnage numérique 2k, 4k, ça dure des semaines, et de l’autre, on nous dit : « Mais c’est quoi ton image là, il y a trois arrière-plans différents, c’est pas possible ».
On doit tous remettre notre métier sur l’ouvrage. Les clients nous disent : Ah, t’as pas la dernière console avec 428 pistes ? J’ai pas vraiment reconnu le bruit du troisième grillon en haut à gauche sur ton optique. On court chez SIS pour écouter. Mais vous pensez que celui qui écoute en VOD ou sur son iPod, va entendre, le troisième grillon à gauche ? Ensemble, on doit se dire : où on en est ?, et j’en reviens à ce que disait Franck : 12 écrans différents dans une même famille, mais peu de son. Quand on regarde la télé sur son PC, qu’est-ce qu’on entend ? Comment réagir, avec ce grand écart de plus en plus béant : entre un endroit très particulier où l’on fait du son très pointu en passant beaucoup de temps, et la réalité des spectateurs qui regardent et écoutent les images et les sons qu’on fait, et qui est vraiment très différente ? Je suis un peu polémique… je passe la parole à Jean-Paul…
Jean-Paul Loublier : Tu fais ça très bien, d’ailleurs, la polémique ! Par rapport à tout ce qui vient de se dire, il faut effectivement parler de « produit » : « A qui ce produit est-il destiné ? ». Si c’est pour la télévision, il vaut mieux réaliser l’aspect sonore dans un cadre télévision. Si c’est destiné au cinéma, dans un cadre cinéma. Mais il faut savoir qu’il est normal que ce produit cinéma passe aussi à la télévision. Ce qui implique de modifier la filière, pour amener le produit dans des conditions techniques normales.
Je me permets de dire en tant « qu’ancien » que l’image aussi a considérablement évolué ; notre œil et notre cerveau y sont d’ailleurs beaucoup plus sensibles. Il y a un vieil adage américain, qui date de l’optique et qui dit : « Pas plus de trois informations sonores en même temps ». Je pense que c’est assez juste. À cette époque, on travaillait en mono. Si on avait la parole, c’était une chose, si on avait la musique, c’en était une autre ; il fallait encore prévoir les ambiances, les effets… Il y avait des choix à faire : Savoir ce qu’on voulait faire écouter à un moment donné. S’il y avait des effets, on avait plutôt tendance à les faire passer en succession, plutôt que tous en même temps, où ça ne passait pas du tout. Aujourd’hui, grâce aux nouvelles technologies, les moyens sont réunis pour faire des effets extraordinaires sur une bande sonore au cinéma. Mais je pense qu’on veut donner trop d’informations sonores en même temps, que le cerveau n’arrive d’ailleurs pas toujours à suivre. Quand on apporte des informations sonores par rapport à une action ou à un dialogue, il y a des choix qui s’imposent : si ce que dit la personne n’a pas vraiment d’intérêt, on peut charger d’un point de vue sonore, mais si elle dit « je t’aime ! » avec le regard qui va avec, ça veut dire qu’il ne faut peut-être pas l’écraser avec la voiture qui passe derrière… Vous voyez ce que je veux dire !
Actuellement, il y a une accumulation d’informations. Le Pro Tools qui nous sert en auditorium est passé de 16, à 32, puis de 48 à 128 pistes, et parfois on en a même deux pistes qui tournent en même temps ! Les mixeurs sont là pour gérer l’ensemble, mais il faut se poser des questions, aller plus loin, remonter au scénario, à la réalisation. Si, par exemple, on décide de faire un produit pour la télévision aussi bien à l’image qu’au son, on ne passera pas sur le même support. On ne fera pas du grand écran, on laissera tomber des choses, j’ai entendu dire que ça va arriver sur le téléphone. Que verra-t-on alors à l’image, qu’entendra-t-on au son ? Nous devons commencer à réfléchir là-dessus : commencer par l’écriture du sujet, ensuite les choix à faire en découleront du point de vue technique.
Bruno Seznec : Nous parlons beaucoup du passage du cinéma à la télé, qui est à la limite le moins douloureux. Grâce à l’évolution des technologies, le passage de la 5.1 à la stéréo ne se maîtrise pas trop mal. On l’a tous fait en auditorium, avec des télés, avec de petites enceintes, en compensant ici et là. Le vrai problème va bien au-delà. On parle du téléphone portable, de l’ordinateur portable, de ce genre de choses qui ont quand même des transducteurs gros comme des pièces d’un euro… Il y a là un vrai clivage, une vraie démarcation entre les deux, et je dirais, très grossièrement, que par rapport à une bonne écoute, sur un téléphone, on va perdre environ 80% des informations. J’y vois un gros risque au niveau de la production, qui serait de dire : « Attendez, si 80% de ce qu’on fait est perdu, à quoi bon les mettre ? », . Ce qui va susciter un nivellement par le bas et des bandes son assez mauvaises, parce qu’on partira du principe que ce sera, de toute façon, mal entendu… Voilà qui relance le débat : Faut-il avoir le courage de produire pour tel ou tel « bon » support, en se préservant d’aller vers des supports qui ne sont, de toute façon, pas adaptés ? C’est un peu aller chez Ikea avec une Ferrari, on ne ramène rien.
Il faut savoir arrêter de lutter : non à un gros film en 5.1 fait pour une salle de cinéma, sur un téléphone portable, le son ne sera jamais génial. Il y a deux aspects : le son utile, les paroles, comprendre ce qui se passe, ce qui se dit, la musique, par rapport aux thèmes, et le son dans sa dimension sensorielle, physiologique, qui va procurer un autre plaisir, celui des infra-graves, des sensations purement physiques, à faire froid dans le dos ou pas. Quoi qu’on fasse, c’est là un problème de transducteurs. À partir du moment où il y a une impossibilité de transcrire ce qui a été fait en auditorium — on ne pourra pas avoir ce plaisir — il est inutile d’essayer de le réinventer, il y a là une vraie perte de temps. Comme nous parlions d’argent, il faut peut-être se dire qu’il est superflu de fabriquer des produits « inutiles » : consacrons plus de temps à ce qui sera vraiment utile. Plus de temps sur les œuvres de cinéma, qui ne seront réservées qu’à une écoute cinéma, et un autre temps pour les œuvres télévisuelles etc. C’est un grand débat, ça fabrique des doublons, mais j’attire l’attention que « bien pour tout le monde », ça veut dire, en fait, « mauvais pour tout le monde »…
Franck Ernould : Alexandre, tu travailles à la division musicale d’Europacorp. Tu es souvent confronté aux problèmes évoqués depuis le début de cette table ronde. Chez vous, sur les films, il existe d’autres mixages que le classique duo cinéma/télévision ?
Alexandre Mahout – Directeur des productions musicales de Europacorp : Oui, on décline en plus une version pour la VOD et une pour Internet. En streaming, les compressions sont différentes, il faut s’adapter. Effectivement, on parlait de 4 semaines de mixage et 2 jours de finitions : chez Europarcorp, depuis quelques années, on est plutôt sur 3 semaines 1/2 de mixage, et une vraie semaine de finitions.
Je suis un enfant de la stéréo, je viens du disque, je suis un invité dans l’auditorium de mixage film. Je travaille plutôt en studio musique, et je livre mon mixage 5.1 à l’auditorium de mixage. La Digital Factory est un véritable complexe de post-production, on y fait de l’étalonnage image : cinq auditoriums cinéma, un auditorium de bruitage, un auditorium de post-synchronisation, un studio musique avec un plateau d’enregistrement où je peux faire du rock ou du symphonique. Je livre mes musiques en 5.1, par exemple au grand auditorium 4, — qui fait plus de 2000 m³- et quand on aime l’image et le son, c’est vrai que c’est agréable.
Je ne suis pas technicien, j’ai écouté attentivement ce que vous avez dit, et la problématique qui revient tout le temps, chacun à sa manière, c’est « : Comment peut-on concilier le fait qu’on a des moyens techniques permettant de travailler avec de plus en plus de finesse, alors qu’il y a une multiplication des moyens de diffusion, de plus en plus souvent mobiles. Ce qui rend la qualité parfois médiocre : les enceintes d’un ordinateur portable, les écouteurs de téléphone portable donnent souvent un son pourri. A quoi bon ?
Quand j’étais dans le disque, on me disait souvent — c’est peut-être un peu cliché, ça va peut-être faire bondir : « Si le mixage sonne sur un radio-réveil, c’est qu’on a très bien mixé ! ». On allait souvent écouter nos mixages dans la voiture, sur une cassette, pour voir si ça sonnait bien. Si c’était pas terrible, on retournait à la console. Parce que, finalement, on n’écoutera jamais son CD dans un grand studio. C’est vrai que chez Europacorp, depuis trois ans et demi que je m’occupe des productions musicales, j’essaie de faire avancer l’idée de réaliser des mixages adaptés à chaque support de diffusion. J’ai une anecdote là-dessus. On s’occupe aussi de projets hors musique de film : je produis ainsi la musique des prochains indicatifs de l’UEFA, la coupe des clubs champions 2009. Sur son cahier des charges, le diffuseur demande vingt-sept mixages différents ! Enfin, pas tous différents, mais ce sont autant d’utilisations demandées. On a du streaming, en différents débits, de l’iPod, iPhone, etc. On est en studio, on mixe, après je monte chez moi, je passe le mixage sur mon ordinateur portable, pour voir comment il sonne. Ce qui a été dit est très juste — il est préférable de travailler avec le support de diffusion final. C’est assez amusant — c’est une contradiction d’ailleurs — d’être en studio, à mixer sur du matériel incroyable, et de se retrouver quelques minutes après à écouter le résultat sur un iPhone, de revenir, de le modifier et de repartir sur un autre mixage pour autre chose.
Il faut éviter le nivellement vers le bas. Je ne pense pas qu’à l’avenir, les films soient uniquement destinés à la salle de cinéma d’un côté, et exclusivement pour la télé ou l’iPhone, de l’autre. Ce serait dommage ! La norme devra être de préférence sur la salle de cinéma. Je pense à une anecdote qui m’a été racontée par des ingénieurs du son sur le film de Spielberg, Il faut sauver le soldat Ryan. Spielberg avait envoyé des émissaires un peu partout en Europe pour vérifier que les normes de diffusion étaient bien respectées dans les salles de cinéma. Normalement, on passe les films à un niveau de 7 sur le lecteur son, c’est la norme, mais sur ce film très dense d’un point de vue sonore, les exploitants avaient peur d’abîmer leur matériel et le passaient à 6 ou moins…
Alain Besse : Ces contrôles-là, on les fait régulièrement. La CST est souvent sollicitée pour les distributeurs américains. Si le potentiomètre n’est pas à 7, ce n’est pas tant pour préserver le matériel qu’à la demande des spectateurs eux-mêmes.
Effectivement, on n’a pas encore parlé du spectateur, aujourd’hui. Malheureusement, il a pris la très mauvaise habitude quand il regarde un film chez lui, de modifier sans cesse le niveau d’écoute, selon l’humeur de l’instant ou de son envie d’écoute. S’il regarde le Soldat Ryan chez lui, il va baisser le son pendant les vingt premières minutes, durant les scènes de guerre, quitte à remonter le niveau par la suite, plus classique.
Alexandre Mahout : C’est vrai, il y a aussi, peut-être, un cercle vicieux : les mixeurs, sachant que le son sera baissé en salle, ont à priori tendance à forcer un peu sur le niveau.
Dominique Schmit : Ce cercle vicieux n’a plus cours aujourd’hui. Nous, chez Dolby, nous refusons de masteriser la bande sonore du film si le niveau n’est pas à 7 au mixage, en auditorium. Depuis que cette décision a été prise, on a vu les niveaux devenir plus raisonnables.
Je voudrais juste rappeler que le cinéma est sans doute le seul support qui offre une vraie plage dynamique, donc une créativité pleine et entière. Il serait dommage de perdre ces possibilités créatives.
Je voudrais revenir sur les salles de cinéma. On disait qu’il y a beaucoup de mécontents dans une salle de cinéma. Même si la salle répond aux normes, en courbe de réponse comme en niveau sonore, la subjectivité entre toujours en jeu, ainsi que la connaissance du son. Les personnes qui règlent les salles sont en général des techniciens qui connaissent très bien leur travail, mais ce ne sont pas des gens du son. Pour obtenir une courbe, il y a différentes façons de procéder : la bonne et quinze mauvaises. Très souvent, quand je suis envoyé dans une salle, à la demande d’un distributeur ou d’un producteur pour écouter ce qui se passe, je mesure : c’est bon, puis j’écoute : c’est horrible. Alors je refais, en général, avec dix fois moins de corrections que ce qu’il y avait au départ.
Le son, influe sur la perception du spectateur, parce qu’il ne saura pas dire « : C’est mauvais en qualité », mais il dira « : C’est trop fort », dans le sens où il y aura de la distorsion par exemple. C’est pour cette raison que beaucoup de salles passent les films à un niveau relativement bas. Non parce que le niveau global du mixage du film était vraiment trop fort, mais parce que la qualité de la chaîne de reproduction installée est mauvaise, on entend de la distorsion. Les spectateurs qui ne connaissent rien à la technique, comprennent — quand il y a de la distorsion — que c’est trop fort. J’ai un exemple classique : le petit magnétocassette, qui, poussé à fond, peut être entendu de l’étage au-dessus, parce qu’il y a 250% de distorsion pour 0,5 W !
C’est un facteur important : les techniciens qui assurent la maintenance des salles ne sont pas toujours des experts en son, et malheureusement, les mixeurs