L’imagerie auditive

Claude Bailblé, 2005

L’imagerie audi­tive

Par Claude Bail­blé


1/ L’ouïe et la vue

Impli­ci­te­ment, toute image pro­cède de la vision. C’est dans l’œil que se forment les repré­sen­ta­tions des êtres et des choses et c’est dans la mémoire visuelle qu’elles se struc­turent, pos­si­ble­ment. L’imaginaire semble ain­si domi­né par la vue, du moins dans l’ex­pé­rience ordi­naire. Pour­tant, chaque moda­li­té sen­so­rielle trans­forme l’éner­gie exci­ta­trice reçue (lumi­neuse, chi­mique, ther­mique, tac­tile-motrice, acous­tique…) en sen­sa­tions bien carac­té­ri­sées. Ces sen­sa­tions hau­te­ment dif­fé­ren­ciées s’or­ga­nisent en images pri­maires dans des cor­tex spé­cia­li­sés. La per­cep­tion assemble de la sorte ces diverses images en une repré­sen­ta­tion uni­fiée, mul­ti-sen­so­rielle, voire sen­so­ri-motrice. Pour autant, l’i­mage visuelle pré­vaut, car elle a le pou­voir ordi­naire de se confondre dura­ble­ment avec l’ob­jet, ce qui lui assure un avan­tage déci­sif sur les autres ima­ge­ries, relé­guées le plus sou­vent à l’ac­tua­li­sa­tion pas­sa­gère ou très pro­vi­soire de telle ou telle pro­prié­té. C’est que la lumière enve­loppe les objets d’un flux conti­nu, accor­dé à l’objective per­sis­tance du monde.

Il s’en­suit que l’audible –en tant qu’imagerie rap­pro­chée à décrois­sance rapide– déchoit au rang d’indice tran­si­toire, tan­dis que le visible –en tant qu’imagerie à grande dis­tance constam­ment dis­po­nible– se sur­passe en “réel” hau­te­ment défi­ni. Le plan fron­tal appa­rent –bien que dépen­dant du point de vue auquel il s’a­dosse– paraît s’é­man­ci­per de l’optique ocu­laire (inter­po­si­tions, recou­vre­ments, décrois­sance) pour consti­tuer exac­te­ment un espace à trois dimen­sions. C’est à David Marr(1), neu­ro­phy­sio­logue amé­ri­cain, que l’on doit l’explication de ce pro­ces­sus visuel, dérou­lé en trois étapes.

Selon David Marr, la lumière scanne d’abord le champ-objet avant de rebon­dir dans toutes les direc­tions. La pupille de l’œil “sélec­tionne“ alors par­mi les rayons réflé­chis un fais­ceau inci­dent, fais­ceau pro­je­té en image bidi­men­sion­nelle sur le fond réti­nien. L’information prise par la lumière à la sur­face des choses devien­dra tex­ture, cou­leur, posi­tion, mou­ve­ment et tra­jec­toire, après ana­lyse cor­ti­cale de l’image réti­nienne. Une pre­mière mise en forme com­mence dès le fond de l’œil : c’est, pour David Marr, le stade 2D de la vision. A ce stade, la pel­li­cule réti­nienne ne “voit“ que des plages dif­fé­rem­ment éclai­rées, des tran­si­tions de lumière, et génère des contours séparateurs(2). Ces don­nées élé­men­taires, réti­no­to­piques, rejoignent le cor­tex via le nerf optique. Plu­sieurs modules per­cep­tifs, for­te­ment encap­su­lés –à faible péné­tra­bi­li­té cog­ni­tive— éta­blissent la posi­tion, les cou­leurs, le mou­ve­ment, le relief, la tex­ture et les ombres dans ce qui émerge comme scène visuelle pri­maire, égo­cen­trée en 2D et demi, selon la ter­mi­no­lo­gie éton­nante de David Marr. Qu’est donc le 2,5 D ? C’est l’étape inter­mé­diaire vers le 3D, mar­quée essen­tiel­le­ment par la pré­do­mi­nance du visuel en tant que tel, c’est-à-dire par l’aspect momen­ta­né, contin­gent et réduc­teur, subor­don­né au point de vue. Visuel­le­ment par­lant (en 2,5 D) vous n’apercevez que ce qui vous fait face, vous ne voyez pas les dos ; cer­tains objets en masquent d’autres, tota­le­ment ou par­tiel­le­ment.

Le pho­to­graphe repor­ter –qui tra­vaille en 2,5 D, mono­cu­laire de sur­croît– doit sau­tiller de tous côtés, à la recherche d’un arran­ge­ment opti­mal des appa­rences, d’une com­po­si­tion dis­tri­buée, d’une mise en pers­pec­tive (le fameux “ins­tant-déclic“ d’Henri Car­tier-Bres­son). La vision mono­cu­laire en 2,5 D est en effet for­te­ment res­tric­tive, figée dans un aspect égo­cen­tré. Il ne vien­drait du reste à l’idée de per­sonne de se pen­cher ou de se dépor­ter de côté pour voir ce que cache un avant-plan dans une image. D’où l’importance de la der­nière étape dite 3D, soit le moment où le point de vue égo­cen­tré dis­pa­raît, où les volumes réels se recons­ti­tuent en entier, cen­trés sur eux-mêmes, débar­ras­sés du carac­tère réduc­teur inhé­rent au 2,5 D.

Les don­nées visuelles sont fina­le­ment repro­je­tées à leur place exacte dans le champ-objet, comme si la lumière entrée en rétine était ren­voyée auto­ma­ti­que­ment à la source, pour se recol­ler à la sur­face des choses et enve­lop­per com­plè­te­ment les volumes, leur don­ner une taille adé­quate, une cou­leur sta­bi­li­sée, c’est-à-dire une exis­tence d’objet et non d’image. En d’autres termes, l’espace et ses volumes sont objec­ti­vés en vraie gran­deur, en exacte posi­tion : quand je conduis ma voi­ture, quand je des­cends un esca­lier, ça marche, je ne me casse pas la figure. Le « réel 3D » se confirme en effet à tout ins­tant par l’expérience tac­tile, hap­tique ou loco­mo­trice. Pour autant, un tel espace reste à inter­pré­ter : le déjà connu doit néces­sai­re­ment s’appliquer sur le per­çu.

Admet­tons alors l’objectivité de l’image pho­to­gra­phique [en termes spa­tiaux et lumi­neux] : quand un doua­nier vous réclame le pas­se­port, il voit la pho­to d’un visage incon­nu. Il est obli­gé de com­pa­rer l’original (vous en 3D) et la copie minia­ture (en 2,5 D com­pres­sée 2D) pour éta­blir une res­sem­blance et vali­der l’identité. Il com­pare en fait deux images : l’une, tra­vaillée par le cer­veau, est appe­lée « réel », l’autre est dénom­mée « signe ico­nique » ou même « ana­lo­gon ». Quand un chi­rur­gien remonte une artère avec son endo­scope, il faut espé­rer en l’objectivité spa­tiale et lumi­neuse de l’image-vidéo, seule guide pour le tra­vail des mains. L’image 2,5D conden­sée en mono­cu­laire 2D doit être cepen­dant inter­pré­tée avec habi­le­té pour y retrou­ver le 3D du « réel ».

Admet­tons alors aus­si la sub­jec­ti­vi­té de l’image [en termes d’interprétation ou de contexte], puisque la signi­fi­ca­tion qu’on lui prête dépend des états anté­rieurs de connais­sance, de mécon­nais­sance ou d’ignorance du sujet qui la regarde… Deux fois sub­jec­tive ! Une fois à la prise de vue, où le pho­to­graphe dis­pose d’un contexte (tant spa­tial que tem­po­rel) tout en étant mu par un pro­jet, une démarche. Une seconde fois à la res­ti­tu­tion, quand le spec­ta­teur, ne pou­vant s’appuyer sur les don­nées amont, aval ou à l’entour mais seule­ment sur l’entrelacs interne des figures et des fonds, sur la mise en pers­pec­tive hié­rar­chi­sée des pre­miers et des der­niers plans, sur l’axialité des visages et des corps, doit fina­le­ment pro­je­ter du sens en se basant sur des connais­sances directes ou indi­rectes.

Que l’on soit en 3D ou en 2,5 D, l’interprétation –si rapide soit-elle– est convo­quée : les appa­rences nous mènent aux réa­li­tés sous-jacentes, à un invi­sible caché/montré par le visible. Tout dépend du régime de visi­bi­li­té, soit de l’extériorisation ou de la conten­tion des don­nées internes. Ins­tan­ta­né­ment, nous inter­pré­tons un regard, un mou­ve­ment des lèvres, un haus­se­ment d’épaules. Nous éva­luons une confi­gu­ra­tion d’ob­jets, une situa­tion en mou­ve­ment ou en conflit. Mais l’intelligibilité du visible repose aus­si sur les savoirs issus du lan­gage, sur les décou­pages affec­tifs, sym­bo­liques ou concep­tuels propres à la culture. Une bonne part de la réa­li­té reste ain­si acces­sible aux aveugles, en rai­son du pou­voir qu’a le verbe de repré­sen­ter le monde, y com­pris dans ses don­nées sous-jacentes, dans ses rela­tions les plus cachées, inac­ces­sibles à la vue. Pour autant, par sa vitesse d’analyse, par la sai­sie ins­tan­ta­née des don­nées qui jalonnent ou tra­versent l’espace, l’œil s’empare du 3D comme d’un champ de pos­si­bi­li­tés pra­tiques, de déci­sions motrices ou tac­tiles –immé­diates ou dif­fé­rées– sans qu’il soit besoin de recou­rir à une parole des­crip­tive ou à un rai­son­ne­ment conscient. L’information visuelle, mas­si­ve­ment paral­lèle et conti­nû­ment rafraî­chie, libère la mémoire du sou­ci des posi­tions et des confi­gu­ra­tions en les­quelles pour­tant le non-voyant engage cha­cun de ses ins­tants. La céci­té oblige alors à « écou­ter » l’espace-temps, en uti­li­sant au mieux les pos­si­bi­li­tés de l’oreille et de la mémoire, en accep­tant l’information audi­tive telle quelle est : irré­ver­sible, séquen­tielle, incom­plète.

Si l’au­dible reflète en effet l’ac­ti­vi­té du monde envi­ron­nant, c’est seule­ment à une dis­tance réduite, limi­tée par la puis­sance ou l’in­ter­mit­tence des émis­sions sonores. L’é­coute du non-voyant est de la sorte pro­téi­forme et chan­geante, impré­vi­sible, tou­jours mena­cée d’in­com­plé­tude, alors que le regard du voyant se pose sur un déjà-là acces­sible, au près comme au loin. En revanche, l’i­ma­ge­rie audi­tive se fait omni­di­rec­tion­nelle (et non pas seule­ment fron­tale), et, mal­gré une por­tée limi­tée ou une briè­ve­té impré­vue, éner­gé­tique (de pia­nis­si­mo à for­tis­si­mo) et spec­trale (sur dix octaves), de sorte qu’elle excelle à rendre compte autre­ment des pro­ces­sus en jeu.

Car l’audible est éner­gé­ti­que­ment repré­sen­ta­tif du dehors et même du dedans des choses. A l’extérieur : frot­te­ments, arti­cu­la­tions, per­cus­sions de contact, forces et mou­ve­ments. Le pro­fil éner­gé­tique peut repré­sen­ter et détailler –en pre­nant son temps– une action pré­cise. A l’intérieur : les réso­nances indiquent d’invisibles cavi­tés ; la masse révèle les dimen­sions du corps sonore ; la den­si­té spec­trale tra­duit l’intensité mise en jeu ; la qua­li­té des tran­si­toires tra­duit la sou­plesse ou la rigi­di­té des maté­riaux ; les for­mants ren­seignent sur la matière en vibra­tion. On se sou­vient du sté­tho­scope –tou­jours actuel– et des pré­cieux ren­sei­gne­ments qu’il donne sur le cœur ou la respiration(3). Tout dépend du trans­fert méca­no-acous­tique d’informations : la sono­ri­té, le grain, le contour, la pro­fon­deur de modu­la­tion, la masse, le timbre révèlent l’objet-source d’une manière plus ou moins forte, plus ou moins claire.

Par­ler des bruits, c’est évi­dem­ment par­ler de nous, les humains, ani­maux à parole, voyants et non-voyants : souples et silen­cieux, nous ne fai­sons du bruit qu’en entrant en contact avec les êtres et les choses.

2/ Le réel, le sonore et l’imagerie audi­tive

Issue des vibra­tions méca­niques (le réel), l’émission acous­tique (le sonore) atteint l’oreille, où s’é­prouve la poly­es­thé­sie audi­tive (grain, masse, hau­teur, contour…), reliée aux autres qua­lia du sen­so­rium humain (cou­leur, tac­ti­li­té, mou­ve­ment, cha­leur…). L’évènement sonore enclenche une image –pas seule­ment visuelle, comme on le ver­ra– aus­si­tôt rap­por­tée à son ori­gine, à la fois spa­tiale et tem­po­relle : un mou­ve­ment rou­ti­nier, un inci­dent, les phases d’un pro­ces­sus. Une fois iden­ti­fié, l’objet-source “accroche“ une repré­sen­ta­tion supra-audi­tive, assor­tie de pro­prié­tés pra­tiques en deve­nir. Cepen­dant l’a­van­cée inces­sante des don­nées –tant visuelles qu’auditives– amène à de nou­velles infé­rences, à de nou­velles pro­jec­tions. Mues par un prin­cipe de déve­lop­pe­ment tem­po­rel, ces pos­tu­la­tions –à peine conscientes– s’in­sèrent ipso fac­to dans la chaîne des causes et des consé­quences, dans un jeu de traces et d’at­tentes.

Inter­mit­tente, conti­nue ou iso­lée, l’é­mis­sion acous­tique reflète néces­sai­re­ment une cause éner­gé­tique : natu­relle (tem­pête, bord de mer…), sociale (cir­cu­la­tion, tra­vaux…) ou domes­tique (bouilloire, son­ne­rie…) La plus inté­res­sante est l’ac­ti­vi­té humaine : d’or­di­naire souple et silen­cieuse, l’éner­gie bio-mus­cu­laire se fait entendre à tra­vers un bruit (choc, réso­nance, frot­te­ment…) plus ou moins intense, lequel déclenche en retour l’é­coute cau­sale. Le maté­riau sonore est comme oublié dans le “pour­quoi” de son émis­sion acous­tique : le geste volon­taire ou invo­lon­taire. Il n’en est pas moins effi­cient, par son timbre, son grain, son pro­fil éner­gé­tique, sa “fac­ture”. Epais ou léger, grave ou aigu, lisse ou gre­nu, per­cu­té ou réso­nant, le son marque l’au­di­teur par une emprise sen­so­rielle (poly­es­thé­sique) pour mieux figu­rer la chaîne cau­sale d’où il pro­cède. En prin­cipe, il suf­fit que le maté­riau sonore et sa fac­ture dési­gnent clai­re­ment l’éner­gie motrice (la cause des vibra­tions) et le point d’ap­pli­ca­tion (l’ob­jet bruis­sant). Mais comme le son est éphé­mère, (par­fois très bref, sou­vent pas­sa­ger), l’image audi­tive laisse der­rière elle l’ombre d’un silence, cette sorte de silence qui prête au doute ou au sus­pens. Ou alors le son est ponc­tuel (par­fois très loca­li­sé, sou­vent frag­men­taire) et l’image audi­tive ne repré­sente que très par­tiel­le­ment l’objet-source. Quelqu’un a remué un objet, fait quelques pas… On a iden­ti­fié une pré­sence, une pré­sence vivante, réser­voir d’intentions diverses, prêtes à s’actualiser.

Il est vrai que le sonore ne reflète la cause phy­sique qu’à tra­vers un mode de pro­duc­tion méca­no-acous­tique (m.d.p.m.a). Per­cus­sion gaz sur gaz (air com­pri­mé, déto­na­tions); gaz sur solide (sons éoliens) ; liquide sur liquide (gouttes de pluie dans une flaque); solide sur liquide (rames dans l’eau); solide sur solide (mar­teau, chocs de toutes sortes)… Y ajou­ter les états inter­mé­diaires (mou, vis­queux, gra­nu­leux…). Pour­suivre avec les frot­te­ments (micro-per­cus­sions rap­pro­chées en tex­ture), les arti­cu­la­tions (actions com­po­sites ou démul­ti­pliées) et les réso­nances éven­tuelles (for­mants acous­tiques, réac­ti­vi­té de l’ob­jet). Il y a donc une infi­ni­té de “m.d.p.m.a“, qui tous appellent une “contre-lec­ture inverse“, allant cette fois de l’acoustique à la méca­nique. Tchoc, bzzzz, plouf, drr­ring, iiii-tonk !, vrâooummm… D’où une cer­taine impré­ci­sion, pro­pice à l’incertitude, voire au fan­tasme.

Il est inté­res­sant de faire un détour par le ciné­ma : ce dis­po­si­tif, en rétré­cis­sant le monde sen­so­ri-moteur aux deux dimen­sions de l’ouïe et de la vue (et même à une seule dans le cas du son-off) “s’approche“ para­doxa­le­ment de la réduc­tion sen­so­rielle qu’opère la céci­té. Cer­tains cinéastes ont su accom­mo­der le rap­port image acous­ti­que/ob­jet-source et sou­le­ver ain­si les puis­sances de l’imaginaire –sinon de la consti­tu­tion hypo­thé­tique via la sup­pléance men­tale– grâce au réglage du flou et du net dans l’image audi­tive. Mais après avoir recon­nu l’objet (par­tiel­le­ment ou com­plè­te­ment) le spec­ta­teur doit encore recons­ti­tuer ou atteindre la cause, et iden­ti­fier, à tra­vers le “geste ins­tru­men­tal” (l’enveloppe dyna­mique du son, l’énergie mise en jeu), le fac­teur déclen­chant.

3/Le régime d’au­di­bi­li­té

Com­ment l’i­mage sonore émise à l’entour repré­sente-t-elle à la fois l’objet mis en vibra­tion et, aus­si bien, le pro­ces­sus cau­sal de cette mise en vibra­tion ? Avec cette pre­mière ques­tion, on atteint déjà à la com­plexi­té du monde audi­tif. Tout d’abord, on ne peut igno­rer la diver­si­té des modes de pro­duc­tion méca­no-acous­tiques [m.d.p.m.a.] évo­quée ci-des­sus : ampli­tude, vitesse, durée, mode d’attaque de « l’agent cau­sal » sur l’objet, réac­ti­vi­té de cet objet, cou­plage à l’air ambiant.

Ain­si l’imagerie éolienne [soit le frot­te­ment d’un gaz sur des solides ou des liquides] consti­tue­rait à elle seule un sous-ensemble de l’imagerie audi­tive. Le vent violent, le zéphyr léger, la bour­rasque, le cou­lis, les tur­bu­lences, sont autant de modes d’attaque, vers l’huis entre­bâillé des portes, à la sur­face de la mer, au tra­vers des bran­chages et des arbres, ou même des fils élec­triques, pour ne citer qu’eux. Tout autre est l’imagerie des écou­le­ments liquides, de la pluie (per­cus­sion des gouttes sur les sur­faces solides ou liquides) au bruit des tuyaux et des cana­li­sa­tions. Cer­tains objets sont “atta­qués“ simul­ta­né­ment sous plu­sieurs modes : aux frot­te­ments des pneus sur la route (sèche ou mouillée) s’ajoutent le régime du moteur (stable, en accé­lé­ra­tion ou décé­lé­ra­tion) modu­lé par l’éloignement ou le rap­pro­che­ment (effet dop­pler). Autant de contre-lec­tures pos­sibles !

En second lieu, on peut s’in­ter­ro­ger aus­si sur la manière dont la sur­face émis­sive –ponc­tuelle, plu­ri-ponc­tuelle ou éten­due– rend compte du volume entier de l’ob­jet (mode de repré­sen­ta­tion spa­tial), et même sur la façon dont la durée de l’é­mis­sion –fur­tive, en poin­tillés– rend compte de la lon­gueur, de l’in­ter­mit­tence, ou de la briè­ve­té du pro­ces­sus réel (mode de repré­sen­ta­tion tem­po­rel).

Ain­si le mode de repré­sen­ta­tion spa­tial se donne à tra­vers dif­fé­rents cas de figure : l’ob­jet est repré­sen­té par un frag­ment (synec­doque), en par­tie, ou tota­le­ment (exemple : le frot­te­ment-per­cus­sion de la cuiller sur les bords de la tasse) ; l’émission est simple (ponc­tuelle, sur­fa­cique), com­po­site (mul­ti-ponc­tuelle, plu­ri-sur­fa­cique), ou entière ; l’émission est homo­gène (sons sem­blables, de même nature) ou hété­ro­gène (sons mul­tiples et dif­fé­rents) ; la source est décom­po­sable en plu­sieurs seg­ments arti­cu­lés (co-modu­lés) ou indé­pen­dants (dis-modu­lés), émet­tant syn­chro­ni­que­ment ou en déca­lé ; l’émission est figu­rale (son écorce ou son coque), intra-figu­rale (état interne), confi­gu­rale (entre­choc), extra-figu­rale (sol­li­cite l’a­cous­tique des lieux) ou mixte (mélange des sources) ; l’émetteur est en mou­ve­ment ou fixe (posi­tion, vitesse, direc­tion, tra­jec­toire).

Le son repré­sente en outre, dans son décours, la diver­si­té des causes éner­gé­tiques mises en jeu. Mais cette repré­sen­ta­tion –sou­vent incom­plète, inégale, frag­men­tée– ne reflète pas linéai­re­ment les forces en pré­sence, à pro­por­tion de leur impor­tance. Ain­si la cuiller tour­nant dans la tasse devrait repré­sen­ter toutes les phases de la dégus­ta­tion d’un café ! Cer­taines s’activent en silence (mou­ve­ments humains), d’autres sont très bruyantes, non modu­lables (chutes d’objets).

En sorte qu’il est impos­sible d’aborder le mode de repré­sen­ta­tion tem­po­rel sans exa­mi­ner –de quelque manière– le chro­no­gramme ordon­né des éner­gies mises en jeu, et, consé­quem­ment, le pas­sage du monde phy­sique au monde acous­tique. Complexe(4)! On peut cepen­dant avan­cer l’é­vi­dence mini­male d’une tri-cau­sa­li­té : action, réac­tion, champ de pesan­teur. “Pous­ser une porte” implique une éner­gie poten­tielle (vaincre l’i­ner­tie, la masse), une éner­gie ciné­tique (sto­ckée par la masse dans une vitesse), une éner­gie réac­tive (rebond sur un butoir ou sur le mur) et un frot­te­ment (audible ou non sur les gonds), dû au poids de la porte… Trois types de causes, donc, déter­mi­nant en bonne part le résul­tat sonore.

“Sor­tir ses clefs, ouvrir la ser­rure, pous­ser la porte et la refer­mer” implique une suc­ces­sion de sons dont cer­tains sont inau­dibles (trop faibles), et donc appe­lés “silences” (quand ils ne sont tout sim­ple­ment mas­qués par les plus forts) et d’autres très saillants, selon le cou­plage, ou le trans­fert de la méca­nique vers l’acoustique. Cha­cune des émis­sions sonores est en effet reliée à la réa­li­té par­ti­cu­lière des forces co-agis­santes et réagis­santes. L’agent actif (durée, régu­la­ri­té, rythme, mou­ve­ment propre) se déploie en une ou plu­sieurs phases, écour­tées, sus­pen­dues, arti­cu­lées, en cas­cade… L’agent réac­tif (masse, rai­deur, sou­plesse) se fait entendre –élas­tique ou amor­ti– par des frot­te­ments, des per­cus­sions, des rebonds, des réso­nances… L’agent per­ma­nent (la pesan­teur) ajoute sa propre dyna­mique : glis­se­ment pro­gres­sif, chute, écla­te­ment, impacts mul­tiples … etc.

Enfin l’objet-source fait entendre ses pro­prié­tés acous­tiques : masse, cavi­tés, état de sur­face, fra­gi­li­té, volume, défor­ma­tions élas­tiques ou irré­ver­sibles, roulement…etc. On devrait pou­voir recon­naître aus­si bien la dure­té rela­tive d’une baguette qui frappe des cas­se­roles, l’énergie du geste frap­peur et aus­si bien la taille des dites cas­se­roles. On devrait aus­si presque « entendre la forme » d’un tam­bour… Tout dépend –on va le voir– de l’expérience pra­tique.

Une autre ques­tion vient alors néces­sai­re­ment à l’esprit. Com­ment l’événement phy­sique –déjà “réécrit“acoustiquement– se trouve-t-il“retranscrit“ – sen­so­riel­le­ment , cette fois– par l’appareil audi­tif ? Regar­dons le tym­pan et la petite mem­brane spi­rale logée dans le lima­çon de l’oreille interne. Tout n’est pas retrans­crit, loin s’en faut ! Si cer­tains domaines de fré­quences et d’intensités sont mieux tra­duits que d’autres, on n’entend jamais le spectre de puis­sance d’un son(5), mais seule­ment l’ensemble des hau­teurs démas­quées, com­mu­né­ment appe­lé timbre

Le plus impor­tant, me semble-t-il, réside dans l’incroyable “tra­duc­tion“ de l’onde cochléaire (ini­tia­le­ment fré­quences et inten­si­tés sur site bio-élas­tique) en qua­lia, c’est-à-dire en “éprou­vés sen­sibles“ hau­te­ment dif­fé­ren­ciés (masse, grain, hau­teur, timbre, allure, pro­fil dyna­mique, etc…) dont Pierre Schaef­fer –le pre­mier– dres­sa la liste, allant jusqu’à pré­ci­ser les cor­ré­lats phy­siques de ces dif­fé­rents res­sen­tis, à la base du sen­so­rium audi­tif. L’apport qua­li­ta­tif et dif­fé­ren­cia­teur de ces divers éprou­vés sen­sibles –au delà d’une simple trans­duc­tion des fré­quences et des inten­si­tés– est si consi­dé­rable que les pertes en quan­ti­té ou qua­li­té– dues aux effets de masque– passent qua­si-inaper­çues, du moins tant que l’intelligibilité n’est pas mena­cée. Heu­reux qua­lia ! Bien com­bi­nés, ils donnent accès aux plai­sirs de l’ouïe.

Regar­dons un peu plus haut, vers le cor­tex : l’assemblage des qua­lia donne nais­sance à des objets spa­tiaux que nous construi­sons par regrou­pe­ment et sépa­ra­tion des données(6), tan­dis que nous éta­blis­sons des rela­tions de conti­nui­té entre évè­ne­ments sépa­rés par des laps (quelques secondes, minutes ou heures), jusqu’à struc­tu­rer ou sous-struc­tu­rer le temps en de mul­tiples flux, glo­baux ou momen­ta­nés. On pense aux théo­ries de la Ges­talt, appli­quées cette fois à l’au­di­tion.

Les ins­tants sonores suc­ces­sifs s’as­semblent en figure-flux tem­po­relle, figure qui se pré­cise ou se délite dans la durée, se déve­loppe ou s’in­ter­rompt par moments, non sans avoir “ima­gé“ ses infé­rences, vers l’a­mont (causes) ou vers l’a­val (consé­quences). De fait, le grin­ce­ment d’une porte n’est pas écou­té pour lui-même, ni même seule­ment diri­gé vers sa cause (la per­sonne qui entre ou sort) mais tout aus­si­tôt orien­té vers l’instant sui­vant, comme accom­plis­se­ment consé­quent de l’instant pré­sent. On “voit” la nou­velle situa­tion se pro­fi­ler, avant de la consta­ter visuel­le­ment dans les faits.

En même temps, les rela­tions inter-évè­ne­ments –le contexte– induisent un cadre inter­pré­ta­tif géné­ral, qui (ré)oriente la com­pré­hen­sion de cha­cune de ces figures-flux. D’autant que l’ouïe reçoit l’aide puis­sante de la vue, et qu’il est absurde d’imaginer une sépa­ra­tion entre les deux champs de per­cep­tion. Si l’imagerie audi­tive apporte ses propres qua­lia, c’est pour rejoindre ceux de la vision (contour, cou­leur, tex­ture, mou­ve­ment, etc…), et plus lar­ge­ment ceux des autres sens (et même ceux –effec­teurs ou pro­prio­cep­teurs– de la motri­ci­té) en rai­son du mélange poly­es­thé­sique à l’œuvre dans les repré­sen­ta­tions humaines. Sans doute est-il impos­sible de se repré­sen­ter une situa­tion sonore d’un seul coup, ins­tan­ta­né­ment, sans pro­fi­ter d’une inter­ac­tion forte avec d’autres don­nées, internes ou externes, pro­prio ou exté­ro­cep­tives. Il s’ensuit que des savoirs visuels imprègnent les per­cep­tions de l’ouïe (la constance d’objet, par exemple, pen­dant les inter­valles silen­cieux) tan­dis que des savoirs non visuels imprègnent les per­cep­tions de la vue (invi­sible, un son creux appelle un ima­gi­naire de sup­pléance). En réa­li­té, en matière d’audition, une bonne part de la per­ti­nence inter­pré­ta­tive (attri­buts cog­ni­tifs ou affec­tifs prê­tés aux sources sonores) pro­vient de savoirs anté­rieurs expé­ri­men­tés et de l’appréciation adé­quate du contexte, puisqu’il faut entrer dans un jeu de pos­tu­la­tions reliant l’ins­tant pré­cé­dent à l’ins­tant sui­vant, le lieu actuel au lieu ulté­rieur, tout en révi­sant conti­nû­ment la chaîne des causes et des effets.

Il n’empêche. Pour repro­je­ter vers l’objet-source tous ces attri­buts, toutes ces infé­rences, il est essen­tiel de le recon­naître ! Or, si l’on tota­lise l’ensemble des trans­for­ma­tions sous­trac­tives qui vont de l’événement phy­sique réel à sa mise en forme acous­tique (par­fois proche du silence), et de l’événement sonore (à son appa­raître audi­tif (enta­mé par les effets de masque, sinon par les bruits ambiants), l’audibilité appa­raît géné­ra­le­ment rétré­cie par cette double réduc­tion. L’é­lu­ci­da­tion audi­tive est très sou­vent contra­riée par l’é­phé­mère, le pas­sa­ger, l’épars, soit par un régime d’audibilité quelque peu obscur(7). Fina­le­ment on se demande com­ment, avec si peu d’informations émer­gentes, un audi­teur réus­sit à recon­naître un son, condi­tion préa­lable –redi­sons le– de toute inter­pré­ta­tion signi­fi­ca­tive, comme de toute mise en chaîne cau­sale.

On a déjà aper­çu les avan­tages [dif­fé­ren­cia­teurs] que l’on peut attendre des qua­lia. Un autre fac­teur –très impor­tant, et assez mécon­nu– faci­lite la recon­nais­sance audi­tive : la motri­ci­té cor­po­relle. L’œil écoute, certes, mais aus­si bien, le corps entend. Un pas­sage par la motri­ci­té s’impose donc, en com­men­çant par la parole.

4/ De la parole en par­ti­cu­lier et du mou­ve­ment en géné­ral.

Pour iden­ti­fier et recon­naître un son, il suf­fi­rait, pense-t-on, de détec­ter et d’extraire cer­tains traits per­ti­nents, cer­tains indices. Les uns relè­ve­raient de l’en­ve­loppe éner­gé­tique (pro­fils d’at­taque ou d’ex­tinc­tion, ampli­tude, allure, durée), les autres du conte­nu spec­tral (den­si­té, hau­teur et posi­tion des for­mants, fluc­tua­tions du spectre).

Cepen­dant le monde des vibra­tions, on l’a vu, n’est pas direc­te­ment audible en tant que tel. Il se reflète en qua­lia, sorte d’atomes sen­so­riels dont le regrou­pe­ment molé­cu­laire abou­tit à la figure-flux, à la fois image (par ses qua­lia com­bi­nés) et objet spa­tio-tem­po­rel (en rai­son de sa repro­jec­tion exacte en 3D). Ain­si la masse, le pro­fil, la hau­teur, le grain, le timbre semblent appar­te­nir à l’objet-source, alors qu’ils ne sont que les “trans­crip­tions phé­no­mé­nales“ des vibra­tions par­ve­nues aux tym­pans ! Ces trans­crip­tions semblent néan­moins plu­tôt robustes et assez bien cor­ré­lées aux pro­prié­tés méca­no-acous­tiques de la source en acti­vi­té. En se reliant par ailleurs à d’autres sen­sa­tions et infé­rences, l’auditeur accède à une repré­sen­ta­tion mul­ti­mo­dale plus com­plète, asso­ciée aux pro­prié­tés pra­tiques de l’objet, recru­tées et orien­tées par le contexte.

Il appa­raît aujourd’­hui que l’ex­trac­tion des indices pro­cède de deux sys­tèmes com­plé­men­taires : l’un aus­culte le pro­fil tem­po­rel, l’autre le timbre. Cette dua­li­té “contour-matière” n’est pas sans rap­pe­ler la vieille dis­tinc­tion “mor­phê-hulê”, chère aux phi­lo­sophes de l’antiquité. Plus clai­re­ment, le cor­tex (pré)moteur exa­mine la dyna­mique tem­po­relle, la masse évo­lu­tive et l’énergie en mou­ve­ment, tan­dis que le cor­tex audi­tif s’intéresse davan­tage au timbre, au grain, à l’emplacement et la cou­leur des sons. Il y a une ori­gine à ce double par­cours : tous les sons que nous pro­dui­sons –et que nous enten­dons, ipso fac­to– sont cor­ré­lés à notre acti­vi­té motrice : la marche, l’effort mus­cu­laire, le manie­ment d’outils ou d’instruments de musique, et bien enten­du, la voix, le cri, le chant.

Ain­si l’influx pho­na­toire et l’influx audi­tif se régulent-ils mutuel­le­ment pour sta­bi­li­ser une parole pré­cise, grâce à un réseau d’interneurones sen­so­ri-moteurs, jusqu’à obte­nir l’intonation et le phra­sé inten­tion­nés. Le vou­loir-dire est exac­te­ment ajus­té, en sorte que le geste vocal devient aus­si impor­tant que le texte pro­pre­ment dit. Le ton, les accents, le rythme d’un pro­pos sont par­fai­te­ment res­sai­sis par l’auditeur, sim­ple­ment parce qu’étant lui aus­si locu­teur, ils cor­res­pondent à des gestes vocaux déjà vécus et mémo­ri­sés, ou à des pro­fils d’expression déjà éprou­vés au moment de par­ler.

Une théo­rie, née aux Etats-Unis dans les années 50, sous l’impulsion d’Alvin Liber­man, a explo­ré ce domaine. La théo­rie motrice de la parole per­çue [ou TMPP] éta­blit que la per­cep­tion de la parole ne doit pas être recher­chée seule­ment dans la “sur­face acous­tique“ des mots, mais aus­si dans la “struc­ture arti­cu­la­toire sous-jacente“. La chaîne par­lée tient en effet en une série de pas­sages : du geste inten­tion­nel à la com­mande motrice, de la com­mande motrice aux dépla­ce­ments d’articulateurs (langue, mâchoires, lèvres), avec pour résul­tat final une parole. Il s’agit alors, pour esti­mer les gestes inten­tion­nels à par­tir du son pro­fé­ré, de faire le che­min inverse, c’est-à-dire de faire dépendre la recon­nais­sance vocale tant du cor­tex (pré)moteur, memen­to-agen­da de gestes vocaux bien connus, d’articulations apprises, que du cor­tex audi­tif, réper­toire de syl­labes et de voca­li­sa­tions.

Si le che­min direct (du geste à la parole) est bien spé­ci­fié par la théo­rie, le che­min inverse (de la parole au geste) pose encore quelques dif­fi­cul­tés aux cher­cheurs. Cela étant, une récente théo­rie vient com­plé­ter et élar­gir la TMPP, autour du concept de « neu­rones-miroirs » appli­qué aux mou­ve­ments du corps humain. Pour­quoi, lors­qu’on voit quel­qu’un prendre un verre d’eau et le sou­le­ver, en déduit on auto­ma­ti­que­ment qu’il a soif et qu’il va boire ? Pour­quoi inter­pré­tons-nous si jus­te­ment le jeu d’acteur, qu’il s’agisse du regard, du visage ou des atti­tudes cor­po­relles ? Sans doute, parce qu’acteurs nous-mêmes, ce que nous voyons des agis­se­ments d’autrui –la “sur­face visuelle“ en mou­ve­ment– va se réflé­chir aus­si dans le sché­ma cor­po­rel, soit dans la “struc­ture arti­cu­la­toire sous-jacente“…

En 2001, des cher­cheurs de l’u­ni­ver­si­té de Parme ont mon­tré que le seul fait de regar­der des mou­ve­ments de la bouche, des mains ou des pieds, active des zones impli­quées dans l’exé­cu­tion de cha­cun de ces mouvements(8). En d’autres termes, l’analyse des mou­ve­ments humains dépend tout autant du cor­tex visuel que du cor­tex (pré)moteur, lequel “connaît“ – de mémoire motri­cienne– les règles pra­tiques qui contraignent nos gestes, et aus­si bien les phases suc­ces­sives d’une action. “C’est ce que j’ap­pelle des repré­sen­ta­tions par­ta­gées, pré­cise Jean Dece­ty, cher­cheur en neu­ros­ciences. Un même réseau neu­ro­nal (dans le cor­tex pré­mo­teur et parié­tal) s’ac­tive lorsque je vois autrui agir, lorsque j’i­ma­gine cette action et lorsque j’a­gis moi-même”.

L’idée –pas si spé­cu­la­tive– serait alors de géné­ra­li­ser le concept de « neu­rones-miroirs » à l’ensemble les rela­tions sen­so­ri-motrices, en l’appliquant en par­ti­cu­lier au domaine sonore. En sorte que tous les sons issus de l’activité cor­po­relle, et plus pré­ci­sé­ment ceux issus des pra­tiques conso­li­dées, seraient dou­ble­ment mémo­ri­sés, et donc dou­ble­ment recon­nais­sables, soit par leurs qua­lia, soit par leur pro­fil énergétique/temporel. A la fois audi­tifs et moteurs, ces sons ne souf­fri­raient plus la moindre approxi­ma­tion de timbre ou de jeu, car toute for­mule acous­tique inexacte serait confron­tée à la pré­ci­sion avé­rée de la “mémoire motri­cienne“ (ou pro­cé­du­rale), à laquelle se rat­tache la jus­tesse et la véri­té de nos actes, qu’ils soient volon­taires ou involontaires(9).

On pour­rait sug­gé­rer dans ces condi­tions une autre façon de clas­ser les sons : il y aurait ceux –très pré­cis– qui rentrent dans notre expé­rience sen­so­ri-motrice (tac­tile, hap­tique, loco­mo­trice); ceux –moins évi­dents– qui se rap­portent à des sources vues et enten­dues mais sans écho par­ti­cu­lier dans notre pra­tique ; d’autres encore, qui ne ren­voient qu’à une expé­rience audi­tive (sons noc­turnes ou inac­ces­sibles à la vue) ; ceux , enfin –inouïs ou incon­nus– qui convoquent un ima­gi­naire fon­dé sur l’association ou la res­sem­blance.

5/ La dimen­sion motrice

A la fois orga­ni­sée et orga­ni­sante (selon la for­mule de Pia­get), la machine ner­veuse se dis­tingue par deux formes de “dia­logue”: l’un, immé­diat et direct, sen­so­ri-moteur, pris dans les contraintes de l’en­vi­ron­ne­ment et l’autre, cog­ni­tif, opé­rant sur les repré­sen­ta­tions figu­ra­tives ou sym­bo­liques des réa­li­tés phy­siques, libé­ré des contin­gences de l’ins­tant. Corol­lai­re­ment, deux moda­li­tés de ges­tion motrice se dis­tinguent : l’une “réac­tive”, devant répondre aux sol­li­ci­ta­tions immé­diates de la situa­tion, et l’autre “pré­dic­tive”, échap­pant à la réac­ti­vi­té immédiate(10).

Alors que la moda­li­té réac­tive semble se rat­ta­cher tout natu­rel­le­ment à un réper­toire sta­bi­li­sé de pré­dis­po­si­tions et d’ha­bi­tudes (variables d’un indi­vi­du à l’autre), la moda­li­té pré­dic­tive parait devoir requé­rir un cer­tains nombre d’in­fé­rences (encore plus diver­si­fiées), han­tées par la fra­gi­li­té du sou­ve­nir. Le set atten­tion­nel (expec­ta­tions) et le set moteur (stra­té­gies, pla­ni­fi­ca­tion de l’ac­tion) col­la­borent à la déci­sion motrice, en géné­rant une esquisse, une repré­sen­ta­tion interne du mou­ve­ment inten­tion­né, abso­lu­ment néces­saire au déclen­che­ment de l’ac­tion. C’est jus­te­ment cette repré­sen­ta­tion interne –esquis­sée mais pré­cise– qui, au ciné­ma, accom­pagne et sur­ligne le mou­ve­ment des per­son­nages, en une sorte de pré­sent élar­gi.

Pre­nons l’exemple d’un banal son off –acous­ma­tique (11)– tel qu’un bruit de pas. Banal en appa­rence ! En réa­li­té, très humain, très ins­crit dans l’expérience quo­ti­dienne. Trop pré­cis en tout cas pour être relé­gué dans les approxi­ma­tions d’un “son d’ambiance“. Car ce bruit de pas déclenche sept images plus ou moins conscientes : 1/ la chaus­sure (savate, bas­ket, mocas­sin, talon-ver­tige…), 2/ le sol (gra­vier, gadoue, maca­dam, par­quet…), 3/ l’a­cous­tique des lieux (plein air, trot­toir, local petit ou grand, réver­bé­rant ou feu­tré…), 4/ la per­sonne (qui marche ?), 5/ le jeu (avec déter­mi­na­tion, fur­ti­ve­ment, en traî­nant les pieds ou d’un bon pas, en tré­bu­chant…), 6/ la pro­ve­nance (d’où vient-elle ?), 7/ la des­ti­na­tion (où va-t-elle ? quelles sont ses inten­tions ?).

Ces dif­fé­rentes images n’ont évi­dem­ment pas le même poids, le même reten­tis­se­ment (12).

Les deux pre­mières (et la cin­quième aus­si bien) dépendent des com­pé­tences per­cep­tives et motrices de l’au­di­teur. Il s’a­git d’o­pé­rer une lec­ture inverse du mode de pro­duc­tion méca­no-acous­tique , opé­ra­tion d’au­tant plus facile que la marche pro­cède d’une pra­tique rou­ti­nière. Habi­tué à entendre le rythme de ses pas cor­ré­lé à ses inten­tions motrices (plus ou moins conscientes), le spec­ta­teur “décode” le frot­te­ment, la per­cus­sion et la sono­ri­té qui en résultent pour faire sur­gir la charge inten­tion­nelle qui leur cor­res­pond.

Il en va sans doute ain­si de toutes les acti­vi­tés bio-mus­cu­laires cou­rantes : les « neu­rones-miroirs » éta­blissent des cor­ré­lats réver­sibles entre influx moteurs (éner­gie ges­tuelle, enchaî­ne­ments) et influx audi­tifs résul­tants (dyna­mique sonore, for­mants, rythme) comme autant d’au­to­ma­tismes cog­ni­tifs héri­tés de l’ex­pé­rience. Et ces cor­ré­lats sont, somme toute, assez solides : on se trompe rare­ment sur l’in­ten­tion échap­pée d’un geste, même s’il est invo­lon­taire. La façon de mar­cher est fina­le­ment enten­due comme un jeu d’ac­teur, por­teur d’in­ten­tions (pré-)conscientes.

La troi­sième image dépend des com­pé­tences audi­tives : il s’a­git de relier l’a­cous­tique des sons réflé­chis au dimen­sion­ne­ment du lieu. Faute d’ap­pren­tis­sage adé­quat, les réflexions pré­coces, le traî­nage, la durée colo­rée de la réver­bé­ra­tion sont plus res­sen­tis qu’u­ti­li­sés comme mesu­rage spa­tial. Le spec­ta­teur est obli­gé de se rabattre sur ce qu’il voit à l’é­cran et de l’ex­tra­po­ler vers l’es­pace off.

La qua­trième, la sixième et la sep­tième images dépendent du contexte. Qu’a-t-on déjà vu de ce per­son­nage ? Une sil­houette, un visage, une action entière ? Mar­chait-il déjà dans le plan pré­cé­dent ? Avait-il– annon­cé son départ ou son pas­sage ? Que sait-on de lui ? A l’é­vi­dence, il s’a­git là d’un réglage mémo­riel appor­té par la mise en scène. Mémoire des situa­tions et de leurs enjeux, mémoire des per­son­nages, de leurs dési­rs et inten­tions. Pos­si­bi­li­tés, hypo­thèses, infé­rences diverses. C’est dire à quel point les connais­sances préa­lables du spec­ta­teur, en se pro­je­tant sur l’ac­tion, par­ti­cipent aus­si à la com­pré­hen­sion du film, sans qu’il soit néces­saire de tout expli­quer.

Quand “l’évènement audi­tif” ne s’origine plus de la marche, mais de gestes met­tant en jeu des acces­soires ou des tru­che­ments incon­nus, la mémoire motri­cienne sol­li­ci­tée par les neu­rones-miroirs res­tent muette : com­ment recon­naître –tou­jours en off– une glis­sade à skis ou un geste ins­tru­men­tal, sans la pra­tique cor­res­pon­dante ? Com­ment com­prendre les mouvements/bruits d’autrui si on ne les a jamais effec­tués soi-même ? Cer­tains films ont construit un sus­pense sur l’impossibilité d’identifier un son, dont l’allure –soi­gneu­se­ment construite – semble éma­ner cepen­dant d’un humain. Seul un pas­sage syn­chrone à l’é­cran per­met­tra au spec­ta­teur d’at­te­ler une cor­ré­la­tion forte et durable entre l’image (enfin vue) et la source (déjà enten­due). C’est ain­si que nombre de sons humains –ima­gi­naires ou réels– ne sont connus que par les films : cha­riots de wes­terns, épées-lasers, gifles, coups de poing etc… Leur connais­sance ne tran­site, d’une séance à l’autre, que par la réité­ra­tion du même ancrage audio-visuel, sans autre véri­fi­ca­tion cor­po­relle.

En fait, beau­coup de ces sons trouvent assez faci­le­ment écho dans les schèmes moteurs, en rai­son des nom­breuses tra­duc­tions audi­to-visuo-motrices réité­rées jusqu’à impré­gna­tion : lors qu’un son suf­fi­sam­ment réité­ré per­met de se figu­rer une action, le cor­tex pré­mo­teur l’inscrit comme les autres dans un res­sen­ti cor­po­rel, dans une sorte de pro­prio­cep­tion rési­duelle, qua­si-intro­jec­tive. Inver­se­ment, une fois obte­nue l’activation de cer­tains réseaux pré-moteurs –l’imaginaire des actions– des repré­sen­ta­tions audi­tives ou visuelles sur­gissent, en rai­son du carac­tère pré­dic­tif et inten­tion­nel de la motri­ci­té. On voit trop bien chez les enfants à quel point l’élan cor­po­rel construit un ima­gi­naire pro­jec­tif, assor­ti de repré­sen­ta­tions pas­sa­gères, secon­dai­re­ment ren­for­cées par des ono­ma­to­pées, ou des bruits de bouche. Il n’y a pas, en ce jeune âge ludique et ima­gi­na­tif, de sépa­ra­tion entre d’un côté les figures pré-motrices ou visuelles, et, de l’autre, les figures audi­tives. De la même façon, chez les créa­teurs, c’est par­fois en se mobi­li­sant cor­po­rel­le­ment que les idées viennent, accom­pa­gnées d’images et de sons.

Le ciné­ma reprend par­tiel­le­ment à son compte l’importante cir­cu­la­tion idéo-motrice à l’œuvre dans le jeu d’enfant ou le rêve éveillé. En par­tie, en effet, puisqu’on y trouve plus de sons pro­duc­teurs d’images que d’images pro­duc­trices de sons (13). Cette asy­mé­trie est à recher­cher dans le réel lui-même : tous les mou­ve­ments humains, loin s’en faut, ne sont pas “sono­ri­sés“, beau­coup res­tent silen­cieux. Et pour­tant les condi­tions d’une cir­cu­la­tion tri­par­tite entre le sonore, le visuel et le moteur sont bel et bien réunies, du moins dans l’imaginaire.

De fait, et de plus en plus, le ciné­ma “sonorise“les bou­gés cor­po­rels, soit par la musique (comme dans le des­sin ani­mé) soit par des bruits musi­ca­li­sés (épée-laser, schuuuuuooû… comme dans les films pour ado­les­cents). In, de tels bruits sou­lignent des actions nor­ma­le­ment silen­cieuses, don­nant au spec­ta­teur un sup­plé­ment audi­tif, une plus-value éner­gé­tique, en accord avec les lois de la motri­ci­té. Off, ils pro­longent les gestes des per­son­nages pro­vi­soi­re­ment invi­sibles, y ajou­tant de nou­velles signi­fi­ca­tions des­crip­tives, pui­sées dans la poly­es­thé­sie audi­tive. De chi­mé­riques for­mules sonores s’accouplent de la sorte aux mou­ve­ments fan­tas­tiques ou irréels, sou­dain réa­li­sées à l’écran. Une super-héroïne peut sau­ter de toit en toit, un super-héros peut cas­ser des briques avec fra­cas ou s’envoler sou­dain dans les airs : per­sonne ne sera jamais ni dans leur peau ni dans leurs muscles (14). Et pour­tant le jeune spec­ta­teur y croit : c’est le retour au “tas de sable“. Rap­pe­lons-nous : c’est là qu’on s’inventait des scé­na­rios tout-puis­sants, des per­for­mances extra­or­di­naires, des “pour de vrai“.

6/ Le champ ima­gi­naire

Les sons –for­cé­ment plau­sibles dans les situa­tions ordi­naires– cherchent à s’accrocher à leurs images par atte­lage syn­chrone des flux acous­tique et optique. Entre­choc (contact), effet dop­pler (vitesse), réso­nances (cavi­tés), glis­san­do (trans­la­tion) et arti­cu­la­tion sonore (liber­té de mou­ve­ment) se ren­forcent mutuel­le­ment, entre­la­çant simul­ta­né­ment les don­nées visuelles et audi­tives. S’af­firme ici la com­plé­men­ta­ri­té inter­mo­dale : tan­tôt l’i­mage pro­fite du timbre et de la dyna­mique des sons, tan­tôt le son récu­père à son avan­tage les effets de sens induits par la vision. Pour autant, nul n’ignore la dimen­sion ima­geante des sons seuls.

Chaque item sonore tend en effet vers un élar­gis­se­ment plu­ri­mo­dal en vue d’accéder à une repré­sen­ta­tion plus com­plète de l’objet, à la fois trans et mul­ti­sen­so­rielle.

Si l’on admet –d’une part– que toute varia­tion interne d’un son (connu ou incon­nu), que toute fluc­tua­tion tem­po­relle peut se déri­ver mathé­ma­ti­que­ment (pro­fil d’in­ten­si­té, de timbre, de hau­teur, de masse… ∂x/∂t), alors nombre d’objets sonores peuvent se sim­pli­fier en un sub­strat ordon­né de déri­vées suc­ces­sives et com­bi­nées, que cer­tains auteurs ont nom­mé inva­riants trans­for­ma­tion­nels. Si l’on ajoute –d’autre part– que l’appareil audi­tif est jus­te­ment équi­pé de neu­rones pha­siques, [c’est-à-dire de neu­rones “déri­va­teurs“, assem­blés en réseaux], il s’ensuit que de telles déri­vées [rela­ti­ve­ment amo­dales voire sous-modales] peuvent trou­ver leurs sosies (des inva­riants trans­for­ma­tion­nels iden­tiques) ou leurs cor­res­pon­dants (de même caté­go­rie) déjà mémo­ri­sés dans d’autres cor­tex, sen­so­riels ou moteurs.

Aus­si­tôt que détec­tée et asso­ciée, la déri­vée homo­logue (non consciente en tant que telle) serait ain­si asso­ciée puis “inté­grée” en image men­tale dans un cor­tex spé­ci­fique, visuel, tac­tile ou pro­prio­cep­tif, avec une rela­tive liber­té (15). De fait, chaque déri­vée admet­tant une infi­ni­té de pri­mi­tives, le résul­tat sera très diver­si­fié : secret de la mémoire asso­cia­tive, aléas de la mémoire épi­so­dique, insis­tance du sub­cons­cient. Les images asso­ciées, les frayages synes­thé­siques appar­tiennent au jar­din secret des cor­res­pon­dances, mais aus­si au contexte induc­teur. En situa­tion ciné­ma­to­gra­phique, sous la pres­sion des don­nées nar­ra­tives ou des émo­tions vécues avec les per­son­nages, le résul­tat reste lar­ge­ment orien­té par l’avancée du récit. L’i­mage évoquée/ressentie n’est pour­tant pas la même d’un spec­ta­teur à l’autre : elle s’est frayée un invi­sible che­min à tra­vers un “réseau hyper-connec­té” de sou­ve­nirs, diver­se­ment les­tés par les affects et les dési­rs. En chaque spec­ta­teur, comme en chaque artiste, il y a bien ce nous cultu­rel –social– en même temps que ce je per­son­nel –tota­le­ment sin­gu­lier– rela­ti­ve­ment inac­ces­sible à la conscience.

Je ne sau­rais dire pour autant quelle forme prend l’image men­tale chez un aveugle de nais­sance : le mélange de pro­prio­cep­tions, de gestes et de dépla­ce­ments d’air, de sen­sa­tions hap­tiques ou tac­tiles, d’odeurs et de volumes, de chaud et de froid, de sec et de mouillé, de léger et de lourd, de tex­tu­ré et de lisse, de sucré et d’amer, d’émotions et de sou­ve­nirs conduit cer­tai­ne­ment à un ima­gi­naire plus riche, plus fine­ment com­bi­né dans ses inter­qua­lia, car la sup­pléance men­tale, répa­ra­trice de la vision man­quante, déve­loppe à coup sûr une trans-sen­so­ria­li­té sin­gu­lière, propre à sus­ci­ter de nou­velles cor­res­pon­dances ou de nou­velles synes­thé­sies entre les ima­ge­ries res­pec­tives.

Pour finir, je vou­drais insis­ter sur l’agilité extra­or­di­naire des ima­gi­na­tions pré-motrices, déclen­chées –notam­ment– par la musique, au regard de la rela­tive lour­deur des actes moteurs. Déga­gé de la réa­li­té visuelle, le corps rêveur et ailé de l’auditeur s’adapte au tem­po, à la pul­sa­tion du mor­ceau. L’imaginaire pré-moteur ne craint ni les fluc­tua­tions de vitesse, ni les pas­sages vir­tuoses, ni les accé­lé­rés aériens en totale ape­san­teur. Il ne s’agit plus en effet de se caler sur les pos­si­bi­li­tés phy­siques et réelles du corps, sur le poids et la fatigue que com­bat chaque dan­seur, mais plu­tôt sur les uto­pies motrices de l’imagination, dont les limites semblent appro­cher celles de la vue (pou­voir sépa­ra­teur tem­po­rel) tout en sui­vant néces­sai­re­ment celles de l’ouïe (épais­seur du pré­sent audi­tif).

Au fond, nous sommes depuis si long­temps han­tés par un désir de bou­ger, si mar­qués encore par le déca­lage ori­gi­naire entre le désir de faire et l’immaturité motrice des pre­miers gestes, que nous confions à nou­veau à la musique le soin de nous faire agir men­ta­le­ment en renon­çant à l’action réelle, –exac­te­ment comme l’imagination pré-motrice renonce à l’action effec­tive– pour mieux atteindre à la rêve­rie souple et véloce, aux accom­plis­se­ments répa­ra­teurs. Le mélo­mane ému, par­ti à la ren­contre de la musique, fusionne avec le moi pro­fond du com­po­si­teur, à jamais sublimé/transposé dans son œuvre.

Dès lors, l’habileté motrice et vir­tuose du musi­cien peut conduire les fan­tai­sies motrices de l’auditeur, tra­çant des tra­jec­toires, des ara­besques et des émo­tions à sa taille, bien au delà des limites cor­po­relles. On peut donc remer­cier les inter­prètes de nous emme­ner aus­si loin dans l’imaginaire avec une tech­nique ins­tru­men­tale par­faite (les doigts, les mains, le corps, la bouche ont connu les années de conser­va­toire). S’il n’y avait l’agilité extra­or­di­naire de l’instrumentiste, que serait la musique ? Qui dia­lo­gue­rait alle­gro pres­to avec la viva­ci­té ima­gi­naire ?

Claude Bail­blé, mai 2005

Paru dans [VOIR bar­ré], la revue de la ligue Braille Belge