On peut fabriquer du son binaural avec peu de choses : deux microphones électrets glissés dans le creux de l’oreille (derrière le tragus) et un enregistreur de poche doté d’une entrée plug-in power à 3 volts. Coût de l’opération : une centaine d’euros.
Le binaural obtenu avec un tel équipement est merveilleux. Il est capable de traduire l’essentiel de l’expérience sonore réelle et d’en bluffer plus d’un, y compris via des écouteurs de téléphone.

La qualité de ce binaural est pourtant très éloignée de celle de l’écoute naturelle. Et l’on sera d’autant plus tenté d’améliorer les choses que l’ouïe est un sens de haute volée. Sa réponse en fréquence est étendue, sa dynamique élevée, son plancher de bruit reste très loin de la conscience. La solution à 100 balles est incapable de rivaliser avec notre système auditif.

Deux choses accroissent le défi : la sagacité de monsieur Tout-le-Monde et l’écoute au casque.
Nous sommes hyper-compétents en binaural : nous en décodons depuis que nous sommes là. Nous avons chacun corrélé des millions de moments ouïe-vue-toucher-odeur. D’une scène familière, nous savons très exactement le niveau sonore, le rapport direct-réverbéré, la décroissance, les changements de timbres. Nous n’en savons pas dire grand-chose, l’ouïe est un sens plutôt inconscient et nous ne sommes pas tous ingénieurs du son, mais nous sommes tous expérimentés. Notre corpus de sensations est considérable.

D’autre part, l’expérience d’immersion sonore nous arrive par un casque. L’enregistrement binaural vient se frotter à notre compétence par un casque, c’est à dire avec une précision remarquable si l’on se souvient du combat de l’auto-radio ou du petit poste de la salle de bain (se frottant au monde réel). À peu près n’importe quel casque est en mesure de fournir une précision supérieure à celle que produisent les haut-parleurs domestiques : tous les défauts de production s’entendent.

S’il est bel et bien possible de fabriquer du binaural merveilleux avec des moyens réduits, gratter des centimètres de fidélité peut conduire à déployer des solutions de haute volée.
Ce n’est pas un délire d’audiophile : pour l’expérience que j’en ai, la fidélité (l’absence de bruit de fond par exemple) est le moyen de manipuler davantage l’auditeur, c’est l’empêcher de se raccrocher à l’artefact technique et donc le moyen de le troubler plus avant.
Pire : je pense que nous n’avons pas le choix, la perception naturelle est multimodale et proposer une expérience immersive qui n’utilise qu’un sens est donc particulièrement casse-gueule. Il faut être au plus près de la sensation brute et fournir tous les détails. Les adeptes de la synthèse binaurale, qui peinent à donner l’illusion de la distance avec des HRTF anéchoïques, le savent bien.

Au fil des années, nos outils de tournage et de fabrication s’affinent.
La chaine technique binaurale est simplement stéréophonique, mais elle doit être impeccable. Pas de révolution des outils, mais tout doit être un cran au-dessus. Et vu les dégâts occasionnés par ce tout petit moment historique du mp3, disons plutôt deux crans. Nous en étions au CD 16 bits quand les gestionnaires de tuyaux nous ont fourgué la compression psychoacoustique.

Nous travaillons en 24bits et 96KHz (depuis quelques tests en 2014). Au casque, nous entendons la différence et c’est parfait pour jouer sur le temps de lecture. Laurent Feichter nous a fourni un préamplificateur à la hauteur. Je n’ai même pas la fiche technique du PreB, mais ceux qui l’entendent ne s’y trompent pas. Nous travaillons dans le même genre d’état d’esprit que Chesky Records : nous faisons fabriquer le matériel dont nous avons besoin.
Pour la première fois dans ma carrière d’ingénieur du son, la chaîne de production est transparente : de la prise de son à la post-prod, mon casque est branché sur le même amplificateur que celui que nous utilisons pour nos diffusions publiques : même ampli, même casque, même gain. Pour la première, mon délire de réalisateur est complet : l’auditeur reçoit ma cuisine au dB près. Entre le moment où le son est entré dans le mannequin et celui où il entre dans l’oreille de l’auditeur, il y a eu un ADC et un DAC, point. Waouh.
Nous avons des solutions pour le portage, la protection contre le vent, l’harmonisation des têtes de prise de son et tout un tas de petites choses qui ne posent plus guère de question avec les techniques traditionnelles. Mais bien entendu, ce savoir-faire est encore tout petit, si on le compare à celui du cinéma (combien d’homme-années en comparaison ?).

Pour la campagne de prise de son en Ukraine, j’avais rééquipé une tête HeadAcoustics avec des DPA 4053. C’est la tête que nous appelons Vlad. Ses oreilles abstraites produisent un espace un peu ovoïde, mais ce sont d’excellentes capsules. Je rêve d’installer mes 4003 dans une tête, mais l’ergonomie est trop médiocre. Nous utilisons une KU100 la plupart du temps (que nous appelons Georges, of course). Je préfère le son DPA, même si leur politique de suivi de produits n’est pas à la hauteur.
Nous en reparlerons plus tard, mais la question des têtes et des microphones, pour le binaural natif, est à ses débuts. Quant à l’enregistrement sur tête naturelle, DPA, là encore, est à l’état de l’art avec les 4060. Mais le bruit propre de ces capsules, aussi douées soit-elles, reste trop élevé pour les ambiances toutes calmes.

Nous sommes à ce moment formidable où les choses vont bouger plus vite parce que davantage de monde s’y intéresse.
La tête artificielle Neumann est aujourd’hui plus ou moins le ticket d’entrée (à 7K€) de l’ingénieur du son qui se veut 3D.
Dans cinq ans, la prise de son en binaural natif sera dans le cursus de toutes les écoles de son.
Les agences numériques incitent aux solutions purement logicielles, garantes d’une expérience interactive, dans un contexte de « réalité virtuelle », c’est-à-dire d’où la complexité sonore de la réalité est absente.
Les grands diffuseurs transcodent en binaural leurs productions multicanales devant le raz-de-marée du casque et du terminal mobile. Les normes arrivent.
Tous ces acteurs et leurs besoins parfois contradictoires organiseront le marché. Il est bien possible que la prise de son 3D de demain soit plutôt de l’ambisonic à un ordre raisonnable.
Mais la simplicité de l’enregistrement natif (deux micros miniatures et un enregistreur propre), accessible à chacun, devrait permettre de se souvenir que nous écoutons tous en binaural. Et qu’il est donc raisonnable de nous parler sur ce mode. Pas de doute. Ce changement-là est en marche. Pour nos gosses, l’expérience médiatique ne se concevra plus sans un espace sonore 3D, pas plus que nous ne concevons de cinéma sans bande-son. Mais pour nous dire quoi et nous emmener où ? Et, pour en rester à la question du matériel, avec quel degré d’efficacité ?

Nous avons notre petite idée là-dessus, ce site en témoigne.