Wave Field Synthesis
Les algorithmes de spatialisation offrent une zone de localisation précise qui est plus large qu'avec les systèmes traditionnels. La Wave Field Synthesis (WFS) est l'algorithme le plus efficace dans ce domaine, mais d'autres algorithmes, tels que le panning d'amplitude (VBAP, LBAP, etc.) ou l'Ambisonique d'Ordre Sup érieur (HOA), offrent également d'excellents résultats à cet égard, et ces autres algorithmes peuvent être utiles pour une large gamme de situations avec différents contenus audio ou conceptions de systèmes.
Principe de Fonctionnement
Origines dans la Recherche Scientifique
La Wave Field Synthesis est un algorithme de spatialisation sonore qui a été initialement recherché dans les années 1980 à l'Université de Delft (Pays-Bas), et plus tard par plusieurs centres de recherche tels que le laboratoire STMS d'Ircam.
Son principe de fonctionnement est basé sur le principe de Huygens, formulé en 1690 dans son Traité de la Lumière. Quand un son est émis, il se propage dans l'espace sous forme de front d'onde. La WFS vise à reproduire ce front d'onde, en utilisant plusieurs haut-parleurs formant un array. L'algorithme repose simplement sur les différences de niveau et de délai entre les haut-parleurs. Ensemble, les contributions de ces haut-parleurs vont construire un front d'onde simulé (appelé front d'onde secondaire) qui est en théorie identique au front d'onde primaire.
Pourquoi Choisir la WFS plutôt que la Stéréo ?
Les Problèmes de la Stéréophonie pour le Son Live
La stéréophonie est une technique qui repose sur une paire de haut-parleurs, permettant à l'auditeur de percevoir la localisation des sons comme provenant d'une continuité de positions du haut-parleur gauche au haut-parleur droit. Pour positionner un son entre ces deux haut-parleurs, elle repose simplement sur une 'image fantôme' créée en utilisant des différences de niveau (par exemple, quand un son est placé légèrement à gauche, le haut-parleur droit recevra légèrement moins de son que celui de gauche).
Cependant, la stéréo nécessite que les auditeurs soient placés au centre de la salle. S'ils ne sont pas exactement à cette position, ils ne pourront pas percevoir la localisation précise, à cause de la façon dont fonctionne notre perception.
Sweet-spot : le Point Faible de la Stéréo
Pour déterminer la localisation d'un son, notre système auditif repose principalement sur un principe simple : il mesure, entre nos deux oreilles, la différence d'intensité sonore et de temps d'arrivée pour les sons perçus. Notre système auditif repose également sur l''éffet de précédence', qui stipule que si deux haut-parleurs produisent le même son, nous percevrons la localisation du son comme provenant du haut-parleur le plus proche, même si le haut-parleur le plus distant a un niveau plus élevé.
Par conséquent, dès que les auditeurs se déplacent vers le côté de la salle, le son du haut-parleur le plus proche arrivera en premier à leurs oreilles, et ils commenceront à percevoir les sons comme provenant uniquement de ce haut-parleur, ne permettant aucun effet de localisation (appelé panning gauche-droite en stéréo).
Par conséquent, la perception de la localisation sonore dans les systèmes stéréo n'est valide que lorsque les auditeurs sont assis au centre du public, une position appelée le 'sweet spot', un inconvénient majeur des systèmes stéréo.
Quand la Stéréo Finit par Être... Mono
En raison de la mauvaise performance de localisation de la stéréo, les ingénieurs du son doivent souvent positionner tous les sons au centre, résultant en un mixage mono. Non seulement les qualités artistiques du mixage peuvent souffrir du manque de spatialisation, mais un tel mixage mono augmente également le phénomène de masquage fréquentiel, un autre inconvénient décrit ci-dessous.
Le mono est également imposé par la façon dont les systèmes standard sont conçus pour équilibrer la couverture limitée des haut-parleurs des systèmes 'stéréo'. Les haut-parleurs principaux 'gauche' et 'droit' ne se chevauchent qu'au centre de la salle, même si les conceptions tendent à rendre cette région de chevauchement aussi large que possible. En dehors de la zone de chevauchement, les auditeurs n'obtiennent pas une perception bonne et intelligible du haut-parleur opposé.
Une solution est d'ajouter des haut-parleurs de rappel (fill), utilisés pour couvrir les sous-zones. Mais ces haut-parleurs supplémentaires reçoivent une somme mono des signaux gauche et droit, même si l'ingénieur du son utilise le panning stéréo dans son mixage. Pour optimiser leur mixage, les ingénieurs devront prendre en considération qu'une partie du public n'est couverte que par un mixage mono.
Conséquences du Phénomène de 'Masquage Fréquentiel'
Le phénomène de masquage fréquentiel se produit lors de la sommation dans un canal de deux signaux qui présentent des portions d'audio dans la même gamme de fréquences (ce qui est le cas pour les deux situations décrites ci-dessus).
Il cause une perte d'intelligibilité qui est habituellement gérée par les ingénieurs du son avec de multiples traitements audio tels que l'égalisation, les compresseurs, etc. Mais de tels outils, même s'ils sont utilisés à des fins artistiques parfois, altèrent le son, et peuvent le faire paraître moins clair ou naturel.
Les Avantages de la WFS
Un Algorithme sans Sweet Spot
Parce que cet algorithme se concentre sur la recréation d'un front d'onde naturel, et l'utilisation de délais et différences de niveau finement calculés, chaque membre du public sera capable de percevoir le son comme provenant de la direction désirée, où que les auditeurs soient placés dans la salle. Le sweet spot disparaît, et presque chaque siège devient une position privilégiée.
Démasquage Fréquentiel
Parce que chaque source virtuelle a ses propres haut-parleurs physiques dédiés, et que ces sources ne sont pas sommées, il n'y a plus d'interférences destructives entre les différentes sources. Les signaux gardent leur clarté et intelligibilité même avec plusieurs sources jouant des parties complexes simultanément.
Les ingénieurs du son travaillant sur des spectacles à grande échelle rapportent souvent un gain de temps considérable, étant donné qu'ils peuvent se concentrer plus sur l'aspect créatif de leur travail, au lieu de devoir passer des heures à corriger des problèmes d'intelligibilité.
WFS sur des lignes de Haut-Parleurs Haute Densité
Théoriquement, pour recréer le front d'onde parfait, la WFS nécessiterait une ligne infinie et continue de haut-parleurs (c'est-à-dire un si grand nombre qu'il n'y aurait aucun espacement entre eux). Mais en pratique, une distance interacoustique d'environ un mètre entre les haut-parleurs est suffisante pour les applications de sonorisation live, pour fournir une large zone de localisation dans le public sans artefacts.
Cependant, l'espacement entre les haut-parleurs limitera la fréquence maximale pour la reconstruction parfaite du front d'onde. En utilisant une plus grande quantité de haut-parleurs avec la plus petite distance possible entre eux, la reconstruction correcte du front d'onde devient possible pour la plupart du spectre audio. Cela permet d'obtenir un effet appelé 'holophonie', où les auditeurs sont capables de percevoir la distance de la source virtuelle, en plus de sa position latérale.
Une telle ligne de haut-parleurs haute densité peut être entendu dans l'auditorium ESPRO de l'Ircam, qui compte 280 haut-parleurs Amadeus PMX5 formant quatre lignes WFS, pilotés par la technologie au cœur du moteur audio HOLOPHONIX. Sur la ligne frontale, les haut-parleurs ont une distance interacoustique de 16 cm (c'est-à-dire entre le centre de chaque haut-parleur).
Pour les situations de sonorisation standard, une ligne avec une plus grande distance entre les haut-parleurs (environ un mètre dans les situations de sonorisation standard), offre des résultats satisfaisants. Seuls les sons graves bénéficieront de l'effet 'holophonie'. Mais même si l'espacement interacoustique ne permet pas une reconstruction correcte du front d'onde pour les sons aigus, tout le spectre audio sera toujours perçu comme provenant de la direction de la source sonore, grâce aux délais appliqués par l'algorithme. Par conséquent, la Wave Field Synthesis répond à notre objectif principal d'offrir une localisation précise des sources à chaque membre du public.