- Blog home
- >
- Visioconférences
- >
- Considérations sur le son : le rôle de la qualité audio durant les visioconférences
Tags: Cas d’utilisation, voip, téléphone voip
Ce que nous savons au sujet du travail hybride est que les difficultés évoluent en même temps que l’environnement de travail numérique. Et pour les actifs qui participent constamment à des visioconférences, nous savons que la fatigue due aux réunions atteint un niveau sans précédent.
Mais le fait d’être face à l’objectif d’une caméra n’est pas la seule cause de cette fatigue. À l’image d’un iceberg dont on ne voit que le sommet d’une énorme structure immergée, la fatigue due aux visioconférences ne constitue qu’une portion de la fatigue globale que ressentent les actifs qui pratiquent le travail hybride et le télétravail.
De quoi est constitué cet iceberg d’épuisement ? Pour de nombreuses personnes, tout est une question de son.
Vous souvenez-vous d’une situation dans laquelle le son vous a totalement captivé ? Un long trajet sur une autoroute déserte avec de la musique à plein volume ? Un moment sur la plage à écouter le rugissement de l’océan par une journée d’hiver ? Ce concert dans un bar exigu durant lequel le volume sonore était incontestablement excessif, mais sans inquiéter personne ? Le moment où des cuivres rugissant annonçaient le texte d’introduction d’une célèbre saga, qui semblait défiler vers une galaxie lointaine, très lointaine.
Nous ressentons le son de manière subjective. Il peut nous apaiser ou, parfois, nous irriter. La musique d’ambiance relaxante d’une personne peut essuyer le veto d’une autre qui n’en voudra pas sur sa playlist de travail. Certains d’entre nous ont besoin d’écouter un podcast tout en réalisant des tâches basiques, alors que d’autres ne peuvent pas le suivre si elles sont plongées dans des activités demandant une grande concentration.
Mais tous ces exemples partent du principe que la qualité sonore est parfaite et cristalline. À l’ère du numérique, alors que la compression et le streaming audio sont incroyablement sophistiqués, cette expérience acoustique n’est pas un luxe. Elle est même la référence du niveau de qualité que doit offrir l’audio.
Qu’est-ce qui distingue cette expérience sonore d’une grande richesse que nous attendons tous, voire que nous désirons ardemment ? Prenons un moment pour examiner quelques concepts élémentaires.
Le son se propage sous la forme d’ondes générées par des vibrations qui varient en fréquence. Ces fréquences sont mesurées en hertz (Hz) et nous les percevons en termes de tonalité. La parole humaine peut avoir une fréquence de 80 Hz à 14 kHz (kilohertz). Nos oreilles entendent les tonalités de 20 Hz à 20 kHz. Les fréquences plus basses impliquent des tonalités plus graves, comme celles du démarrage d’un moteur à combustion, d’une ligne de basse funky ou d’un baryton. Les ondes à fréquences plus élevées produisent des sons plus aigus, comme celui des dents d’une fourchettes frappant un verre ou d’un sifflement.
Cependant, les choses se compliquent un peu lorsque nous transmettons des sons. Tout commence par un émetteur radio, qui génère un signal électrique contenant des informations acoustiques. Une antenne amplifie ensuite ce signal, qui est propagé par des ondes radio jusqu’à un récepteur radio. Le récepteur extrait alors les informations et les envoie à un appareil (haut-parleur, écran d’affichage, etc.).
Au début du XXe siècle, ces composants étaient séparés et encombrants. Ils permettaient d’envoyer des signaux depuis les gratte-ciel urbains vers des zones éloignées, une véritable prouesse qui a permis de mettre le monde entier en relation en offrant une expérience commune.
Faisons maintenant un bond dans le temps. Chaque smartphone est aujourd’hui équipé de cette technologie. Le son est décomposé, numérisé et transmis en temps réel à l’autre bout du monde, depuis n’importe quel appareil connecté à Internet.
En ce qui concerne les visioconférences, l’audio de la plupart des participants est transmis via le protocole VoIP (Voice over Internet Protocol). Pour faire simple, votre audio est envoyé par l’intermédiaire d’Internet plutôt que d’un réseau cellulaire. Dans le cas des visioconférences VoIP, la qualité audio dépend davantage du débit Internet de l’utilisateur que de la proximité d’une antenne cellulaire dans le cas d’un appel téléphonique classique.
La qualité sonore dépend de nombreuses variables, mais les 4 aspects suivants sont essentiels :
Prenez un instant pour réfléchir à la manière dont une vidéoconférence peut compliquer ces variables. Il suffit de quelques participants seulement pour ajouter de multiples problèmes potentiels en matière d’audio, certains utilisant un réseau cellulaire via leur smartphone, d’autres des ordinateurs portables ou d’autres appareils, et tous ayant des débits et des fournisseurs Internet différents.
Cela fait presque deux ans que la pandémie de COVID-19 a soudainement changé notre monde et l’univers du travail. Il est important de se pencher sur l’impact que cette évolution mondiale vers le travail hybride et le télétravail a entraîné sur les actifs, étant donné la fréquence à laquelle nous communiquons et collaborons via la vidéo.
De plus en plus d’études et d’analyses constatent que l’épuisement dû aux visioconférences est en forte hausse. Nous savons que près de la moitié des actifs déclarent se sentir isolés lorsqu’ils travaillent à distance et que 61 % d’entre eux affirment ressentir davantage de fatigue due aux visioconférences. Un autre chiffre est peut-être plus préoccupant encore : 90 % des participants à un sondage ont affirmé rencontrer des problèmes de collaboration lorsqu’ils travaillent de leur domicile.
En matière de son, les problèmes potentiels sont faciles à identifier :
Au fil du temps, ces problèmes peuvent avoir un effet boule de neige, et engendrer des aversions de plus grande ampleur et à long terme à l’égard de la collaboration virtuelle. Si nous rencontrons continuellement des problèmes concernant les performances audio, nous serons de moins en moins enclins à collaborer.
Il s’agit véritablement du point essentiel, que nous tenons pour acquis Le son constitue un élément central et fondamental de notre quotidien, qu’il soit question de collaborer ou de simplement percevoir le monde qui nous entoure. Des recherches ont montré que, dans certains contextes, le son peut être un excellent remède contre le stress. À l’inverse, des études ont également révélé que le son peut être une cause d’anxiété et même de dépression.
Dans
The Design of Everyday Things
, Don Norman met en avant la dualité du son dans le contexte de la conception de produits, en particulier pour ses répercussions sur les utilisateurs :
« Le son est complexe. Il peut ennuyer et distraire aussi facilement qu’il peut aider. Une des vertus du son est qu’il peut être détecté même lorsque notre attention est concentrée sur autre chose. Mais cette qualité est également un inconvénient, car les sons sont souvent intrusifs. »
En conséquence, par où commencer pour éliminer le stress généré par le son et qu’est-ce qui peut améliorer la qualité sonore de nos visioconférences ?
Comme nous l’avons mentionné dans cet article, la bande passante, la compression et les codecs sont cruciaux pour la qualité audio. Examinons donc de façon un peu plus approfondie la différence entre l’audio à large bande (HD) et l’audio à bande étroite.
L’audio à bande étroite utilise un codec vocal AMR (Adaptive Multi-Rate). En substance, les codecs AMR utilisent une plage de fréquences sonores limitée pour compresser et transmettre les signaux audio sur un flux en direct (de 200 Hz à 3,4 kHz). Le codec AMR comporte également un débit de données variable, qui change en fonction de la bande passante (environ 5 à 12 Kbits/s). Une mauvaise qualité sonore est généralement due à des problèmes associés à une faible bande passante. Dans ce cas, le codec AMR adopte un débit de données plus faible pour s’adapter à cette limitation.
Alors que l’Internet haut débit devient de plus en plus accessible, la qualité sonore a gagné en qualité grâce à l’audio à large bande, un format haute définition conçu spécifiquement pour le protocole VoIP.
L’audio à large bande a recours à des codecs vocaux AMR-WB (Adaptive Multi-Rate Wideband) qui offrent une plage de fréquences plus étendue (de 50 Hz à 7 kHz). De ce fait, des sons plus aigus et plus graves sont captés et transmis, permettant de profiter d’une qualité sonore accrue et d’une plus grande richesse.
Comme nous l’avons indiqué précédemment, en cas de débits Internet plus faibles, les solutions de visioconférence ont tendance à utiliser par défaut un codec audio à bande étroite. Des débits plus élevés ouvrent la possibilité d’utiliser des codecs à large bande (HD). Mais cela paraît un peu injuste, n’est-ce pas? L’inclusivité doit-elle dépendre à ce point de la rapidité de notre connexion Internet ?
C’est pourquoi Webex utilise Opus (un codec audio évolutif et plus polyvalent) pour offrir à chaque participant une expérience audio inclusive.
Opus peut délivrer une excellente qualité audio, même à des débits de données inférieurs. Mais il peut aussi faire étalage de sa puissance pour prendre en charge l’audio à large bande et l’audio pleine bande, qui couvre une plage du spectre sonore plus étendue que celles que les humains peuvent percevoir (de 20 Hz à 20 kHz).
Arrêtons-nous un instant pour souligner comment la flexibilité d’Opus a récemment contribué à résoudre un problème de collaboration centré sur les utilisateurs.
La capacité d’Opus à délivrer un son cristallin sur tout le spectre de fréquences sonores a rendu possibles des fonctionnalités telles que le mode Musique de Webex. Dans ce mode audio, le son est optimisé non pas pour la parole humaine, mais pour la musique, préservant ainsi la qualité sonore d’origine de façon beaucoup plus claire.
En raison de la pandémie, les chanteurs de l’Indianapolis Children’s Choir (ICC) ont été dans l’incapacité de se réunir et de répéter ensemble pendant des mois. Ils ont alors décidé d’utiliser le mode Musique pour poursuivre leurs séances de répétitions. Et ils ont également fourni de précieux commentaires pour aider Webex à améliorer encore cette fonctionnalité.
Regardez cette vidéo pour découvrir comment le mode Musique a permis aux membres de la chorale ICC de renouer avec leur passion en dépit d’obstacles sans précédent :
Étant donné que de nombreux facteurs changeants et simultanés influent sur le son de vos visioconférences, il est important de se pencher sur d’autres difficultés potentielles.
Examinons comment les équipements matériels peuvent transformer ce que vous entendez, et ce que vos collègues entendent, durant une visioconférence.
À un niveau très élémentaire, le signal acoustique capté par votre micro est à la base de tout. Il s’agit de la première opération avant la numérisation, la compression et la décompression. Un simple micro d’ordinateur, un micro externe ou un appareil équipé d’un réseau de micros peuvent tous avoir une influence sur des phénomènes audio spécifiques tels que la réverbération sonore ou un son métallique.
Selon votre mode et votre espace de travail, différents types d’appareils peuvent considérablement optimiser votre expérience audio, aussi bien ce que vous entendez que la manière dont les autres vous entendent. J’ai eu l’occasion de discuter avec
Patrick Achtelik
, ingénieur en acoustique, du matériel Webex et de la technologie audio sophistiquée qui cible la voix de l’intervenant tout en réduisant les bruits indésirables.
« En substance, la formation de faisceau utilise plusieurs micros omnidirectionnels », m’a expliqué Patrick. « Le micro lui-même capte le son de façon égale dans toutes les directions. »
Cependant, le fait d’associer davantage de micros omnidirectionnels permet d’en augmenter la directivité. Ainsi, les micros offrent une efficacité accrue pour une plus large plage de fréquences. Comme le note Patrick :
« Pour obtenir une directivité sur une plage de fréquences plus étendue, il est nécessaire d’utiliser un plus grand nombre de micros. Sur le
Desk Pro
, par exemple, 6 micros à formation de faisceau sont répartis à différentes distances sur la gauche du panneau. Ils ne sont pas placés à égale distance les uns des autres. Les micros peuvent ainsi fonctionner à des fréquences différentes et sur des bandes de fréquences différentes. »
Ce positionnement évite également de capter les sons au-dessus et au-dessous de l’appareil, tandis que les sons émis en face du réseau de micros, comme votre voix, sont ciblés et optimisés.
Mais il ne s’agit-là que d’une pièce du puzzle. Patrick a décrit une importante interaction entre les éléments logiciels et matériels dont le rôle est primordial pour éviter aux personnes qui s’expriment et à celles qui écoutent de subir des désagréments, tels que le phénomène d’écho, qui peuvent parfois sembler incontrôlables :
« Il est impératif que l’annulation de l’écho acoustique (AEC, Acoustic echo cancellation) soit parfaitement efficace pour que la communication full duplex de Webex puisse fonctionner. Le micro d’une personne capte également le son provenant de son haut-parleur. Sans la fonction AEC, vous entendriez l’écho de votre propre voix. »
La fonctionnalité AEC est essentielle pour les visioconférences. Nous pensons que la communication full duplex, une technologie permettant à plusieurs utilisateurs de parler simultanément, devrait fonctionner tout le temps. Mais de nombreuses plateformes dépourvues de fonctionnalités pour éliminer les phénomènes d’écho et de réverbération sont mises en défaut. Patrick a pointé clairement l’importance de la distance :
« Le phénomène d’écho peut avoir pour origine la distorsion générée par le haut-parleur. Si vous augmentez le volume avec de petits haut-parleurs d’ordinateur portable, ils produisent assez rapidement de la distorsion. La distance physique peut réduire la quantité de son transféré depuis la personne qui s’exprime jusqu’au micro. En plaçant le micro plus près de l’utilisateur, sa voix sera plus distincte. »
Prenez un moment pour étudier la relation entre les micros et les haut-parleurs en consultant le vlog de Patrick, intitulé Focus on Sound :
Pour les télétravailleurs et les travailleurs hybrides, opter pour un
casque
de meilleure qualité
peut constituer une première démarche judicieuse en vue d’améliorer la qualité audio.
Pourquoi ?
Patrick l’explique ainsi :
« Les micros intégrés aux ordinateurs portables sont situés à une distance relativement importante de l’utilisateur et à proximité des haut-parleurs de l’ordinateur. En général, votre voix
peut
sembler éloignée et la fonctionnalité AEC
peut
avoir une efficacité limitée en raison de la proximité des haut-parleurs. L’utilisation d’un casque permet de briser la connexion acoustique entre les haut-parleurs et le micro, car le son diffusé dans les écouteurs n’atteint pas le micro du casque. »
Le casque Cisco 730,
lauréat du prix Red Dot
, contribue à optimiser le son des visioconférences. Ce casque est conçu sans bras de micro pour permettre à l’utilisateur de s’exprimer plus naturellement (fini le micro qui s’avance devant la bouche). Il est doté d’une technologie de formation de faisceau et intègre un réseau de 4 micros pour créer une sorte de bulle audio qui cible votre voix. Ce casque permet de passer du mode de suppression adaptative du bruit, qui s’adapte automatiquement aux environnements bruyants, au mode ambiant, qui vous permet d’entendre les conversations dans un espace de travail partagé lorsque vous avez davantage envie d’échanger avec vos collègues.
Conçu en partenariat avec Bang & Olufsen, un des leaders du secteur, le
tout nouveau casque Cisco
offre encore plus de fonctionnalités audio. Le positionnement géométrique de ses micros (6) a été mûrement réfléchi afin de mieux isoler votre voix, tout en utilisant des algorithmes sophistiqués pour éliminer le bruit de fond.
Le simple fait d’abandonner le micro de votre ordinateur portable et d’utiliser plutôt un casque transformera votre expérience audio lors des réunions.
Mais si vous souhaitez optimiser votre expérience des visioconférences dans sa globalité, des appareils de collaboration tels que le
nouveau Webex Desk Mini
peuvent représenter le choix idéal. Doté de fonctionnalités complètes, avec la technologie intelligente de réseau de
microphones
et la capture sonore ciblée que nous avons évoquées précédemment, cet appareil
permet également de profiter de la vidéo HD et vous offre la possibilité de co-créer en temps réel au moyen de tableaux blancs numériques.
En substance, les équipements matériels peuvent être considérés comme le moteur de l’expérience audio, qui détermine ce que nous entendons et la façon dont les autres nous entendent. Dans ce cas, les logiciels peuvent être perçus comme le carburant qui
alimente
l
e
moteur et lui permet de délivrer ses
performances.
Nous ne le connaissons que trop bien maintenant, et beaucoup d’entre nous le redoutent : le fléau du bruit de fond. Depuis que le monde a adopté le
travail hybride
, il est devenu l’une des plus grandes difficultés avec lesquelles les actifs doivent composer.
Cependant, nous ne devrions pas être étonnés de découvrir que le bruit de fond est une source de stress. Les vidéoconférences ne sont que le reflet d’une problématique constatée aux quatre coins du monde. Des études montrent que
les nuisances sonores en général sont bien réelles
et
néfastes
. Il est en outre crucial de comprendre que le stress est provoqué spécifiquement par les sons
non désirés
: lorsqu’un chien aboie dès que le facteur sonne, lorsqu’un enfant vous interrompt alors que vous écoutez les détails d’un projet important ou lorsqu’un blender ou un aspirateur se met en marche pile au moment où vous vous apprêtiez à parler.
Nous aspirons à pouvoir nous concentrer sur notre travail dans un environnement qui bien souvent nous en empêche. Afin de pouvoir bénéficier de cette capacité de concentration, nous avons besoin d’une technologie pour lutter contre les désagréments sonores qui échappent parfois à notre contrôle. Heureusement, la technologie est à la hauteur de la tâche.
En 2020, Cisco a fait l’acquisition de
BabbleLabs, un leader dans le domaine des logiciels de suppression du bruit.
Grâce à l’IA et à l’apprentissage automatique, BabbleLabs a permis d’améliorer la suppression du bruit dans l’outil Webex et a mis sur le devant de la scène une technologie remarquable et révolutionnaire.
L’apprentissage automatique englobe de nombreux processus granulaires et complexes. Des données d’entraînement correspondant à un nombre incalculable d’heures sont utilisées pour permettre à des algorithmes d’apprentissage automatique de différencier la parole humaine des autres sons. Une fois ces algorithmes déployés, des bruits spécifiques sont identifiés et supprimés avant qu’ils ne soient transmis et entendus. Cette approche requiert également une bonne dose d’ingénuité humaine pour déduire précisément quels sont les bruits les plus susceptibles d’interrompre et de perturber les personnes en télétravail.
Afin de mieux comprendre
comment l’IA a transformé l’expérience Webex dans le domaine de l’audio,
j’ai
discuté avec
un autre expert
:
Keith Griffin
, éminent ingénieur de notre département technologique, spécialiste de l’IA et de l’apprentissage automatique.
« Nous nous sentons mal à l’aise lorsque nous demandons à quelqu’un de répéter ce qu’il vient de dire ou lorsque nous nous trouvons dans un environnement bruyant. » Cela était une source de stress dans les années qui ont précédé la pandémie, m’a expliqué Keith. « Par le passé, de nombreuses personnes préféraient ne pas participer à des visioconférences car elles n’avaient pas confiance en l’environnement qui les entouraient. »
Mais les fonctionnalités déployées par Webex ont cherché à surmonter ces difficultés, qui ont été amplifiées par la pandémie et le passage au travail hybride. Un exemple parlant est la fonctionnalité « Optimiser pour ma voix », qui intègre le concept fondamental de distance mis en lumière par Patrick.
« Je suis admiratif devant ce qu’ont réussi à accomplir nos équipes spécialisées dans l’IA et l’apprentissage automatique », déclare Keith. « Il ne s’agit pas seulement de la suppression du bruit, mais aussi de la façon dont elles font avancer la technologie pour répondre à d’autres cas d’utilisation, à l’image de la fonctionnalité « Optimiser pour ma voix ». Celle-ci détermine qui est l’interlocuteur actif en fonction de différents paramètres. Elle capte la voix de l’interlocuteur principal et élimine tout simplement toutes les autres voix humaines détectées. »
En matière de suppression du bruit, Keith a remarqué quelques-unes des spécificités les plus fascinantes de l’apprentissage automatique. Pour répondre aux besoins du plus grand nombre de situations possibles, le logiciel Webex sait identifier et éliminer des sons tels celui des frappes sur les touches du clavier, les sirènes (le logiciel est capable de reconnaître les sons des sirènes de différents pays), les machines de jardinage et les aboiements des chiens. Notre premier détecteur de bruits pouvait d’ailleurs identifier plus de 100 races de chiens différentes, simplement par leurs aboiements.
Comme l’a décrit Keith, la suppression du bruit ne consiste pas seulement à éliminer le bruit ambiant. Elle est si efficace qu’elle permet une collaboration plus inclusive et plus flexible. Les équipes peuvent ainsi s’impliquer sereinement dans les réunions.
« Les réunions de direction de mon site de Cisco Galway peuvent compter jusqu’à 14 participants. Aujourd’hui, nous étions 12. Trois étaient en voiture, après avoir déposé leurs enfants à l’école. Quatre autres membres de l’équipe étaient en train de promener leur chien. »
Cette anecdote est *extrêmement* parlante concernant notre perception de la qualité audio, du stress généré par les nuisances sonores, de la fatigue due aux visioconférences et de l’impact de chacun de ces phénomènes sur la collaboration d’équipe. Keith a souligné que :
«
Pour certains types de réunions, les participants devraient pouvoir poursuivre leurs activités quotidiennes
et rejoindre la réunion en toute confiance, quel que soit l’environnement qui les entoure.
D
urant leur trajet en voiture
ou leur promenade,
d
es chiens
peuvent
aboyer et d’autres véhicules peuvent circuler
,
mais ils
savent
que nous n’entendrons que leur voix. C’est exactement ce qui facilite le travail hybride et favorise la qualité de l’audio. »
Le travail réalisé pour déployer l’Intelligence audio Webex, qui englobe la suppression du bruit, la fonction « Optimiser pour ma voix » et d’autres fonctionnalités, a été considérable. Mais les résultats sont là. À ce jour, Webex a supprimé
16 milliards de minutes
de bruit de fond durant les visioconférences de nos utilisateurs.
Ces innovations dans l’univers de l’audio se traduisent par des bénéfices réels et tangibles pour les employés et les organisations. C’est pourquoi Aragon Research a une nouvelle fois désigné Webex comme un
leader dans le domaine des logiciels de visioconférence
.
Maintenant que nous avons étudié les ingrédients indispensables pour une qualité sonore supérieure, à savoir des équipements matériels de pointe, des logiciels sophistiqués et de puissantes capacités d’IA, il est temps de vous fournir quelques conseils concrets pour améliorer votre expérience audio.
Conseil n° 1
Examinez attentivement les espaces depuis lesquels vous participez le plus souvent à des visioconférences. Quelle est la probabilité que des bruits indésirables viennent vous interrompre à une heure donnée ? Quel est généralement le niveau de qualité de votre audio pour vos collègues ? Avec Webex, vous pouvez facilement
tester votre micro au préalable
.
Conseil n° 2
Plongez-vous dans les concepts élémentaires de l’acoustique pour résoudre avec plus de facilité les problèmes rencontrés quotidiennement en matière de son. Notre ami Patrick peut vous aider à vous lancer :
Conseil n° 3
N’utilisez pas le micro de votre ordinateur si vous pouvez faire autrement. Que vous préfériez un casque basique, un micro externe ou la qualité supérieure d’un casque Cisco, le moyen le plus rapide pour atténuer le stress généré par le son et améliorer la qualité audio est de renoncer à utiliser le micro de votre ordinateur.
Conseil n° 4
Lorsque vous avez du temps à consacrer à une activité exigeant une grande concentration, tirez parti de la nature positive du son. Lancez la playlist qui vous aide à vous concentrer et mettez votre casque Cisco sur les oreilles. Vous pouvez aussi activer le mode Musique durant votre réunion Webex si vous souhaitez réaliser ce genre de travail avec les autres membres de votre équipe en temps réel.
Conseil n° 5
Testez la suppression du bruit avec vos collègues afin d’identifier les sons qu’
ils ne pourront pas
entendre. Il peut arriver qu’en entendant notre chien aboyer, nous présentions nos excuses à nos collègues, ceux-ci répondant alors
« pourquoi ? ».
Lorsque vous aurez identifié les sons qui sont effectivement supprimés, vous vous laisserez moins déconcentrer, car vous saurez que personne d’autre que vous ne les entend.
Aidez votre équipe à se défaire du stress généré par le son et de la fatigue due aux réunions en découvrant plus en détail l’audio Webex et les produits qui permettent de l’optimiser.
En savoir plus
5 principales fonctionnalités de casque pour un audio de qualité à domicile
Un son parfait à chaque appel – 3 conseils pour une excellente qualité audio
Webex + Shure : Résoudre l’équation audio pour la salle de réunion