O som importa: O papel da qualidade de áudio na videoconferência

On By Reilly Nolan18 Min Read
Man with headset listening to audio with smartphone_ccexpress
O que sabemos sobre o trabalho híbrido é o seguinte: os desafios evoluem à medida que o local de trabalho digital evolui. E, para os profissionais que estão constantemente fazendo videoconferências, sabemos que a fadiga das reuniões está em alta. Mas há mais nessa fadiga do que estar sendo filmado. Como o iceberg metafórico cuja ponta esconde uma estrutura maciça abaixo, a fadiga da videoconferência é realmente apenas uma parte da fadiga geral que sentimos como profissionais híbridos e remotos. O que compõe esse iceberg de ansiedade? Para muitas pessoas, tem a ver com o som.

O que é qualidade de som?

Você consegue se lembrar de uma época em que um som te deixou completamente enfeitiçado? Uma longa viagem em uma estrada tranquila com a música no máximo. Cara a cara com o rugido do oceano numa praia fria de inverno. Aquele show ao vivo em um bar apertado onde o som estava a 11/10, mas ninguém ligava. O momento em que as cornetas anunciavam o épico texto de introdução de uma certa franquia de filmes, percorrendo uma galáxia muito, muito distante. Sentimos o som subjetivamente, de maneiras que podem acalmar e, às vezes, irritar. A música ambiente relaxante de uma pessoa é vetada por outra pessoa na playlist do trabalho. Alguns de nós precisam de um podcast em segundo plano para tarefas mundanas, outros não podem segui-lo se estiverem profundamente focados no trabalho. Mas todos esses exemplos pressupõem uma coisa: áudio cristalino e sem defeitos. E, na era digital, onde a compressão e o streaming de som são incrivelmente sofisticados, essa experiência de áudio não é um luxo – é uma linha de base para o que o som deve ser. Então, o que distingue essa experiência sonora exuberante que todos esperamos, se não desejamos? Vamos parar um momento para falar sobre alguns conceitos básicos. Ondas sonoras O som viaja em ondas, causadas por vibrações que variam em frequência. Essas frequências são medidas em Hertz (Hz), e nós as percebemos em termos de tom. A fala humana pode variar de 80 Hz a 14 kHz (quilohertz). Nossos ouvidos ouvem tons que variam de 20 Hz a 20 kHz. Frequências mais baixas significam tons mais baixos, como um motor de combustão interna ligado, uma linha de baixo moderna ou um cantor de barítono. Ondas de frequência mais alta significam som mais agudo – pense em dentes de garfo batendo em vidro ou em uma melodia assobiada. No entanto, quando transmitimos som, as coisas ficam um pouco mais complicadas. Ele começa com um transmissor de rádio, que gera um sinal elétrico contendo informações de áudio. Em seguida, uma antena amplifica o sinal, que é transportado por ondas de rádio para um receptor de rádio. Depois disso, o receptor extrai as informações e as envia para um dispositivo (alto-falante, tela de exibição, etc.). No início do século 20, esses componentes eram separados e maciços, conectando arranha-céus da cidade com bairros distantes – um feito milagroso que uniu o mundo ao proporcionar uma experiência compartilhada. Avançando para hoje? Todo smartphone contém essa tecnologia. O som é quebrado, digitalizado e transmitido em tempo real, em todo o planeta, a partir de qualquer dispositivo que se conecte à Internet. Em termos de videoconferência, a maior parte do áudio dos participantes agora é transmitida por VoIP (Voice over Internet Protocol). Basicamente, seu áudio é enviado pela internet e não por uma rede celular. A qualidade de áudio para videoconferência VoIP é mais dependente da velocidade de internet de um indivíduo do que, digamos, a proximidade da torre de celular é para uma chamada telefônica tradicional. A qualidade do som depende de muitas variáveis, mas esses 4 aspectos são fundamentais:
  1. Taxa de amostragem. O número de amostras digitais tiradas por segundo do áudio analógico original. Normalmente, uma taxa de amostragem mais alta significa áudio de maior qualidade, expresso em kHz (geralmente, vemos 8 ou 16 kHz para telefonia padrão e 44,1 kHz para streaming de áudio).
  2. Taxa de bits . Refere-se à quantidade de dados que um arquivo de áudio digital contém. A taxa de bits é medida em kilobits por segundo (kbps). Assim como a taxa de amostragem, uma taxa de bits mais alta geralmente indica melhor qualidade de áudio.
  3. Codecs de áudio. Algoritmos que comprimem e descomprimem áudio digital. Por décadas, o codec de banda estreita G.711 (sinta-se à vontade para ler isso na voz do C-3P0) foi o padrão para telefonia. Mas agora entramos em uma era em que codecs HD como G.722 (mesmo) e outros atendem aos padrões de banda larga e fornecem áudio de maior qualidade.
  4. Largura de banda . No final das contas, sua largura de banda talvez seja a peça mais crítica para a qualidade do áudio em chamadas VoIP e videoconferências. A maioria das plataformas terá como padrão um codec de áudio de banda estreita se a velocidade de upload for baixa. Com uma velocidade de internet mais rápida, estão disponíveis codecs de banda larga e banda completa, que fornecem áudio HD.
Pare por um momento para refletir sobre como uma videoconferência pode complicar essas variáveis. Mesmo um punhado de participantes – alguns usando uma rede celular por meio de seu smartphone, alguns usando laptops ou outros dispositivos, todos com velocidades e provedores de internet variados – adiciona camadas de possíveis problemas de áudio.

Por que a qualidade do som é importante para videoconferência?

Estamos nos aproximando de dois anos desde que a COVID-19 mudou de repente nosso mundo e o paradigma de trabalho. É importante observar como a mudança global para o trabalho híbrido e remoto afetou os profissionais, considerando a frequência com que conversamos e colaboramos uns com os outros por vídeo. À medida que mais pesquisas e análises surgem, vemos que a exaustão com a videoconferência está aumentando. Sabemos que quase metade dos profissionais relatam sentimentos de isolamento ao trabalhar remotamente e que 61% afirmaram que a fadiga das videoconferências aumentou. Talvez ainda mais preocupante: 90% dos entrevistados da pesquisa enfrentam problemas de colaboração ao trabalhar em casa. Quando se trata de som, os problemas potenciais são fáceis de identificar:
  • A largura de banda estendida pode prejudicar a qualidade do seu áudio. Pense naquela ansiedade instantânea quando os colegas dizem que seu áudio está cortado!
  • O som reverberante também pode interromper as reuniões e tornar a experiência de áudio desagradável para todos.
  • Crosstalk apresenta um desafio para aqueles que são mais reticentes em falar, uma questão gritante para empresas focadas em criar experiências inclusivas.
  • Ruídos de fundo constantes e não bordados podem parar um orador, distrair o ouvinte e prejudicar completamente a reunião.
Com o tempo, esses problemas podem se transformar em ansiedades de longo prazo e em maior escala sobre a colaboração virtual. Se tivermos problemas contínuos com o desempenho do áudio, menos queremos colaborar. Essa é realmente a chave aqui, e algo que damos como certo. O som é um aspecto primordial e central da nossa experiência diária, seja colaborando ou simplesmente percebendo o mundo. Pesquisas mostram que o som em certos contextos pode ser um grande apaziguador do estresse. Por outro lado, estudos também revelaram que o som pode causar ansiedade e até depressão. No seu livro O design do dia a dia , Don Norman observa a dupla natureza do som no contexto do design do produto, especificamente como um significante para os usuários:
“O som é complicado. Pode incomodar e distrair tão facilmente quanto pode ajudar. Uma das virtudes dos sons é que eles podem ser detectados mesmo quando a atenção é aplicada em outro lugar. Mas essa virtude também é um déficit, pois os sons são muitas vezes intrusivos.”
Então, como começamos a superar a ansiedade de áudio e o que exatamente acontece para uma melhor qualidade de som quando fazemos videoconferência?

Qual é a melhor qualidade de som para videoconferência?

Como observamos neste artigo, largura de banda, compactação e codecs são cruciais para a qualidade do áudio. Então, vamos mergulhar um pouco mais fundo na diferença entre banda larga (HD) e áudio de banda estreita. O áudio de banda estreita usa um codec de fala Adaptive Multi-Rate (AMR). Essencialmente, os codecs AMR utilizam uma faixa de frequência de som limitada ao compactar e transmitir em uma transmissão ao vivo (200 Hz a 3,4 kHz). O codec AMR também possui uma taxa de bits variável que muda com base na largura de banda (cerca de 5-12 kbps). Nos casos em que a qualidade do som é ruim, é provável que seja devido a problemas associados à baixa largura de banda – o codec AMR está mudando para uma taxa de bits mais baixa para acomodar. À medida que a internet de alta velocidade se torna mais acessível, o som de maior qualidade ocupa o centro do palco: áudio de banda larga, um formato de alta definição projetado especificamente para VoIP. A banda larga usa codecs de voz Adaptive Multi-Rate Wideband (AMR-WB) que fornecem uma faixa de frequência mais ampla (50 Hz – 7 kHz). Isso significa que sons mais agudos e graves são captados e transmitidos, proporcionando uma qualidade de som muito mais rica e robusta. Como mencionamos anteriormente, velocidades de internet mais baixas tendem a tornar as soluções de videoconferência padrão para um codec de áudio de banda estreita. Velocidades mais rápidas abrem a capacidade de usar codecs de banda larga (HD). Mas isso soa um pouco antidemocrático, certo? A velocidade da internet realmente deve ditar a inclusão nesse grau? É por isso que o Webex utiliza o Opus (um codec de áudio mais versátil e escalável) para manter uma experiência de áudio inclusiva para todos os participantes. O Opus pode fornecer grande qualidade de áudio mesmo em taxas de bits mais baixas. Mas também pode flexionar seus músculos para áudio de banda larga e banda completa, que cobre mais do espectro sonoro do que os humanos podem perceber (20 Hz – 20 kHz). Opus pode fornecer excelente qualidade de áudio Devemos parar para destacar como a flexibilidade do Opus recentemente ajudou a resolver um desafio de colaboração centrado nas pessoas. A capacidade do Opus de fornecer áudio cristalino em todo o espectro de frequência de som torna recursos como o modo de música Webex possíveis. Neste modo de áudio, o som é otimizado para música em vez de fala humana, preservando o som original com muito mais clareza. O Coral Infantil de Indianápolis (ICC) ficou de fora e incapaz de praticar juntos por meses devido à pandemia. Eles decidiram usar o modo de música para aumentar a prática do coral. E eles também forneceram feedback para ajudar o Webex a melhorar ainda mais o recurso.

Confira este vídeo para ver como o modo de música capacitou o ICC a retornar e exercer sua paixão diante de obstáculos sem precedentes:

Com tantas peças em movimento e sobrepostas afetando o som da sua videoconferência, é importante considerar outros desafios em potencial.

Vamos explorar como o hardware pode transformar a forma como você ouve e o que seus colegas ouvem durante a videoconferência.

O papel do hardware na qualidade do som

Imagem de um conjunto de microfones com cabo.

O conjunto de microfones Cisco.

Em um nível muito básico, o sinal acústico que seu microfone capta é quase tudo. Este é o primeiro ponto de contato antes da digitalização, compactação e descompactação. Um microfone de computador simples, um microfone externo, um dispositivo com um conjunto de microfones podem afetar problemas de áudio específicos, como reverberação ou som metálico.  Dependendo do seu próprio estilo e espaço de trabalho, diferentes tipos de dispositivos podem otimizar drasticamente sua experiência de áudio, tanto o que você ouve quanto como é ouvido. Eu conversei com nosso Engenheiro Acústico Patrick Achtelik , sobre o hardware Webex e a tecnologia de áudio avançada que aprimora a voz do locutor ao mesmo tempo em que reduz ruídos indesejados. 
Imagem de Patrick em Land's End olhando para o Oceano Pacífico.

Este é Patrick.

“O beamforming essencialmente usa vários microfones que são omnidirecionais”, explicou Patrick. “O próprio microfone capta o som igualmente de todas as direções.”     No entanto, à medida que você coloca mais microfones omnidirecionais juntos, você pode torná-los mais diretivos. Como resultado, os microfones são mais eficazes para mais frequências de som. Como observa Patrick:   “Para obter diretividade em uma faixa de frequência maior, você precisa de mais microfones. No Desk Pro , por exemplo, no lado esquerdo da moldura existem 6 microfones beamforming espalhados em diferentes distâncias, mas não espaçados igualmente. Isso permite que os microfones funcionem em diferentes frequências e em diferentes bandas de frequência.”  
Desk Pro em um espaço de trabalho doméstico.

Este é o Webex Desk Pro.

Esse alinhamento também significa que os sons acima e abaixo do dispositivo não são captados, enquanto os sons na frente do conjunto de microfones – como sua voz – são focados e otimizados.    Mas isso é apenas uma peça do quebra-cabeça. Patrick descreveu um casamento importante entre software e hardware que afeta muito a forma como os falantes e ouvintes evitam armadilhas como o eco, que às vezes pode parecer fora de nosso controle: “O cancelamento de eco acústico (AEC) precisa funcionar perfeitamente bem para que o Webex full duplex funcione. O microfone do lado de uma pessoa também capta o som do alto-falante. Sem o AEC, você se ouviria ecoando de volta.” A funcionalidade AEC é fundamental para a videoconferência. Quando pensamos em full duplex, uma tecnologia que permite que vários locutores falem ao mesmo tempo, pensamos em algo que deveria funcionar o tempo todo, mas muitas plataformas sem recursos que levam em conta o eco e a reverberação acabam falhando. Patrick deixou claro o quanto a distância é importante:   
“Ouvir um eco pode começar com distorção do alto-falante. Se você aumentar o volume em pequenos alto-falantes de laptop, eles distorcem rapidamente. A distância física pode reduzir a quantidade de som que vai do alto-falante para o microfone, mas também pode colocar o microfone mais próximo do usuário. O que torna sua voz mais clara!”
Reserve um momento para ver a relação entre microfones e alto-falantes no vlog Focus on Sound de Patrick aqui: 

Quais são os melhores dispositivos para qualidade de som e videoconferência?

Para profissionais remotos e híbridos, dar um upgrade no fone de ouvido pode ser um ótimo primeiro passo para o aprimoramento de áudio. Por quê? Patrick explicou:  
 
“Os microfones embutidos dos laptops estão relativamente distantes do usuário e próximos dos alto-falantes do laptop. Na maioria das vezes, sua voz pode ter uma qualidade distante e o AEC pode ter problemas devido à proximidade dos alto-falantes. Um fone de ouvido interrompe a conexão acústica entre o alto-falante e o microfone, pois o som nos fones de ouvido não chega ao microfone do fone de ouvido.”
Esboços e fotografias de design de fone de ouvido.

A jornada do fone de ouvido Cisco 730, do esboço ao produto final.

O fone de ouvido Cisco 730, ganhador do Red Dot , ajuda a cristalizar o som da videoconferência. O design é sem boom para uma experiência de fala mais natural (não há mais boom de microfone na frente da boca). Possui tecnologia beamforming, com 4 microfones dispostos no fone de ouvido para formar uma espécie de bolha de áudio que se concentra na sua voz. Este fone de ouvido pode passar do cancelamento de ruído adaptável, que se ajusta automaticamente a ambientes ruidosos, para o modo ambiente, para que você possa ouvir conversas em um espaço de trabalho compartilhado se estiver sentindo uma vibração mais colaborativa.  O mais novo fone de ouvido Cisco , projetado em parceria com a Bang & Olufsen, líder do setor, oferece ainda mais recursos de áudio. Os microfones (6) são cuidadosamente posicionados em um design geométrico para isolar melhor sua voz enquanto utilizam algoritmos avançados para cancelar o ruído de fundo. 
Fones de ouvido Bang & Olufson

Fone de ouvido Bang & Olufson Cisco 980

Mesmo uma simples mudança do microfone do laptop para um fone de ouvido transformará a maneira como você participa das reuniões.  Mas, quando você está considerando uma revisão em sua experiência de videoconferência, dispositivos de colaboração como o novo Webex Desk Mini podem ser a resposta. Repleto de tecnologia de matriz de microfone inteligente e captação de som focada que discutimos, este dispositivo também fornece vídeo HD e permite que você cocrie em tempo real com quadro de comunicações digital.  
Webex Desk Pro Minis organizados por cor

O Webex Desk Mini

Em essência, podemos pensar no hardware como o motor da nossa experiência de áudio, o motor que impulsiona o que ouvimos e como somos ouvidos. Se for esse o caso, podemos pensar no software como o combustível que  dá a ignição do motor e impulsiona seu  desempenho.  

Quais recursos de software melhoram o som nas videochamadas? 

Todos nós esperamos por isso, e muitos de nós tememos: o manto do ruído de fundo. Desde que o mundo mudou para o trabalho híbrido , ele tornou-se um dos desafios mais difíceis que os profissionais tiveram que enfrentar.  Mas não é de se surpreender que o ruído de fundo cause estresse. O cenário de videoconferência é um microcosmo de um problema enfrentado em todo o mundo. Pesquisas mostram que o incômodo do ruído em geral é real e nocivo . E é crucial entender que a ansiedade é causada especificamente por sons indesejados . Quando um cachorro late para um entregador. Quando uma criança interrompe enquanto você está ouvindo detalhes importantes do projeto, ou um liquidificador ou aspirador de pó liga quando você está pronto para entrar na conversa.  Queremos uma experiência de trabalho focada em um ambiente que muitas vezes é tudo menos isso. Para obter essa experiência, precisamos de tecnologia para combater os desafios de áudio que às vezes estão fora do nosso controle. E a tecnologia está à altura da tarefa.  Em 2020, a Cisco adquiriu o BabbleLabs, líder em software de remoção de ruído. Usando IA e aprendizado de máquina, eles aprimoraram a remoção de ruído na ferramenta Webex e trouxeram uma tecnologia impressionante e revolucionária para a linha de frente.  O aprendizado de máquina encapsula muitos processos granulares e complexos. Inúmeras horas de dados de treinamento são usadas para permitir que algoritmos de aprendizado de máquina diferenciem a fala humana do som. Quando implantados, ruídos específicos são identificados e removidos antes de serem transmitidos e ouvidos. Isso também exige muita criatividade humana, especificamente deduzir quais ruídos têm maior probabilidade de interromper e distrair as pessoas que trabalham em casa.  Para entender melhor como a IA transformou a experiência Webex do ponto de vista do áudio, I conversei com outro especialista : Keith Griffin , engenheiro distinto de IA e aprendizado de máquina em nosso escritório de CTO.
Imagem de Keith ao lado de um mural do logotipo da Cisco

Este é Keith.

“Quando você pede para as pessoas repetirem ou, se estiver em um ambiente barulhento, você se sente mal.” Essa era uma fonte de ansiedade nos anos anteriores à pandemia, explicou Keith. “No passado, as pessoas não participavam porque não estavam confiantes no ambiente em que estavam.”   Mas os recursos implantados pelo Webex buscaram enfrentar esses desafios, que foram intensificados pela pandemia e pela mudança para o trabalho híbrido. Um excelente exemplo é o recurso Otimizar para minha voz, que incorpora o conceito fundamental de distância que Patrick enfatizou. “Estou surpreso ao ver o que nossas equipes de Aprendizado de máquina/IA conseguiram alcançar”, disse Keith. “Não apenas com a remoção de ruído, mas em como eles estão evoluindo a tecnologia para resolver outros casos de uso, como otimizar minha voz. O que Otimizar para minha voz faz é determinar o alto-falante ativo com base em vários parâmetros. Ele pega o alto-falante principal e qualquer outra voz humana detectada é filtrada.”  Quando se trata de remoção de ruído, Keith observou algumas das especificidades mais intrigantes do aprendizado de máquina. Para cobrir o maior número possível de bases, o software Webex pode identificar e remover sons como toques no teclado, sirenes (o software é capaz de reconhecer sons de sirenes de diferentes países), máquinas de jardim e cães latindo. Na verdade, nosso projeto original de detector de ruído pode identificar mais de 100 raças diferentes de cães por seu latido distinto.  Como Keith descreveu, a remoção de ruído é mais do que apenas remover o ruído de fundo. É tão eficaz que permite uma colaboração mais inclusiva e flexível. E isso significa que as equipes se envolvem com confiança durante a experiência da reunião.  “Minha reunião de liderança local para a Cisco Galway tem até 14 pessoas em horários diferentes. Hoje, havia 12 na chamada. Três estavam no carro voltando depois de deixar os filhos na escola. Quatro dos membros da equipe estavam passeando com seus cachorros.”  Essa história é *super* importante em termos de como pensamos sobre qualidade de áudio, ansiedade de áudio, fadiga de videoconferência e como cada um afeta a colaboração da equipe. Keith disse:
Existem tipos de reuniões em que as pessoas devem ser capazes de continuar em sua vida cotidiana e se sentir confiantes em participar de uma reunião, independentemente do ambiente.   D o carro ou caminhando,   p ode haver cachorros latindo e carros passando , mas eles sabem que tudo o que vamos ouvir é a voz deles. É exatamente o que ajuda no trabalho híbrido e na qualidade do áudio.”
A quantidade de trabalho para implantar o Webex Audio Intelligence, que abrange a remoção de ruído, otimização para minha voz e muito mais, foi enorme. Os resultados? Até o momento, o Webex removeu 16 bilhões de minutos de ruído de fundo das videoconferências de nossos usuários.  Essas inovações no mundo do áudio se traduzem em benefícios reais e tangíveis para profissionais e organizações. É por isso que a Aragon Research identificou novamente o Webex como líder em software de videoconferência .  Agora que exploramos o que contribui para uma melhor qualidade de som – hardware de ponta, software avançado e IA poderosa – é hora de dar algumas dicas práticas para melhorar sua experiência de áudio. 

Dicas de como melhorar a qualidade do som da videoconferência

Dica 1 Faça um balanço dos espaços onde você faz videoconferências com mais frequência. Qual a probabilidade de ruídos indesejados interromperem em uma determinada hora do dia? Como você costuma soar para seus colegas? O Webex facilita o teste do seu microfone com antecedência    Dica 2 Mergulhe no básico da acústica da sala para que você possa se sentir mais confortável resolvendo problemas de som do dia a dia. Nosso amigo Patrick pode ajudá-lo a começar:

Dica 3 Não use o microfone do seu computador se não for necessário! Se você prefere fones de ouvido básicos, um microfone externo ou a qualidade superior de um fone de ouvido Cisco, afastar-se do microfone do computador é a maneira mais rápida de aliviar a ansiedade do áudio e melhorar a qualidade do som.  Dica 4 Quando você tiver tempo para um trabalho focado, use a natureza positiva do som. Toque sua playlist de concentração e coloque seu fone de ouvido Cisco. Ou ative o modo de música em sua reunião Webex se você e sua equipe quiserem fazer algum trabalho de foco em tempo real juntos.   Dica 5 Teste a remoção de ruído com seus colegas de equipe para ter uma noção do que eles não conseguem ouvir. Muitas vezes, ouvimos nosso cachorro latindo e pedimos desculpas. Nossos colegas vão dizer, pelo que? À medida que você entende o quanto o ruído é removido, você começará a se distrair menos porque saberá que ninguém está ouvindo além de você. 
Ajude sua equipe a vencer a ansiedade de áudio e enfrentar a fadiga explorando o áudio Webex e os produtos que o tornam superior.
Saiba mais Os cinco principais recursos de fone de ouvido para áudio de qualidade em casa Soe bem em todas as chamadas – Três dicas para um áudio excelente Webex + Shure: Resolvendo a equação de áudio para a sala de reuniões    

About The Author

Reilly Nolan
Reilly Nolan Content Writer Cisco
Reilly Nolan is a content writer for Webex.
Learn more

Topics


More like this