시각적인 요소는 최상의 비디오 회의 경험을 제공하는 데 있어서 매우 중요합니다. Cisco Webex Meetings는 사용자에게 맞춤형 뷰, 제스처 및 반응, 고급 비디오 레이아웃 및 몰입을 유도하는 공유와 같은 혁신적인 기능을 제공하여 이 영역에서 업계를 선도하는 제품입니다. 저는 개인적으로 재미있는 배경이 정말 마음에 듭니다. 그리고 미팅 참가자들이 이모티콘을 사용하는 기능은 정말 최고죠. 그러나 오늘은 비디오 회의에서 또렷하고 소음이 제거된 음성으로 고음질의 오디오를 제공하는 것이 얼마나 중요한지에 대해 이야기하려고 합니다. Gartner는 2024년에는 전체 미팅 중 25%만이 오프라인에서 열릴 것으로 예상합니다. 대부분의 미팅이 회의 솔루션을 사용하여 진행되기 때문에 발언을 명확하게 전달하는 기능은 고급 옵션이 아니라 필수적입니다. 조직의 성과와 여러 지역에 분산된 다양한 인력을 제공하는 능력은 사람들이 서로를 얼마나 잘 이해할 수 있는지에 달려 있습니다. 말하고 듣는 것은 서로를 이해하는 데 가장 중요합니다.
효과적인 음성 향상 기술 개발에 있어서의 문제
사무실에서 비디오 회의에 참여할 때 미팅 참가자의 말을 이해하는 것은 어려울 수 있습니다. 소음이 있는 집에서 느린 네트워크 연결을 통해 노트북으로 참여하는 경우에는 더욱 힘듭니다. 100명의 참가자가 시스템의 복잡한 글로벌 네트워크를 통해 오디오를 스트리밍해야 하죠. 과거에는 알고리즘이 음성에서 유용한 정보를 추출하여 비디오 회의에서 또렷한 오디오 경험을 제공하는 방식으로 사람의 인지적인 노력과 전자제품의 계산 부하를 덜었습니다. 이러한 알고리즘에서는 소음의 양, 반향 정도, 참가자 수, 대역폭 및 대기 시간 제한 등을 모두 고려해야 했습니다. 패킷 손실과 오디오 압축 시의 영향에 대응하고 사용자의 개인 정보와 데이터를 보호해야 했죠. 또한 음성에는 매우 다양한 소음이 섞여 있기 때문에 알고리즘 개발자들은 참가자의 음성이 아닌 다른 소음을 구분해야 하는 어려움이 있었습니다. 따라서 개발자들은 팬과 모터 소리 등 시간이 경과해도 진폭과 주파수가 일정한, 고정적인 소음을 제거하는 데 초점을 맞췄습니다. 그러나 가장 까다로운 소음은 개 짖는 소리, 자동차 경적, 키보드, 주변의 이야기 소리 등 일시적인 소음입니다. 거기에 여러 환경, 특히 재택 근무 환경은 음향적으로 완벽하게 설계되지 않아 소리가 크게 울립니다.
Cisco Webex Meetings로 미팅 대화에 대한 이해도 높이기
현재 신경망 음성은 이러한 문제를 효과적으로 해결하는 데 있어 매우 획기적인 방법을 제공합니다. 2020년 10월에 Cisco가 인수한 BabbleLabs의 설립자이자 CEO로서, 저와 제 팀은 동급 최강의 오디오 향상 기술을 개발하기 위해 노력해 왔으며 이제 Webex 음성 기술 팀의 일부로 AI Audio Wizardry를 구현합니다. 그 방식은 무엇일까요? 최대한 쉽게 설명하자면, 신경망 구조를 사용하고 수십만 시간 분량의 음성 및 소음과 수만 시간 분량의 환경 음향을 수집한 다음 정확히 조정된 모델을 개발하여 음성을 변환합니다. 대기 시간은 불과 10밀리초에 불과합니다. 음질 향상은 최근 비디오 회의에서 핵심 기능으로 떠올랐습니다. 모두가 비슷한 기능을 출시하지만, 모두가 동일한 결과를 제공하지는 않습니다. Cisco Webex Meetings의 음질 향상 알고리즘은 내부에서 실시한 체계적인 테스트에서 보편적이고 상업적인 용도로 사용하기에 가장 효과적인 것으로 확인되었습니다. 동일한 품질 도구를 사용하여 현재 출시된 비디오 회의 시스템 대부분을 측정했습니다. 이는 ITU 표준 P.862 – PESQ(Perceptual Evaluation of Speech Quality)와 세 가지 대표적인 소음 및 반향 스트리밍 제품군입니다(하나는 Cisco, 다른 두 개는 Microsoft). Webex는 모든 테스트에서 더 많은 소음과 반향을 제거했으며 Zoom(5.4.1)과 Microsoft Teams(1.4.00.4167) 릴리스보다 훨씬 더 높은 점수를 기록했습니다. 2년 전에 이 음질 향상 기술의 첫 번째 릴리스를 공개한 이후 Cisco의 적극적인 리소스 투입에 힘입어 음질을 두 배 이상 향상하고 더 적은 컴퓨팅 능력으로 이러한 모델을 400배 더 빠르게 실행할 수 있게 개선했습니다.
Cisco Webex Meetings 음성 기술을 잇는 기술에는 무엇이 있을까요?
Cisco에서는 더 높은 수준의 성능을 제공하고 컴퓨팅 부하를 더욱 줄여서 원활한 유비쿼터스 구현을 달성하기 위해 계속 모든 노력을 다하고 있습니다. 발언자가 누구인지, 그들이 어디에 있는지 이해하고, 발언자의 음성은 증폭시키면서 주의를 산만하게 하는 주변 환경 소음은 제거할 수 있습니다. AI는 더 적은 노력으로 더 많은 인사이트를 추출하고 의사소통할 수 있는 잠재력을 갖춘 새로운 도구입니다. Cisco는 회의 대화 이해도를 큰 폭으로 끌어올리는, 스마트한 새 기능을 곧 출시할 예정입니다.
- 회의실 환경에서 발언자의 음성이 더 잘 들리게 하는 음질 향상: 마이크 근처에 있는 발언자를 멀리 떨어진 사람들로부터 정확히 구분하여 필요에 따라 음성을 숨기거나 증폭할 수 있습니다.
- 스마트 디바이스를 위한 음질 향상 기능: 최신 노트북, 디바이스 및 휴대폰의 잠재력을 활용하는 새로운 구현 및 기능
- 고유한 음질 향상 알고리즘을 사용한 명령 인식: Webex의 대규모 어휘 음성 어시스턴트 및 텍스트 변환 기술을 보완하고 새로운 명령에 대해 효과적인 엣지 실행, 높은 정확도 및 쉬운 구성을 제공합니다.
소음으로 가득한 세상에 살고 있다고 해서 생산성을 양보할 수는 없습니다. 음질 향상 기술이 Cisco Webex Meeting 제품의 음량 배포에 탑재된 지 7개월이 지났습니다. 이 기술은 단순히 소음을 제거하는 것 이상의 우수한 성능을 발휘했습니다. 음질과 커뮤니케이션 이해도를 높일 뿐만 아니라 개인 정보 보호, 보안 및 공정성에 대한 기본적인 Cisco의 노력을 더욱 강화했습니다. Cisco의 음질 향상 기술 데모를 확인하고 Cisco Webex Meeting의 음질 향상 알고리즘에 대해 자세히 알고 싶으신가요?
Cisco Live All Access 패스 소유자와 초여름에 Cisco Live 계정에 등록한 일반인은 Cisco Live 토크 BabbleLabs – AI Audio Wizardry 를 시청할 수 있습니다.
자세히 보기 대세로 떠오른 AI 음질 향상 기술 및 팀 협업 향상 MindMeld의 대화형 AI Webex의 새로운 기능: 2021년 5월