BabbleLabs – 適用於 Cisco Webex Meetings 的人工智慧音訊尖端技術

On By Webex Team1 Min Read

說到享有最佳視訊會議體驗,人們通常會對於視覺效果感到興奮期待。 Cisco Webex Meetings 在此方面的確是業界領導廠商,提供使用者漸進式功能,例如可自訂的檢視、手勢和回應、進階視訊版面配置及沉浸式共用。 我個人特別喜愛有趣的背景,且樂於收到會議參加者給予之豎起大拇指的表情符號。 如今,我想要談談透過清晰無雜音的語音,在視訊會議中實現絕佳音訊的重要性。 根據 Gartner 資料,2024 年時,將僅有 25% 的會議會在現場舉辦。 隨著大多數會議皆透過會議解決方案舉行,提供清晰易懂的語音不僅令人愉快,更是至關重要的事。 組織的表現與其提供多樣化、分散式勞動力的能力,取決於人們彼此瞭解的程度。 說話和聆聽為瞭解的重要核心。

發展有效語音增強技術時面臨的挑戰

在辦公室舉行視訊會議時,瞭解會議參加者可能相當困難。 當系統嘗試透過複雜的全域網路將音訊串流推送至數百名同事時,如果您是在吵雜的家中工作,使用網路連線受限的筆記型電腦,情況可能更為糟糕。 在過去,演算法一直努力從語音中擷取實用的資訊,以產生清晰的視訊會議音訊體驗,來減輕人類的認知負擔和電子產品的運算負載。 該技術努力克服雜音量、殘響程度、說話者數量、頻寬及延遲限制, 全力處理封包遺失和壓縮音訊的效果,同時尊重使用者的隱私權和資料安全性。 此外,語音中所發現的雜音相當多樣,演算法開發人員須不斷努力瞭解應從語音中分離的音訊(哪些是語音,哪些不是語音)。 因此,開發人員會著重於抑制振幅和頻率中長時間出現的恆定靜態雜音,例如風扇和馬達。 但是,最令人困擾的是突然出現的雜音:狗吠叫、喇叭鳴響、鍵盤敲打聲及嘈雜的背景雜音。 此外許多環境(尤其是並未針對隔音設計的家庭辦公室)殘響或「回音」程度相當高。

透過 Cisco Webex Meetings 達到更充分的理解

現今,神經網路語音方法開始對我們解決此類問題的效率產生重大影響。 身為 BabbleLabs(2020 年 10 月由思科收購)創辦人和執行長,我的團隊與我正不斷努力開發同級最佳的語音增強功能。 我們目前正在實作人工智慧音訊尖端技術成為 Webex Voice Technology 團隊的一部份。 我們是怎麼做的呢? 簡單來說,我們採用神經網路架構、收集數十萬小時的語音和雜音、數萬小時的室內聲響,並建立精確調整的模型以轉換語音。 我們僅以 10 毫秒的延遲即可完成此作業。 語音增強近期在視訊會議領域已成為主流。 每個人皆具有自己的版本,但並非每個人皆能達到相同結果。 我們的系統測試顯示 Cisco Webex Meetings 語音增強演算法為最有效的技術,可供廣泛商業使用。 我們使用相同品質工具評量大多數市售視訊會議系統:ITU 標準 P.862 – 語音品質感知評估(Perceptual Evaluation of Speech Quality,簡稱 PESQ)及三種大型一般雜音和殘響串流套件(一種由思科開發,其他兩種由 Microsoft 開發)。 在所有測試當中,Webex 消除較多的雜音與殘響,其獲得的評分大幅領先最新的 Zoom (5.4.1) 和 Microsoft Teams (1.4.00.4167) 版本。 此語音增強技術自兩年前首次公開發佈,加上思科加速投入資源後,我們已提升 2 倍以上的語音品質,並降低運算需求,提升 400 倍速度執行此類模型。 會議系統語音增強

Cisco Webex Meetings 語音技術的未來發展為何?

我們持續挑戰極限以提升效能層級,並進一步降低運算負載,以實現普遍採用的無痛實作。 我們可以瞭解發言人是誰與其所在位置,並且從環境中消除惱人的背景雜音,同時放大其語音。 人工智慧將提供我們部分全新的強大工具,以擷取詳細深入分析,更輕鬆地進行通訊。 我們即將發佈全新的智慧功能,為語音理解帶來更大的變革,其中包括:

  • 語音增強技術可在會議中區別說話清楚的發言人:精確擷取靠近麥克風的說話者,而非距離較遠者,如此我們將可視需要抑制或提升語音。
  • 適用於智慧型裝置的全新語音增強功能:全新實作與功能可運用高階筆記型電腦、裝置及電話的效能。
  • 使用獨特語音增強演算法的指令辨識:為輔助 Webex 的大型詞彙語音助理和轉錄技術,並為全新指令帶來高效率邊緣執行、高準確性及簡易設定。

我們生活在吵雜的環境之中,但您不需要因此停止生產力。 語音增強功能已在 Cisco Webex Meeting 產品中提供大量部署達七個月以上。 此功能不僅能消除雜音,更可增強語音與語音理解,同時保持思科對於隱私權、安全性及公平性的基本承諾。 想要親耳見證語音增強技術的運作,以及深入瞭解有關 Cisco Webex Meeting 語音增強演算法的資訊?

觀看 Cisco Live 演講 BabbleLabs – 人工智慧語音尖端技術,目前可供 Cisco Live All Access 通行證持有者,以及於初夏時註冊 Cisco Live 帳戶的一般大眾觀看。

深入瞭解 人工智慧語音增強功能崛起,創造更棒的團隊協作 MindMeld 的交談式人工智慧 Webex 最新消息:2021 年 5 月

About The Author

Webex Team
Webex is a leading provider of cloud-based collaboration solutions which includes video meetings, calling, messaging, events, customer experience solutions like contact center, and purpose-built collaboration devices..
Learn more

Topics


More like this