聲音是至關緊要的因素:視訊會議中音訊品質所扮演的角色

On By Reilly Nolan1 Min Read
Man with headset listening to audio with smartphone_ccexpress
這是我們所知的混合工作模式:如同數位工作場一樣,挑戰也是不斷地演進當中。我們知道,對於持續使用視訊會議的工作人員來說,會議疲勞的狀況一直是揮之不去的困擾。 不過,持續使用攝影機並不是造成疲勞的唯一因素。拿冰山來做比喻:除了突出水面的尖端外,水面下有著更龐大的結構;視訊會議疲勞僅僅只是身為混合式工作者與遠端工作者的我們所感受到完整疲勞狀況的一小部份。 到底什麼才是造成這座焦慮冰山的狀況?對大多數的人來說,聲音才是關鍵。

音質到底是指什麼?

您是否能夠回憶起完全沉浸在聲音魅力的時刻?在安靜的公路上長途駕駛時,把音響開得震天價響。隆冬時分的海灘上,驚濤裂岸,兩人面對面時的心潮澎湃。在狹窄的酒吧中觀賞一場精彩現場演出,聲響震耳欲聾,但人人都十分盡興。號角響起的時候,從遙遠的銀河出現某個電影系列的史詩級簡介文字。 我們對聲音的體驗其實相當主觀,聲音可以讓我們感到安適,但有時也令人煩躁。工作播放清單上對某人而言是放鬆的環境音樂,有可能對他人來說並非如此。我們之中有些人在枯燥乏味的工作中需要播放 Podcast 當作背景聲音,但有些人在專心工作時就沒辦法聆聽 Podcast。 但以上所有這些例子都假設了一件事情:清晰順暢的音訊播放。在數位時代,聲音壓縮與串流技術已經發展到令人難以置信的精確程度;因此,這種音效體驗不再只是有錢人的專利,而是我們對聲音的基本要求。 那麼,到底什麼因素使我們能夠區別所期待(即使不是渴望)的豐富聲音體驗?讓我們花一點時間談談基本概念。 聲波 聲音會以波的形式傳送,是因為不同頻率在空氣中產生振動的緣故。這些頻率的測量單位是赫茲(Hertz,Hz),我們將其稱為「音調」。人類說話的聲音頻率範圍從 80 Hz 到 14 kHz(千赫)。我們耳朵所能聽見的音調範圍則是從 20 Hz 到 20 kHz。頻率較低,表示音調較低,例如內燃機燃燒、放克音樂低音聲部,或男中音歌手的聲音。較高頻率的聲波表示聲音音調較高,比如用叉子敲打玻璃或吹口哨的聲音。 但是,當我們播送聲音時,過程就稍微複雜一點。我們從無線電發射機開始,這台機器會產生包含音訊資訊的電氣訊號。接著,天線會放大該訊號,由無線電波負載傳送至無線電接收器。然後,接收器就會擷取資訊,並將訊號傳送至裝置(喇叭、顯示螢幕等)。 在 20 世紀初期,這些元件各自分開且十分龐大,連接城市中各個街區的摩天大樓。這個一如魔法般的功能提供眾人相同的體驗,成功地將世人連結在一起。 時至今日又如何呢?每一台智慧型手機都採用此技術。聲音會即時分解、數位化,並從連線到網際網路的任一裝置上傳輸至世界各地。 至於視訊會議,現在大部分參加者的音訊是經由 VoIP(網際網路通訊協定語音傳輸技術)傳輸的。基本上,您的音訊會透過網際網路,而非透過行動通訊網路來傳送。VoIP 視訊會議的音訊品質更仰賴個人的網際網路速度,這與傳統電話通話仰賴鄰近行動通信基地台的狀況不同。 音質會受到許多變數的影響,但以下 4 個方面是關鍵:
  1. 取樣率。每秒從原始類比音訊取樣的數位樣本數目。一般來說,取樣率越高表示音訊品質會越好,這會以 kHz 表示 (我們經常看到的標準電話是 8 或 16 kHz,串流音訊則是 44.1 kHz)。
  2. 位元速率這是指數位音訊檔案所包含的資料數量。 位元速率的測量單位是 kbps(每秒千位元)。與取樣率一樣,位元速率越高,表示音訊品質越好。
  3. 音訊轉碼器。這是指壓縮與解壓縮數位音訊的演算法。數十年來,電話所使用的標準編碼格式是 G.711 窄頻轉碼器(就像 C-3P0 說話的聲音那樣)。但我們現今身處的時代已經出現符合寬頻標準的高解析度轉碼器,如 G.722(相同)與其他格式,能夠提供更好的音訊品質。
  4. 頻寬歸根究底,您的頻寬也許才是影響 VoIP 通話與視訊會議音訊品質的最大關鍵。如果您的上傳速度緩慢,則大多數平台會預設使用窄頻音訊轉碼器。必須使用比較快的網際網路速度,才會使用能提供 HD 音訊的寬頻與全頻段轉碼器。
請花一點時間思考視訊會議如何能讓這些變數變得更加複雜。即使參加者不多,但因為有些人透過智慧型手機使用行動網路,有些人使用筆記型電腦或其他裝置,每個人使用的網際網路速度與網路供應商都不一樣,所以潛在音訊問題就一路疊加,形成更為複雜的狀況。

為什麼音質對視訊會議來說非常重要?

自從 COVID-19 突襲這個世界,造成生活與工作模式天翻地覆的改變,至今已經快滿兩年了。有鑑於我們經常透過視訊彼此交流與協同合作,因此全盤瞭解世轉移到混合式與遠端工作模式的方式對工作人員造成什麼影響是很重要的。 隨著越來越多研究與分析結果問世,我們也發現對視訊會議感到疲憊的問題不斷增加。我們知道將近一半的工作人員表示遠端工作讓他們感覺遭到孤立,61% 的人還表示視訊會議疲勞的狀況越來越頻繁。或許下面這個事實更令人感到擔憂:90% 的研究受訪者表示在家工作時發生過協同合作的問題。 談到聲音,我們很容易察覺潛在問題:
  • 延伸頻寬很容易對音訊品質造成負面影響。想想,當同事說「聽不到你的聲音!」時,你馬上出現的焦慮感。
  • 殘響聲音也會造成會議中斷,並且給所有人帶來不愉快的音訊體驗。
  • 對沉默寡言的人來說,彼此對話更是一個挑戰,對於力求建立具有包容性的公司來說,這是一個不容忽視的問題。
  • 持續不斷又無法消除的背景噪音會讓發言人停止說話、讓聽眾分心,甚至把一場會議破壞殆盡。
隨著時間,這些問題可以像滾雪球一般,演變成對虛擬協同合作的大規模長時間焦慮。如果我們持續遭遇音訊效能的問題,我們進行協同合作的意願就會降低。 這才是真正的關鍵,我們卻認為這是理所當然的。無論是進行協同合作,或只是觀察這個世界,聲音都是我們獲得每日經驗的主要核心層面。研究顯示,特定內容的聲音能成為絕佳的壓力釋放管道。相反的,研究也顯示聲音可以造成焦慮,甚至沮喪。 在《設計的心理學:人性化的產品設計如何改變世界》(The Design of Everyday Things) 一書中,Don Norman 指出產品設計內容中聲音的雙重本質,特別是對使用者而言所指涉的意義:
「聲音是個難以捉摸的元素。它能成為助力,但也很容易惹惱人,讓人分心。聲音的其中一個優點是即使注意力放在其他地方,也很容易察覺到。但這種優點卻是兩面刃,因為聲音經常太具侵略性。」
因此,我們到底要從何處著手克服音訊焦慮?當我們召開視訊會議時,如何才能達成更好的音質?

對視訊會議來說,什麼是最佳音質?

正如我們在前文中所讀到的,頻寬、壓縮與轉碼器對音訊品質來說都至關重要。因此,讓我們進一步討論寬頻 (HD) 與窄頻音訊之間的差異。 窄頻音訊使用的是「調適型多速率」(AMR) 語音轉碼器。基本上,在即時串流期間進行壓縮與傳輸時,AMR 轉碼器會利用有限聲音頻率範圍(200 Hz 至 3.4 kHz)。AMR 轉碼器也具備可變動的位元速率,能根據頻寬進行變更(約 5-12 kbps)。如果音質欠佳,問題很可能與低頻寬有關:AMR 轉碼器會改用較低位元速率來傳輸聲音。 隨著高速網際網路越來越普及,更好的音質也隨之成為主流:寬頻音訊,這是特別針對 VoIP 所設計的高傳真格式。 寬頻使用的是「調適型多速率寬頻」(AMR-WB) 語音轉碼器,能提供更寬泛的頻率範圍 (50 Hz – 7 kHz)這表示系統會拾取更高與更低音調的聲音來傳輸,提供更豐富飽滿的音質。 如先前所述,若網際網路的速度較慢,視訊會議解決方案預設會使用窄頻音訊轉碼器。更快的網路速度則開啟了使用寬頻 (HD) 轉碼器的時代。但這聽起來好像有點違反普及原則,不是嗎?網際網路速度真的應該主宰包容性到這種程度嗎? 這就是為什麼 Webex 要利用 Opus(一種更多元的可擴充音訊轉碼器),為所有參加者維持具有包容性的音訊體驗。 即使處於較低位元速率環境,Opus 也能提供絕佳的音訊品質。但它也能針對寬頻與全頻段音訊發揮所長,所涵蓋的聲音頻譜遠比人們可以察覺的範圍 (20 Hz – 20 kHz) 來得寬廣。 Opus 能提供絕佳的音訊品質 我們應該先不要關注 Opus 具備的彈性最近是如何協助解決以人為本的協同合作難題。 由於 Opus 能跨聲音頻率頻譜提供清晰無比的音訊,才能實現 Webex 音樂模式這樣的功能。在這種音訊模式中,聲音會針對音樂而非人類說話的聲音進行最佳化,讓原始聲音能夠更加清晰。 在疫情期間,印第安納坡里斯兒童合唱團(Indianapolis Children’s Choir,ICC)不僅無法演出,甚至有好幾個月無法集合練習。因此,他們決定使用音樂模式來逐步恢復合唱練習。他們也提供意見回饋,協助 Webex 進一步改善這項功能。

請觀賞這段影片,瞭解音樂模式如何協助 ICC 面對前所未見的阻礙時,仍能返回團練室,繼續延續著他們的音樂熱情:

由於有太多不斷變動又彼此交疊的因素會影響視訊會議的聲音,我們也必須要考慮到其他潛在挑戰。

現在讓我們瞭解硬體能如何轉換視訊會議期間您所聽到的聲音,以及同事所聽到的聲音。

硬體在音質這方面所扮演的角色

圖:接上纜線的 Microphone Array。

Cisco Microphone Array。

基本上,麥克風會拾取各種不同的聲響訊號。這是聲音在數位化、壓縮與解壓縮前的第一個接觸點。簡易的電腦麥克風、外接式麥克風、具備麥克風陣列的裝置都能影響特定音訊問題,例如殘響或細微的聲音。 依您的工作方式與工作場所而定,不同類型的裝置能大幅最佳化您的音訊體驗化,包括您所能聽到的聲音,以及他人如何聽到您的聲音。我與我們的聲學工程師 Patrick Achtelik 討論 Webex 硬體以及進階音訊技術,這項技術能在放大發言人語音的同時,減少惱人的噪音。 
圖:Patrick 從土地的盡頭望向太平洋。

這位是 Patrick。

Patrick 表示:「波束成形基本上會使用數支全向性麥克風。」。「麥克風會同時拾取來自四面八方的所有聲音。」 但是,集結更多全向性麥克風,就更能為這些麥克風定向。結果就是,麥克風能更有效率地拾取更多不同頻率的聲音。正如 Patrick 所說: 「要在較大頻率範圍中獲得指向性,就需要使用更多支麥克風。比方說,在 Desk Pro 裡,左側擋板中有 6 支波束成形麥克風,彼此間隔距離並不一樣。如此一來,麥克風就能在不同頻率與不同頻帶中運作。」
居家工作使用 Desk Pro 的情況。

這是 Webex Desk Pro。

這種排列方式也表示不會拾取來自裝置上方與下方的聲音,而是會集中拾取一排麥克風陣列前方的聲音 (比如您的聲音),且將聲音最佳化。   但這不過只是其中的一部份。Patrick 也說明了軟硬體之間重要的依存關係,這種依存關係能造成重大影響;尤其是對於發言人與聆聽者如何避免像回音這樣有時會讓人覺得狀況失控的隱憂來說: 「需要完美運作『回音消除』(AEC) 技術,才能讓 Webex 全雙工正常運作。在某人面前的麥克風也會收集喇叭傳來的聲音。因此,如果沒有 AEC,你就會聽到自己的回音。」 AEC 功能是視訊會議的關鍵。當我們想到全雙工(讓多位發言人同時說話的技術)時,就會想到應該時時都能正常運作的某些裝置,但許多平台都缺少能夠處理回音問題的功能,造成回音與殘響狀況一再打斷會議進行。Patrick 清楚說明為何距離問題如此重要:
「聽到回音可以從喇叭失真狀況開始。若你把筆記型電腦上那台小小的喇叭音量調高,傳出來的聲音很快就失真了。實際距離可以降低喇叭傳到麥克風上的音量,但也可以讓麥克風更靠近使用者。這就能讓你的聲音更加清楚了!」
請花一點時間到 Patrick 的「Focus on Sound」(關注聲音) 影音部落格,瞭解麥克風與喇叭之間的關係:

對音質與視訊會議來說,哪些裝置是最棒的?

對在遠端與混合式環境中工作的人員來說,升級耳機可以是強化音訊體驗絕佳的第一步驟。理由何在?對此,Patrick 說明如下:

「筆記型電腦中內建的麥克風離使用者太遠,又太靠近筆記型電腦中的喇叭。大部分時間,由於喇叭的接近程度,你的聲音可能聽起來就像從很遠的地方傳過來,AEC 功能也可能難以奏效。耳機能阻斷喇叭與麥克風之間的聲學連結,因為耳機上傳出的聲音不會傳到耳麥上。」
耳機設計的草圖與相片。

Cisco 730 耳機從草圖設計到最終產品的歷程。

榮獲紅點設計大獎Cisco 730 耳機能協助提供清晰無比的視訊會議聲音。其設計不會產生爆音,提供更為自然的說話體驗(在您的嘴邊不會再發生噴麥狀況)。耳機搭載波束成形技術,耳機內排列 4 支麥克風,能產生一種音訊泡泡,專門收集您的聲音。這款耳機能從調適型噪音消除功能(自動針對吵雜環境進行調整)移至環境模式,當您感覺到濃厚的協同合作氣氛時,就能在共用工作空間中聽到對話。 全新思科耳機,與業界領導者 Bang & Olufson 合作設計開發,能提供更多音訊功能。在其幾何設計中精心安排 6 支麥克風的位置,以便更妥善地隔離出您的聲音,同時運用進階演算法消除背景噪音。
Bang & Olufson 耳機

Bang & Olufson Cisco 980 耳機

即使是將麥克風從筆記型電腦麥克風移往耳機的小小變化,都能轉化您在會議中所體驗到的感受。但當您考量到要徹底翻新視訊會議體驗時,像全新 Webex Desk Mini 這樣的協同合作裝置可能才是答案。這個裝置不僅搭載我們已經討論過的智慧型麥克風陣列技術與聚焦式拾音技術,也提供高畫質視訊,讓您可以即時利用數位白板進行共同創作。
按照顏色排列的 Webex Desk Pro Mini

Webex Desk Mini

基本上,我們可以把硬體視為音訊體驗的引擎,這種原動力會影響我們所聽到的,以及我們如何讓他人聽到。若是如此,我們可以將軟體視為燃料,用來發動引擎,並提升其效能 

哪些軟體功能可以改善視訊通話的聲音? 

我們都知道會發生這種狀況,也是我們大多數人擔心的:聲音被背景噪音蓋掉。隨著這個世界轉移到混合工作模式,這是其中一種最嚴苛挑戰,更是工作人員必需想方設法解決的。 對於「背景噪音會給人帶來壓力」這件事,我們都不會感到訝異。視訊會議設定是全球各地的人們都感受到的痛點縮影。研究顯示:我們所碰到的噪音煩惱不僅是事實,還能造成傷害。此外還必需瞭解,惱人的聲音尤其會造成焦慮。在遞送包裹時狗狗吠叫。當您正在聆聽重要專案的細節時,孩子的聲音打斷您的思緒,或是您準備好要說話時,攪拌器或吸塵器正好開始運作。 我們都希望身處在享有專注工作體驗的環境中,但很多時候都是事與願違。為了獲得這樣的體驗,我們需要技術來對抗這些有時我們無法控制的音訊挑戰。而現在的技術已經能夠擔此大任。 2020 年,思科收購了噪音消除軟體領導者 BabbleLabs。他們使用 AI 與機器學習,強化 Webex 工具中移除噪音的能力,成功讓這種令人驚嘆的革命性技術獲得重視。 機器學習中包含許多精細複雜的程序。工作人員使用長達無數小時的訓練資料,讓機器學習演算法能夠區分人聲與其他聲音部署完畢後,系統就會在特定噪音傳送出去讓他人聽到之前,就識別出這些噪音,並且加以移除。這也納入許多人類的聰明才智,特別是推斷出最有可能打斷會議並讓在家工作者分心的噪音。 為了更進一步瞭解 AI 在音訊方面如何轉化 Webex 體驗,與另一位專家Keith Griffin 對談。他是技術長辦公室裡十分傑出的 AI 與機器學習工程師。
圖:Keith 站在思科標誌牆邊

這位就是 Keith。

「當你要求別人再說一次,或身處吵雜環境時,你不可能覺得舒服。」Keith 表示,這就是在疫情爆發前,多年來造成焦慮的來源。「過去,人們不願意加入,因為他們對於自己身處的環境完全沒有信心。」 但 Webex 部署的功能已經尋求因應這些挑戰的方式,而在疫情爆發,大家紛紛轉移到混合工作環境後,更是加強了這方面的努力。 一個重要例子是將「我的聲音」功能最佳化,這也納入了 Patrick 所強調的「距離」基礎概念。 Keith 表示:「對於我們的機器學習/AI 團隊現在能夠達成的技術,我感到十分驚喜。」。「不僅僅是移除噪音的技術,還有他們如何讓這個技術更加進化,以解決如將我的聲音最佳化這樣的其他使用情境。『將我的聲音最佳化』所能達成的效果,是能夠根據一組參數來判斷目前發言人。麥克風能拾取主要發言人的聲音,偵測到的其他人聲則會直接過濾掉。」 在談到移除噪音時,Keith 提及機器學習中幾個更有趣的特點。為了盡可能涵蓋更多低音,Webex 軟體能夠識別出如敲擊鍵盤的聲音、警報器聲(軟體能夠分辨不同國家/地區的警報器聲音)、園藝機器聲與狗叫聲等各種聲音,並加以移除。事實上,我們原始的噪音偵測器設計就能夠根據各種品種的狗所叫出來的聲音,辨識出超過 100 種不同品種的狗。 如 Keith 所言,噪音移除並不只是移除背景噪音而已。這個功能效率驚人,才能推動更具包容性、更加靈活的協同合作。這也表示團隊在會議體驗中能夠安心地彼此交流互動。 「我的 Cisco Galway 網站領導成員會議在不同時候,最多會有 14 個人參加。今天則有 12 位參與會議。其中三位正在開車送小孩上學的歸途上。四位團隊成員則正在遛狗。」 對於我們對音訊品質、音訊焦慮、視訊會議疲勞,以及這些問題如何影響團隊協同合作等的看法,這個軼事真的「非常」重要。Keith 表示:
有一些會議類型,人們應該可在每天日常生活中召開,無論身處何種環境,都能安心地加入某場會議。也許是在車上或是在街上行走,可能會有 狗狗吠叫、車輛飛馳而過但他們知道我們只會聽到他們的聲音。這才是能為混合工作環境與音訊品質做出貢獻的地方。」
部署 Webex 音訊智慧所投入的工作,包括移除噪音、「最佳化我的聲音」等技術,可說十分龐大。那麼成果如何?到目前為止,Webex 已經從使用者的視訊會議中成功移除了 160 億分鐘的背景噪音。 這些在音訊方面所開發的創新技術,已經轉換成對工作人員與企業組織而言真實且明確的優勢。這也是為什麼 Aragon Research 再一次將 Webex 列為視訊會議軟體的領導者 我們既然已經探討取得更好音質的關鍵:先進硬體、進階軟體與功能強大的 AI,現在我們要提供一些切實可行的秘訣,協助您改善音訊體驗。 

提升視訊會議音質的秘訣

訣竅 #1 仔細檢視您最常參與視訊會議的空間。在一天的特定時間中,出現惱人噪音而造成中斷的可能性有多高?對您的同事來說,您的聲音通常聽起來如何?您可以輕鬆使用 Webex 事先測試麥克風 秘訣 #2 嘗試瞭解基本的房間聲學,讓您在解決每天的聲音問題時更順手。我們的朋友 Patrick 可以帶您一同入門:

秘訣 #3 除非必要,否則別使用電腦麥克風!無論您偏好使用基本耳機、外接式麥克風或是品質超群的思科耳機,遠離電腦麥克風絕對是擺脫音訊焦慮,提升音質的最快方法。 秘訣 #4 當您要專心工作時,請使用正面積極的聲音。打開您的專心工作播放清單,然後戴上思科耳機。若您與團隊打算共同即時專注於某些工作,則可以在 Webex 會議中開啟音樂模式。 秘訣 #5 與團隊成員一起測試噪音移除功能,瞭解他們聽不到哪些聲音。我們經常聽到狗叫聲,然後趕快道歉。我們的同事會說:咦,為什麼要道歉?在瞭解有多少噪音已經遭到移除後,您就更不容易分心,因為您知道除了您以外,沒有人會聽到那些聲音。 
探索 Webex 音訊,以及使其出類拔萃的產品,協助團隊克服音訊焦慮與會議疲勞問題。
深入瞭解 在家中享有高品質音訊的 5 大熱門耳機功能 在所有通話中享有絕佳音效 – 3 個享有優質音訊的訣竅 Webex + Shure:為您打通會議室音訊的任督二脈

About The Author

Reilly Nolan
Reilly Nolan Content Writer Cisco
Reilly Nolan is a content writer for Webex.
Learn more

Topics


More like this