隨著全世界的員工開始從家裡返回公司上班,「混合型」工作模式正迅速成為新的作業模式。混合型工作意味著無論員工身在何處,他們都需要運用最新的會議創新技術來與其他人連結及協作。疫情使視訊通訊變得不可或缺,大幅增加了居家與行動視訊的使用量。這些環境都會帶來許多挑戰,不利於人們提供高品質的媒體內容;例如,低速或不穩定的網路頻寬、效果不盡理想的照明與攝影機,以及背景噪音。要進行創新以改善使用者體驗,很重要的一部就是評測使用者體驗。此文旨在探索思科在應對跟視訊品質相關的多面向問題時所採用的方法。
評測視訊品質是件複雜的事,必須考慮很多層面
為何評測視訊品質如此困難?一來是因為它很難定義。品質不佳的視訊我們一看就知道;然而,視訊品質不佳的原因有很多:視訊模糊、像馬賽克或帶有雜訊;畫面凍結、損壞或不同步等等。而視訊會議系統的適應能力很高,在遇到網路不穩、CPU 使用率或視訊內容改變時,Webex 等應用程式會透過變更解析度、調整影格率等方式加以因應,也會和終端使用者合作,來協調最佳的網路策略。這也代表使用者的體驗是個動態的目標,要評測各個視訊要素的品質,必須同時採用由上而下跟由下而上的方法。採用由上而下的方法,是因為我們想要評測使用者的完整體驗;採用由下而上的方法,則是因為我們想要評測每個要素的表現及其貢獻。品質及網路資料遺失
使用者體驗很重要的一環,就是網路條件不佳時,客戶會有什麼樣的表現。由於視訊串流包含透過先前的影格所預測的資料,資料遺失就會造成接收端的錯誤。而對應策略有好幾種。在資料層面,可以透過「前饋式錯誤更正」或重新傳輸,以便將錯誤降至最低。視訊串流可以從新的關鍵影格重新開始。其餘的錯誤則必須混合使用時間性或空間性錯誤隱藏方法加以隱藏:空間性隱藏會向周圍的像素借用資訊以重建遺失的資料;時間性隱藏則會向前後的視訊影格借用資訊以填補遺失的影格。最後,資料速率可以透過使用較低的位元速率跟較小的視訊解析度予以降低。上述的技術都各有其優缺點。從計量的角度來看,這是非常困難的。接收的視訊與傳輸的視訊有所不同。不同廠商採用的最佳化技術套件也不盡相同,因此,不同廠商呈現的視訊就會不同;例如,看重動作而捨棄清晰度,亦或相反;或者是增加延遲以便重新傳輸等。廠商不會分享他們的品質最佳化方法,因為這些是他們專屬的實作方式,屬於他們的「企業機密」。無論最佳化是發生在傳送端、傳輸的過程中,還是在接收端,最後得到的視訊畫面都和來源有所分歧。就算沒有任何遺失,客戶仍會有所調整:去除雜訊、超級解析度、濾鏡前後在不同廠商間也都有所不同。種種不同的條件使視訊品質之間的比較變得極其困難。完整參考和無參考計量的比較
那麼,在這種情況下,要如何評測品質?為了解這點,我們必須了解「完整參考」(FR) 及「無參考」(NR) 計量的差別。在 FR 計量方式中,必須比較視訊和原始視訊,也必須做到以像素為單位的完全對應:相同解析度、相同影格率,而每張輸入影格都有對應的輸出影格。在單一處理過程可能妥善定義的輸入有所流失時,若要將流失降到最低,這種方法最實用。VMAF – 完整參考測試
FR 計量有許多不同的方法,例如 PSNR、SSIM、MS-SSIM 等,不過視訊多方法評估融合 (VMAF) 是其中非常受歡迎的方法,也經常被視為最先進的方法。這種 FR 測試是由 Netflix 特別開發,用來為他們的視訊串流服務做感知視訊品質的評估。使用 VMAF 或任何 FR 計量來評測品質是件很困難的事。因為接收視訊跟來源視訊有時差距甚大,必須調整比例、裁切和同步處理輸出視訊,才能將它和 (部分) 傳輸的視訊以像素為單位進行比較。以我們的經驗來說,雖然我們曾嘗試用此種方法來進行廠商比較,所需的操作卻相當容易出錯。況且,雖然 VMAP 能有效掌握差距,卻無法掌握絕對品質。在視訊會議中,我們沒有高成本製作的電影畫面。使用者體驗會受到所擷取之視訊本身的品質所影響,而不僅是接收的視訊跟擷取的視訊間的差距而已。最後,VMAP 是個僅適用於空間法的計量法:無法掌握時間性效果,分數也只能反映影格分數的平均值。NIQE – 無參考測試
相對地,近年來有諸多關於無參考 (NR) 視訊品質計量的研究,人們試著用這種方法在不比較參照的情況下,評測絕對的品質等級。如果人們能夠找到一種合適、可靠的 NR 計量方式,勢必對會議應用很有幫助,因為視訊串流會出現調整及流失的情況。自然影像品質評估法 (NIQE) 是一種熱門的 NR 品質計量方式,它會將統計模型套用到影像中,藉此檢視統計資料代表整體自然影像的程度高低。NIQE 能在任何情況下為終端使用者的視訊品質評分,而毋須將來源視訊品質或視訊傳遞途徑中的遺失、處理納入考量。NIQE 這類的 NR 計量方式可以用來獨立評估來源視訊和目的地視訊。品質的流失則能透過兩者之間得分的差距加以掌握,使人們能夠評估流失復原和視訊最佳化等技術的表現。因為擷取的視訊可能會品質不佳,視訊最佳化技術甚至可以改善這種情況。我們的經驗指出,NIQE 十分可靠,然而還缺少幾項重要的功能,特別是它仍然無法處理時間性的品質。充實 NIQE:額外的計量方式
NIQE 的其中一項限制就是,透過將所有的位元速率分配給單一影格,就算不傳送其他影格,您還是可能得到很高的 NIQE 評分。這不是 NR 評量特有的問題:如以上所述,採用 VMAF 也有相同的問題,因為您只能將實際接收到的影格與其所對應的影格做比較。因此,我們考慮使用的第一個額外計量方式就是遺失影格計量方式 (DFM)。這種計量方式會計算某一序列影格中遺失的影格數,以及關鍵影格用來做為進行錯誤復原方法的情況。在某些情況下,關鍵影格的使用會導致 NIQE 測量方式給出錯誤的高分。因此,這種時間性的評測方法可讓我們分辨準確的結果跟假性的高分。雖然 NIQE 能掌握影像品質的許多面向,卻無法掌握壓縮失真。所以,我們也納入了區段評測跟模糊評測。FR 跟 NIQE 兩種計量方式都可能不當解讀這些元素,而這些元素在經過編碼的視訊中是很常見的。思科偏好採用無參考測試
FR 計量有其存在的意義,特別是在評定個別管道的元素時相當實用。然而思科認為,如果要準確評估端對端的視訊品質,無參考評量方式才最能掌握使用者體驗。人類的感知極其複雜,設計全面性的計量法則非常困難;不過,同時使用以下四種計量方式就即可掌握絕大部分的品質體驗:無參考 (NIQE) | DFM | 區段 | 模糊測量法。同時使用這些測量方式,就能涵蓋各種不同的面向,針對主觀的視訊品質得出簡單明瞭的評估。這些計量法能夠擷取端對端遺失的品質,以及來源品質自身的影響。會議系統必須有能力經常接收低品質的來源內容,並使用各種方法來改善或維持端對端的視訊品質。因此,品質評估不該完全依賴 FR 品質評測方法論,在考慮端對端體驗時,也必須將這些要素納入考量。因此,思科致力於使用無參考計量法來評估端對端品質,畢竟它更能準確地反映出終端使用者的體驗。思科對視訊品質及整體品質的持續追求
上述我們討論的計量方式並不完美,也有一些限制,比如針對動畫或綜合性內容的判斷,我們也在持續開發自家的方法。不過,雖然這是一條艱辛的道路,我們堅信無參考計量法是評量感知視訊品質最好的架構。在最新版本的 Webex 應用程式中,我們已經對所有的媒體品質計量法進行了顯著的改良,包含視訊品質、音訊品質、背景噪音抑制、CPU 使用率,以及專為混合工作模式設計的創新技術。為了因應疫情,我們也看到今年所有廠商的解決方案都針對媒體品質有了顯著的改善。我們持續的測試顯示,Webex 應用程式提供的視訊品質能與其他廠商並駕齊驅,甚至更為卓越。在這塊競爭一向激烈的市場中,思科對品質和效能的關注永遠擺在第一位。深入瞭解如何使用 Webex Meetings 來實現混合工作模式共同作者:首席工程師 Thomas Davies Thomas Davies 是思科合作技術團隊 (CTG) 的首席工程師,過去曾在衛星網路、射頻通訊及廣播產業工作,然而在他超過二十年的職業生涯中,絕大多數的時間都奉獻給視訊處理及視訊壓縮 (轉碼器) 的相關工作。他在思科任職已超過十年,致力於創造出最新世代的合作體驗, 也對 HEVC (H.265) 及 AV1 等視訊壓縮標準的建立有所貢獻,而他也是這些標準得以在 Cisco Webex 等真實產品上實踐的重要推手。 瞭解詳情 為每場視訊會議準備合適配置的方法 Webex 的最新消息:2021 年 9 月 在虛擬會議和活動期間利用分組討論的最佳做法