BabbleLabs – Cisco Webex Meetings 的 AI 音频魔法

On By Webex Team1 Min Read

谈到最佳视频会议体验时,人们常常对视觉效果感到兴奋。 在提供最佳视频会议体验方面,Cisco Webex Meetings 无疑是行业领军人物,可为用户提供众多先进功能,例如可自定义的视图、手势和表情、高级视频布局以及沉浸式共享。 我本人喜欢有趣的背景,也喜欢与会者竖起大拇指的表情符号。 但今天,我想谈谈在视频会议中提供清晰、无噪声的出色音频的重要性。 据 Gartner 预测,到 2024 年,只有 25% 的会议是面对面举行的。 由于大多数会议都是通过会议解决方案举行的,清晰易懂的语音不仅令人心情愉悦,而且至关重要。 一个组织的绩效及其提供多元化分散劳动力的能力取决于员工相互理解的程度, 而说和听对于增进彼此理解至关重要。

开发高效语音增强技术的挑战

在办公室举行视频会议时,理解与会者并非易事。 当系统试图通过复杂的全球网络将音频流推送给数百名同事时,在环境嘈杂的家中使用受限的网络连接笔记本电脑工作时,情况更糟糕。 过去,算法开发人员一直致力于从语音中提取有用的信息,以提供清晰的视频会议音频体验,减轻人类的认知负担和电子设备的计算负担。 他们致力于解决噪声、混响度、发言人数、带宽和延迟限制问题。 他们还努力在尊重用户隐私和数据安全的同时,应对丢包和压缩音频的影响。 此外,由于在语音中发现的噪声多种多样,导致算法开发人员很难知道应该从语音中分离哪些音频,什么是语音,什么不是语音。 因此,他们专注于抑制振幅和频率不随时间变化的稳态噪声,比如风扇和马达噪声。 但最令人烦恼的噪声是诸如狗吠声、嘟嘟的喇叭声、键盘敲击声和嘈杂的背景噪声等短暂噪声。 此外,在许多环境下,特别是在未进行声学完美设计的家庭办公室内,会出现高度混响或“回声 y”。

借助 Cisco Webex Meetings 增进彼此理解

如今,神经网络语音方法有效提高了我们解决这些问题的效率。 作为 BabbleLabs(于 2020 年 10 月被思科收购)的创始人兼首席执行官,我和我的团队一直致力于开发一流的语音增强技术。 作为 Webex 语音技术团队的一部分,我们现在正在实施我们的 AI 音频魔法技术。 我们是怎么做的? 简而言之就是,我们采用神经网络结构,收集数十万小时的语音和噪声,以及数万小时的室内声学数据,并创建精确调谐的模型来转换语音。 延迟时间只有 10 毫秒。 语音增强最近已成为视频会议的主流。 每个人都安装有某个版本的语音增强,但不是每个人都能实现相同的效果。 我们的系统测试表明,Cisco Webex Meetings 的语音增强算法是目前广泛应用于商业用途的最有效算法。 我们使用相同的质量工具测量大多数可用的视频会议系统,ITU 标准 P.862,语音质量感知评估 (PESQ) 以及三个大型典型噪声和混响流套件,一个由思科开发,另两个由微软开发。 在所有测试中,Webex 在噪声和混响消除方面表现更出色,得分显著高于最新版 Zoom (5.4.1) 和各 Microsoft Teams (1.4.00.4167) 版本。 自两年前首次公开发布这种语音增强技术以来,随着思科加速投入资源,我们已将语音质量提高了 2 倍以上,同时降低了计算要求,将这些模型的运行速度提高了 400 倍。 会议系统中的语音增强

Cisco Webex Meetings 语音技术的未来计划是什么?

我们将继续力争提供更高的性能水平,并进一步降低计算负载以实现全面轻松的实施服务。 我们可以识别发言人是谁以及他们所处的位置,并消除干扰背景噪声,同时增强其语音效果。 人工智能为我们提供了一些强大的新工具,可让我们轻松获取更多洞见并进行交流。 很快,我们将发布全新的智能功能,以促进理解,这些功能包括:

  • 能分辨会议室中发言清晰的发言人的语言增强功能:精确提取麦克风附近及远处发言人的发言,使我们能根据需要抑制或增强语音。
  • 适用于智能设备的全新语音增强功能:开发全新的实施方案和功能,充分利用先进笔记本电脑、设备和手机的强大功能。
  • 使用独特语音增强算法的命令识别:完善 Webex 庞大的词汇语音辅助和转录技术,实现新命令的高效边缘执行、高精度和轻松配置。

我们生活在一个喧闹的世界,但您不能使它阻碍生产力。 语音增强功能在 Cisco Webex 会议产品中大量部署的时间已经超过七个月。 它不仅能消除噪声,还能增强语音和理解,同时确保思科履行对隐私、安全和公平的基本承诺。 想了解我们的语音增强技术的实际应用并详细了解 Cisco Webex 会议的语音增强算法?

观看我的 Cisco Live 演讲 BabbleLabs – AI 音频魔法技术,现在 Cisco Live All-Access 通行证持有者和在初夏注册 Cisco Live 账户的公众都可观看。

更多相关文章 AI 语音增强的兴起和更卓越的团队协作 MindMeld 对话式 AI Webex 新动态:2021 年 5 月

About The Author

Webex Team
Webex is a leading provider of cloud-based collaboration solutions which includes video meetings, calling, messaging, events, customer experience solutions like contact center, and purpose-built collaboration devices..
Learn more

Topics


More like this