Quando si tratta di avere la migliore esperienza di videoconferenza, le persone spesso pensano principalmente all’aspetto video. Cisco Webex Meetings è indubbiamente un’azienda leader del settore a questo riguardo, che fornisce agli utenti funzioni avanzate, come viste personalizzabili, gesti e reazioni, layout video avanzati e condivisione immersiva. Personalmente, amo uno sfondo divertente e ricevere emoji di approvazione dai partecipanti alla riunione. Ma oggi, voglio parlare dell’importanza di un audio eccellente durante le videoconferenze grazie a una conversazione chiara e priva di rumori.
Secondo Gartner, entro il 2024 solo il 25% delle riunioni si svolgerà di persona. Con la maggioranza delle riunioni che si svolgono tramite soluzioni di conferenza, una conversazione comprensibile non è semplicemente qualcosa di piacevole da avere, ma è fondamentale. Le prestazioni di un’organizzazione e la sua capacità di fornire una forza lavoro diversificata e distribuita sul territorio dipendono da come le persone riescono a capirsi. Parlare e ascoltare sono fondamentali per la comprensione.
Sfide nello sviluppo di tecnologie efficienti per il miglioramento delle conversazioni
Comprendere i partecipanti alla riunione durante la videoconferenza può essere difficile quando sei in un ufficio. E la cosa peggiora quando lavori da casa in un ambiente rumoroso su un portatile con connessione di rete limitata e con il sistema che tenta di inviare flussi audio tramite reti globali complesse a centinaia di colleghi.
In passato, gli algoritmi hanno fatto fatica a estrarre informazioni utili dalla conversazione in modo tale da offrire un’esperienza audio chiara durante la videoconferenza e alleggerire il carico cognitivo sulle persone e il carico informatico sui componenti elettronici. Hanno avuto difficoltà con la quantità di rumori, il livello di riverbero, il numero di interlocutori, le limitazioni di larghezza di banda e latenza. Hanno dovuto affrontare perdita di pacchetti ed effetti della compressione audio, rispettando al contempo privacy e sicurezza dei dati degli utenti.
Inoltre, i rumori trovati nelle conversazioni sono così diversi che gli sviluppatori di algoritmi hanno avuto difficoltà a capire quale audio separare dalla conversazione, ossia quale audio è conversazione e quale no. Quindi, si sono concentrati sull’eliminazione dei rumori fissi che sono costanti in ampiezza e frequenza nel tempo, come ventole e motori. Ma il rumore più fastidioso è quello transitorio, cani che abbaiano, clacson, rumori di tastiera e il mormorio dei rumori di fondo. Inoltre, molti ambienti, in particolare in casa non progettati per la perfezione acustica, hanno un alto livello di riverbero o “eco”.
Comprensione migliore con Cisco Webex Meetings
Oggi, i metodi di conversazione di rete neurale stanno iniziando a fare la differenza per quanto riguarda l’efficienza nella risoluzione di questi problemi. Come fondatore e CEO di BabbleLabs, acquisita da Cisco a ottobre 2020, insieme al mio team sto lavorando allo sviluppo di miglioramenti delle conversazioni in classe. Ora, stiamo implementando il nostro audio AI eccezionale con il team Webex Voice Technology. In che modo? In parole semplici, prendiamo strutture di rete neurale, raccogliamo centinaia di migliaia di ore di conversazioni e rumori, decine di migliaia di ore di acustica di sala e realizziamo modelli sintonizzati in modo esatto per trasformare la conversazione. Tutto questo in una latenza di solo 10 millisecondi.
La tecnologia di miglioramento delle conversazioni è diventata di recente molto comune nelle videoconferenze. Tutti ne hanno una versione, ma non tutti ottengono lo stesso risultato. I nostri test sistematici mostrano che l’algoritmo di miglioramento delle conversazioni di Cisco Webex Meetings’ è il più efficiente tra quelli disponibili sul mercato per un massiccio uso commerciale. Abbiamo utilizzato lo stesso strumento di qualità per misurare la maggior parte dei sistemi di videoconferenza disponibili, ITU standard P.862 – Perceptual Evaluation of Speech Quality (PESQ), e tre grandi suite di flussi riverberanti e di rumore tipici, uno sviluppato da Cisco e due da Microsoft. In tutti i test, Webex ha rimosso la maggiore quantità di rumori e riverbero e ha ottenuto un punteggio significativamente più alto rispetto a quello delle ultime release di Zoom (5.4.1) e Microsoft Teams (1.4.00.4167).
Sin dalla prima release pubblica di questa tecnologia di miglioramento delle conversazioni due anni fa, e con il maggiore impegno di risorse di Cisco, abbiamo migliorato la qualità delle conversazioni di oltre il doppio e abbiamo ridotto i requisiti informatici per eseguire questi modelli 400 volte più velocemente.
Qual è il prossimo passo della tecnologia vocale di Cisco Webex Meetings?
Continuiamo a spingere per raggiungere prestazioni di livello più alto e per ridurre ulteriormente il carico informatico e consentire l’implementazione ovunque senza problemi. Possiamo capire chi sono gli oratori e dove si trovano e rimuovere il rumore di fondo dal loro ambiente amplificando contemporaneamente la conversazione.
La tecnologia AI ci offre nuovi potenti strumenti per estrarre maggiori informazioni utili e comunicare più facilmente. Presto, rilasceremo nuove funzioni intelligenti che miglioreranno ancora di più la comprensione, come:
- Miglioramento delle conversazioni in grado di distinguere oratori comprensibili nelle sale conferenze: estrazione precisa di coloro che parlano che sono vicino al microfono rispetto a coloro che sono distanti, in modo da avere la possibilità di eliminare o amplificare la conversazione, come necessario.
- Nuove funzionalità di miglioramento del discorso per dispositivi intelligenti: nuove implementazioni e funzioni per sfruttare la potenza di portatili, dispositivi e telefoni all’avanguardia.
- Riconoscimento comandi tramite algoritmi di miglioramento delle conversazioni univoci: integrazione di tecnologie di assistente vocale e trascrizione basate un notevole vocabolario di Webex ed esecuzione efficiente, alta precisione e facile configurazione in nuovi comandi.
Viviamo in un mondo rumoroso, ma non dobbiamo lasciare che influisca negativamente sulla produttività. Il miglioramento delle conversazioni è stato fornito in distribuzioni in grandi volumi in prodotti Cisco Webex Meetings per più di sette mesi. E fa molto di più che rimuovere il rumore, migliora la conversazione e la comprensione mantenendo contemporaneamente l’impegno fondamentale di Cisco a garantire privacy, sicurezza e correttezza.
Desideri altre informazioni sulla tecnologia di miglioramento delle conversazioni in azione e sugli algoritmi di miglioramento delle conversazioni di Cisco Webex Meetings?
Guarda il mio intervento su Cisco Live BabbleLabs – Esperienza audio AI Audio eccezionale ora disponibile per tutti coloro che dispongono del pass di accesso a Cisco Live e per il pubblico in generale che si registra per un account Cisco Live all’inizio dell’estate.
Ulteriori informazioni
Ulteriori miglioramenti della tecnologia AI per conversazioni e collaborazione in team ottimizzata