{"id":392621,"date":"2022-03-23T14:40:10","date_gmt":"2022-03-23T21:40:10","guid":{"rendered":"https:\/\/blog.webex.com\/uncategorized-de\/wenn-die-suche-nach-tschaikowsky-bei-skifahren-und-chai-tea-endet-die-bewertung-der-genauigkeit-von-maschinell-lernenden-transkriptions-engines\/"},"modified":"2022-03-23T14:40:10","modified_gmt":"2022-03-23T21:40:10","slug":"wenn-die-suche-nach-tschaikowsky-bei-skifahren-und-chai-tea-endet-die-bewertung-der-genauigkeit-von-maschinell-lernenden-transkriptions-engines","status":"publish","type":"post","link":"https:\/\/blog.webex.com\/de\/zusammenarbeit\/hybrides-arbeiten\/wenn-die-suche-nach-tschaikowsky-bei-skifahren-und-chai-tea-endet-die-bewertung-der-genauigkeit-von-maschinell-lernenden-transkriptions-engines\/","title":{"rendered":"Wenn die Suche nach Tschaikowsky bei Skifahren und Chai Tea ..."},"content":{"rendered":"<p>Seit wir 2020 <a href=\"https:\/\/www.webex.com\/webex-assistant.html\" target=\"_blank\" rel=\"noopener\">Webex Assistant<\/a> eingef\u00fchrt haben, lautet die meistgestellte Frage unserer Kunden: <strong>\u201eIst er genau?\u201c<\/strong> Das ist nachvollziehbar. Kunden wollen sicherstellen, dass, wenn sie sich entscheiden, die KI-gesteuerte (K\u00fcnstliche Intelligenz) automatische Transkriptions-Engine von Webex zu verwenden, diese ihr Versprechen h\u00e4lt. D.\u00a0h. sie soll genaue Meetingaufzeichnungen vornehmen, es Mitarbeitern erm\u00f6glichen, sich auf das Gespr\u00e4ch zu konzentrieren, anstatt auf das Abtippen von Notizen und durch Funktionen f\u00fcr die Barrierefreiheit f\u00fcr mehr Inklusion in Meetings sorgen. Es gibt so viele Beispiele, in welchen k\u00fcnstliche Intelligenz zu viel verspricht und zu wenig liefert. F\u00fcr unternehmenskritische Aufgaben hat Webex keine M\u00fchen gescheut und sich unerm\u00fcdlich darauf konzentriert an der Genauigkeit zu arbeiten.<\/p>\n<p>W\u00e4hrend weltweit auf ein <a href=\"https:\/\/www.webex.com\/what-is-hybrid-work.html\" target=\"_blank\" rel=\"noopener\">hybrides Arbeitsmodell<\/a> umgestiegen wird, werden Funktionen wie Untertitel, Abschriften und das Erfassen von Aktionselementen wichtiger denn je, um gleichwertige, inklusive Meetingerfahrungen zu erm\u00f6glichen. Und das ganz unabh\u00e4ngig davon, welche Sprache Benutzer verwenden, welche Anforderungen sie im Bereich der Barrierefreiheit haben, oder ob sie sich entscheiden, ein Meeting auszulassen, um alle Termine unterzubekommen und sich auf eine Zusammenfassung von Webex Assistant verlassen. Unser Ziel ist es, KI und maschinelles Lernen zu nutzen, um alle Meetingerfahrungen f\u00fcr alle besser zu machen.<\/p>\n<p><span class=\"TextRun SCXW174586238 BCX4\" lang=\"de\" xml:lang=\"de\" data-contrast=\"none\"><br \/>\n  <span class=\"NormalTextRun SCXW174586238 BCX4\">Das Erschaffen von<\/span><br \/>\n  <span class=\"NormalTextRun SCXW174586238 BCX4\"> hochmodernen KI-gesteuerten Transkriptions-Engines ist eine M\u00f6glichkeit, dieses Ziel zu erreichen.<\/span><br \/>\n<\/span><span class=\"EOP SCXW174586238 BCX4\" data-ccp-props=\"{}\">\u00a0<\/span><\/p>\n<p>Ber\u00fccksichtigt man, was Webex investiert hat, um eine robuste Pipeline f\u00fcr die durchg\u00e4ngige Kennzeichnung, das Training und maschinelles Lernen zu erschaffen, sind wir stolz darauf, auf dieser Grundlage eine Transkriptions-Engine f\u00fcr die englische Sprache auf den Markt bringen zu k\u00f6nnen. Diese ist in Sachen Genauigkeit f\u00fcr die Webex Meetingerfahrung branchenf\u00fchrend, wenn man sie mit den besten Spracherkennungsengines auf dem Markt vergleicht. Mit dem Ziel, mehr als 98\u00a0% der Webex-Kunden Zugang zu unserer Technologie zu verschaffen, werden wir ASRs (Engines f\u00fcr die automatische Spracherkennung) f\u00fcr Spanisch, Franz\u00f6sisch und Deutsch zur Verf\u00fcgung stellen, die vollst\u00e4ndig von uns entwickelt werden. Das Angebot ist in der ersten H\u00e4lfte dieses Jahres f\u00fcr alle Benutzer von Webex Assistant kostenlos.<\/p>\n<p><a href=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/Webex-versus-alternative-solutions.png\"><br \/>\n  <img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-391691 size-full\" src=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/Webex-versus-alternative-solutions.png\" alt=\"Ein Balkendiagramm, das zeigt, dass Webex im Vergleich zu alternativen L\u00f6sungen, die wenigstens Wortfehler aufweist\" width=\"936\" height=\"582\" srcset=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/Webex-versus-alternative-solutions.png 836w, https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/Webex-versus-alternative-solutions-300x187.png 300w, https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/Webex-versus-alternative-solutions-768x478.png 768w\" sizes=\"auto, (max-width: 936px) 100vw, 936px\" \/><br \/>\n<\/a><\/p>\n<h2>Was bedeutet \u201egenau\u201c eigentlich wirklich?<\/h2>\n<p>Wenn wir \u00fcber die genaue Transkription nachdenken, stellen wir uns h\u00e4ufig vor, dass ein menschlicher Zuh\u00f6rer, der die Audiodatei transkribiert, exakt das wiedergibt, was gesagt wird. Allerdings muss man das ins Verh\u00e4ltnis setzen. Die Fehlerquote bei Menschen wurde in beliebten Datens\u00e4tzen wie \u201eCallHome\u201c gemessen und das beste Ergebnis liegt derzeit bei 6,8\u00a0%. D.\u00a0h. bei einem Transkript mit 100\u00a0W\u00f6rtern, w\u00fcrden ca. 7 davon durch einen Menschen falsch \u00fcbertragen werden. Es muss au\u00dferdem Erw\u00e4hnung finden, dass \u201eCallHome\u201c ein Datensatz ist, der aus 30-min\u00fctigen Telefongespr\u00e4chen zwischen englischen Muttersprachlern mit spontanem Inhalt besteht. [1] Man kann davon ausgehen, dass die Fehlerquote bei Gespr\u00e4chen von Personen, die verschiedene Akzente aufweisen, h\u00f6her ist.<\/p>\n<p>Noch interessanter ist, dass die \u00dcbertragungs\u00fcbereinstimmung von Transkriptoren laut des Linguistics Data Consortium (LDC) zwischen 4,1\u00a0% und 9,6\u00a0% liegt, abh\u00e4ngig davon, ob es sich um gewissenhafte Mehrfachabschriften oder eine Schnellabschrift handelt [2]. Das bedeutet, dass wenn 2\u00a0Personen die gleiche Audiodatei erhalten, trotzdem keine identischen Aufzeichnungen des Gesagten entstehen, selbst wenn die Umgebungsbedingungen perfekt sind.<\/p>\n<p>Unser Ziel ist es, dass die Abschrift von Webex nicht nur auf einem Niveau mit der Abschrift durch Menschen, sondern dass sie besser ist. Wir m\u00f6chten in jeder Sprache, die wir anbieten erstklassige Genauigkeit erzielen, unabh\u00e4ngig von Akzent, Geschlecht oder Umgebung.<\/p>\n<p>Um also die Frage \u201eIst er genau?\u201c beantworten zu k\u00f6nnen, m\u00fcssen wir zuerst die verschiedenen Dimensionen der Genauigkeit in der automatischen Spracherkennung darlegen:<\/p>\n<h2>1. Genauigkeit wird unter Verwendung einer g\u00e4ngigen Metrik gemessen, der Wortfehlerrate (Word Error Rate, WER)<\/h2>\n<ul>\n<li>WER misst die Leistung der Maschine in Bezug auf die Transkription des Gesagten.<\/li>\n<li>Dieselbe Audioaufnahme, die das Modell f\u00fcr maschinelles Lernen (ML) \u00fcbertragen hat, erhalten Personen, um eine inhaltliche Grundwahrheit f\u00fcr die Abschrift zu schaffen.<\/li>\n<li>Die Wortfehlerrate (WER) berechnet sich aus der Anzahl der Fehler dividiert durch die Gesamtanzahl der W\u00f6rter. Beginnen Sie die Berechnung der WER, indem Sie Ersetzungen, Einf\u00fcgungen und Streichungen addieren, die in einer Sequenz erkannter W\u00f6rter vorkommen. Teilen Sie diese Zahl durch die Gesamtanzahl der W\u00f6rter, die durch die inhaltliche Grundwahrheit ermittelt wurde. Das Ergebnis ist dann die WER. Als einfache Formel dargestellt: Wortfehlerrate WER\u00a0= (Ersetzungen\u00a0+ Einf\u00fcgungen\u00a0+ Streichungen)\u00a0\/ Anzahl der gesprochenen W\u00f6rter. [3]<\/li>\n<li>Eine Ersetzung erfolgt, wenn ein Wort ersetzt wird (z.\u00a0B. wird aus dem Namen \u201eWilli\u201c, die Verbform \u201ewill\u201c).<\/li>\n<li>Eine Einf\u00fcgung ist, wenn ein Wort, das im Gesagten nicht vor kam, hinzugef\u00fcgt wurde (z.\u00a0B. wird \u201emittendrin\u201c zu \u201emitten in\u201c).<\/li>\n<li>Eine Streichung erfolgt, wenn ein Wort im Transkript komplett fehlt (z.\u00a0B. wird \u201eich kann nicht mit\u201c zu \u201eich kann mit\u201c).<\/li>\n<li>Je niedriger die WER; desto h\u00f6her ist die Genauigkeit der Transkriptions-Engine, d.\u00a0h. desto weniger Fehler treten auf.<\/li>\n<li>Im folgenden Diagramm dient Juni\u00a02020 als Basis f\u00fcr das Modell, das wir f\u00fcr die KI-gesteuerte Transkriptions-Engine von Webex Assistant geliefert haben. Man sieht, dass wir die WER im Verlauf der Zeit verbessert haben und bis Februar\u00a02022 schrittweise Verbesserungen von 36\u00a0% erreicht haben.<\/li>\n<\/ul>\n<p><a href=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/WER-over-time.png\"><br \/>\n  <img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-391701 size-full\" src=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/WER-over-time.png\" alt=\"Wortfehlerrate (WER) im Zeitverlauf\" width=\"936\" height=\"584\" srcset=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/WER-over-time.png 936w, https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/WER-over-time-300x187.png 300w, https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/WER-over-time-768x479.png 768w\" sizes=\"auto, (max-width: 936px) 100vw, 936px\" \/><br \/>\n<\/a><\/p>\n<h2>2. Alles h\u00e4ngt vom Datensatz ab<\/h2>\n<ul>\n<li>Die WER einer beliebigen Spracherkennungsengine ist nicht allgemeing\u00fcltig messbar. Jeder Datensatz verf\u00fcgt \u00fcber verschiedene Attribute wie die Verteilung von Dialekten, Geschlechtern, der akustischen Umgebung und Dom\u00e4nen. D.\u00a0h. der Einsatz der Transkriptions-Engine von Webex bei einem Datensatz, der aus H\u00f6rb\u00fcchern besteht, w\u00fcrde eine andere WER ergeben als bei Webex Meetings und wieder eine andere bei Telefongespr\u00e4chen. Genauso k\u00e4me die Transkriptions-Engine bei einem Webex Meeting, an welchem ausschlie\u00dflich englische Muttersprachler teilnehmen zu einer anderen Fehlerrate, als bei einem Webex Meeting, bei welchem Teilnehmer unterschiedliche Akzente aufweisen.<\/li>\n<li>Um eine erstklassige Genauigkeit aufweisen zu k\u00f6nnen, konzentrieren wir uns ausschlie\u00dflich auf Anwendungsf\u00e4lle bei Videokonferenzen. Es gibt viele Unterschiede in der Sprechweise von Menschen in Videokonferenzen, verglichen mit Telefongespr\u00e4chen oder Sprachbefehlen an Alexa. Unsere Spracherkennungsengines nehmen diese besonderen Muster wahr und optimieren sie f\u00fcr Videokonferenzen. Wenn wir eine ASR-Engine bei uns im Haus fertigen, anstatt uns auf Drittanbieter<sup><\/sup> zu verlassen, k\u00f6nnen wir unsere Modelle f\u00fcr maschinelles Lernen anhand dieser Attribute<sup>1<\/sup> trainieren, die speziell auf die Webex-Meetingerfahrung zutreffen.<\/li>\n<\/ul>\n<h2>3. Die Genauigkeit wird im Meetingverlauf gr\u00f6\u00dfer<\/h2>\n<ul>\n<li>Unsere automatische Spracherkennung (ASR) schafft w\u00e4hrend des gesamten Meetingverlaufs drei Arten von Abschriften.\n<ul>\n<li><strong>\u00c4u\u00dferungsentwurf\/vorl\u00e4ufige \u00c4u\u00dferung<\/strong>: der \u00c4u\u00dferungsentwurf ist das, was Sie in Echtzeit sehen. Wenn Sie sich die Untertitel in einem Webex-Meeting ansehen [schwarzes K\u00e4stchen im folgenden Screenshot], w\u00e4hrend Sie sprechen, entsteht in den ersten Millisekunden des Transkribierens eine Entwurfsabschrift. Das ist die erste Abschrift, die Sie sehen k\u00f6nnen. Wir nennen sie Online-\/Streaming-Audioabschrift.<\/li>\n<li><strong>Finale \u00c4u\u00dferung<\/strong>: Nach ein paar Millisekunden entsteht eine Abschrift mit einer h\u00f6heren Genauigkeit. All das geschieht in Echtzeit und l\u00e4sst sich mit dem blo\u00dfen Auge kaum unterscheiden.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p><a href=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/accuracy-meeting.png\"><br \/>\n  <img loading=\"lazy\" decoding=\"async\" class=\"aligncenter size-full wp-image-391711\" src=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/accuracy-meeting.png\" alt=\"\" width=\"936\" height=\"528\" srcset=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/accuracy-meeting.png 922w, https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/accuracy-meeting-300x169.png 300w, https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/accuracy-meeting-768x433.png 768w\" sizes=\"auto, (max-width: 936px) 100vw, 936px\" \/><br \/>\n<\/a><\/p>\n<p><strong>Siehe folgendes Beispiel<\/strong><\/p>\n<p><a href=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/giphy_AdobeCreativeCloudExpress1.gif\"><br \/>\n  <img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-391799 size-full\" src=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/giphy_AdobeCreativeCloudExpress1.gif\" alt=\"Ein Beispiel dessen, wie sich unsere Echtzeitabschriften in Echtzeit verbessern. \u201eBut\u201c wird zu \u201eBut quality\u201c wird zu \u201eBut quality would not be\u201c, usw.\" width=\"599\" height=\"287\" \/><br \/>\n<\/a><\/p>\n<ul>\n<li>In diesem Beispiel wurden f\u00fcr eine \u00c4u\u00dferung in einem unserer Team-Meetings 13\u00a0Entw\u00fcrfe erstellt. All das geschieht in Echtzeit, um im letzten Satz die h\u00f6chste Genauigkeit aufzuweisen und gleichzeitig die Echtzeit-Erfahrung f\u00fcr den Benutzer zu sichern.<\/li>\n<li><strong>Verbesserte Abschrift: <\/strong>Nachdem das Meeting zu Ende ist, wenden wir eine Reihe weiterer Transkriptions-Engines an, um die Genauigkeit der Abschrift weiter zu erh\u00f6hen. Verbesserte Abschriften sind unabh\u00e4ngig von der Dauer des Meetings innerhalb von durchschnittlich 10\u00a0Minuten verf\u00fcgbar. Diese Abschrift ist dann die Version mit der h\u00f6chsten Genauigkeit.<\/li>\n<\/ul>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-385461 size-full\" src=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/02\/webexapp.png\" alt=\"Eine Ansicht der Benutzeroberfl\u00e4che f\u00fcr Webex-Abschriften, die anzeigt, wie genaue Abschriften erzeugt werden.\" width=\"936\" height=\"488\" \/><\/p>\n<p>\u00a0<\/p>\n<h2>4. Weitere Themen, die sich auf die Wahrnehmung der Genauigkeit von Abschriften auswirken<\/h2>\n<ul>\n<li>\n<ul>\n<li>Zeichensetzung und Gro\u00dfschreibung:\n<ol>\n<li>\n<ol>\n<li>Obwohl die Abschrift genau ist, besteht die M\u00f6glichkeit, dass die Zeichensetzung oder Gro\u00df- und Kleinschreibung fehlerhaft ist. In jeder Sprache gibt es unterschiedliche Regeln in Bezug darauf und wir m\u00fcssen unsere Modelle so trainieren, dass sie dazu in der Lage sind, diese Regeln zu ber\u00fccksichtigen, sodass die Abschrift gut lesbar ist.<\/li>\n<\/ol>\n<\/li>\n<\/ol>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<div id=\"attachment_391731\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-391731\" class=\"size-full wp-image-391731\" src=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/Lets-eat-grandma.png\" alt=\"\" width=\"530\" height=\"492\" srcset=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/Lets-eat-grandma.png 530w, https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/Lets-eat-grandma-300x278.png 300w\" sizes=\"auto, (max-width: 530px) 100vw, 530px\" \/><p id=\"caption-attachment-391731\" class=\"wp-caption-text\"><br \/>\n<\/a> <a href=\"https:\/\/m.facebook.com\/thelanguagenerds\/photos\/a.1497947636987000\/3008125415969207\/?type=3&#038;source=48&#038;__tn__=EHH-R\" target=\"_blank\" rel=\"noopener\">Bildquelle: The Language Nerds<\/a><\/p><\/div>\n<ul>\n<li>\n<ul>\n<li><strong><br \/>\n  <em>Zuordnung zum Sprecher:<\/em><br \/>\n<\/strong><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li>\n<ol>\n<li>\n<ul>\n<li>Die Zuordnung zum Sprecher ordnet einen Textabschnitt einer Person zu und identifiziert, wer wann w\u00e4hrend eines Meetings gesprochen hat. Wenn eine \u00c4u\u00dferung der falschen Person zugeordnet wird, sinkt die wahrgenommene Qualit\u00e4t. Die Zuordnung zum Sprecher erm\u00f6glicht uns, interessante Funktionen zu erstellen, wie Meetinganalysen in Bezug auf die Sprechzeiten der Teilnehmer.<\/li>\n<\/ul>\n<\/li>\n<\/ol>\n<\/li>\n<\/ul>\n<ul>\n<li>\n<ul>\n<li><strong><br \/>\n  <em>Umgang mit Abk\u00fcrzungen und Namen:<\/em><br \/>\n<\/strong><\/p>\n<ul>\n<li>Spracherkennungsengines werden in der Regel mit W\u00f6rtern des g\u00e4ngigen Vokabulars trainiert. Dieses beinhaltet keine Namen von Personen, Abk\u00fcrzungen von Unternehmensnamen, medizinische Fachsprache usw. Beispielsweise war das Akronym \u201eCOVID-19\u201c f\u00fcr die Menschen in der Zeit vor 2020 ein neuer Begriff. Unsere ASR w\u00e4re nicht dazu in der Lage gewesen, ihn zu erkennen, da er nicht zum g\u00e4ngigen Vokabular geh\u00f6rte. Unser Team verfolgt verschiedene Ans\u00e4tze, um eine genauere Abschrift von W\u00f6rtern, die nicht zum Vokabular geh\u00f6ren, zu gew\u00e4hrleisten, wie z.\u00a0B. das Erlernen der Namen von Meetingteilnehmern w\u00e4hrend eines Meetings oder visuelle Verarbeitung, um Abk\u00fcrzungen aus einer Pr\u00e4sentation, die im Meeting freigegeben wird, zu erlernen.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-385471 size-full\" src=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/02\/robot.png\" alt=\"Ein Meme aus Toy Story mit \"Acronyms... Acronyms Everywhere\u201c (\u201eAbk\u00fcrzungen... \u00dcberall Abk\u00fcrzungen\u201c)\" width=\"878\" height=\"478\" \/><\/p>\n<ul>\n<li>\n<ul>\n<li><strong><br \/>\n  <em>Der Umgang mit Zahlen und besonderen Formaten:<\/em><br \/>\n<\/strong><\/p>\n<ul>\n<li>Manche Zahlen bed\u00fcrfen einer besonderen Formatierung, wie z.\u00a0B. Telefonnummern (+1 203 456 7891), E-Mails (jemand@email.com), Datumsangaben (15. April 2021). Modelle f\u00fcr maschinelles Lernen, die mit diesen besonderen Formaten trainiert wurden, erkennen gesprochene W\u00f6rter und verarbeiten den Text im Nachhinein, damit er im richtigen Format angezeigt wird. All das geschieht in Echtzeit.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li>\n<ul>\n<li><strong><br \/>\n  <em>\u00dcberlagerung von Gespr\u00e4chen:<\/em><br \/>\n<\/strong><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li>\n<ol>\n<li>\n<ul>\n<li>Wenn Personen gleichzeitig sprechen oder einander unterbrechen, kann es passieren, dass die Abschrift unlesbar wird (selbst, wenn sie genau ist), wodurch die Qualit\u00e4tswahrnehmung beeinflusst wird. Um dieses Problem zu l\u00f6sen, erstellen wir Funktionen, die die Gesichts- und Stimmerkennung nutzen, um verschiedene Personen im Gespr\u00e4ch zu unterscheiden.<\/li>\n<\/ul>\n<\/li>\n<\/ol>\n<\/li>\n<\/ul>\n<h2>Haben wir unser Ziel schon erreicht?<\/h2>\n<p>Nicht ganz. Allerdings ist das ein Dauerlauf und kein Sprint. Wir sind \u00fcberzeugt, dass das Fortsetzen des Trainings mit dom\u00e4nenspezifischen Daten, w\u00e4hrend wir danach streben, Abweichungen zu minimieren und Datenschutz und -sicherheit unserer Kunden zu gew\u00e4hrleisten dazu f\u00fchren wird, dass die von uns entwickelte KI-gest\u00fctzte Transkriptions-Engine von Webex bei der durch Menschen verursachten Wortfehlerrate mithalten k\u00f6nnen bzw. diese sogar \u00fcbertreffen wird.<\/p>\n<blockquote>\n<h4><strong><br \/>\n  <em>Wenn Sie es selbst ausprobieren m\u00f6chten, registrieren Sie sich jetzt f\u00fcr eine <\/em><br \/>\n<\/strong><a href=\"https:\/\/www.webex.com\/webex-assistant.html\" target=\"_blank\" rel=\"noopener\"><br \/>\n  <strong><br \/>\n    <em>kostenlose Testversion<\/em><br \/>\n  <\/strong><br \/>\n<\/a><\/h4>\n<\/blockquote>\n<p><strong>Weitere Informationen<\/strong><\/p>\n<p><a href=\"https:\/\/blog.webex.com\/de\/engineering-de\/der-beitritt-zu-webex-als-machine-learning-engineer-ein-interview-mit-ritvik-shrivastava\/\" target=\"_blank\" rel=\"noopener\">Der Beitritt zu Webex als Machine Learning Engineer: Ein Interview mit Ritvik Shrivastava<\/a><\/p>\n<p><a href=\"https:\/\/blog.webex.com\/hybrid-work\/webexs-ai-powered-media-stream-architecture\/\" target=\"_blank\" rel=\"noopener\">Wie unser Streben nach inklusivem Audio\/Video die Zukunft der Zusammenarbeit antreibt<\/a><\/p>\n<p><a href=\"https:\/\/blog.webex.com\/de\/customer-stories\/arbeit-neu-gestalten-mit-webex\/\" target=\"_blank\" rel=\"noopener\">Die Neugestaltung des Arbeitens mit Webex<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Seit wir 2020 Webex Assistant eingef\u00fchrt haben, lautet die meistgestellte Frage unserer Kunden: \u201eIst er genau?\u201c Das ist nachvollziehbar. Kunden [&hellip;]<\/p>\n","protected":false},"author":5580,"featured_media":407510,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"inline_featured_image":false,"footnotes":""},"categories":[1569,5263],"tags":[3851,15232,4733,4643,2079,5499],"class_list":["post-392621","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-hybrides-arbeiten","category-zusammenarbeit","tag-collaboration-solutions","tag-collaboration-solutions-de","tag-kunstliche-intelligenz","tag-maschinelles-lernen","tag-tools-fur-die-zusammenarbeit","tag-webex-assistent"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.8 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Wenn die Suche nach Tschaikowsky bei Skifahren und Chai Tea endet: Die Bewertung der Genauigkeit von maschinell lernenden Transkriptions-Engines | Webex Blog<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Wenn die Suche nach Tschaikowsky bei Skifahren und Chai Tea endet: Die Bewertung der Genauigkeit von maschinell lernenden Transkriptions-Engines | Webex Blog\" \/>\n<meta property=\"og:description\" content=\"Seit wir 2020 Webex Assistant eingef\u00fchrt haben, lautet die meistgestellte Frage unserer Kunden: \u201eIst er genau?\u201c Das ist nachvollziehbar. Kunden [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/\" \/>\n<meta property=\"og:site_name\" content=\"Webex Blog\" \/>\n<meta property=\"article:published_time\" content=\"2022-03-23T21:40:10+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/webex-assistant-and-machine-learning-feature.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"980\" \/>\n\t<meta property=\"og:image:height\" content=\"520\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"Mayada Abdelrahman\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Mayada Abdelrahman\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"7 Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/blog.webex.com\\\/collaboration\\\/hybrid-work\\\/accuracy-of-machine-learning-transcription-engines\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blog.webex.com\\\/collaboration\\\/hybrid-work\\\/accuracy-of-machine-learning-transcription-engines\\\/\"},\"author\":{\"name\":\"Mayada Abdelrahman\",\"@id\":\"https:\\\/\\\/blog.webex.com\\\/es\\\/#\\\/schema\\\/person\\\/22d9b7eaca9f0fac8df343c66932fe51\"},\"headline\":\"Wenn die Suche nach Tschaikowsky bei Skifahren und Chai Tea ...\",\"datePublished\":\"2022-03-23T21:40:10+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/blog.webex.com\\\/collaboration\\\/hybrid-work\\\/accuracy-of-machine-learning-transcription-engines\\\/\"},\"wordCount\":1511,\"image\":{\"@id\":\"https:\\\/\\\/blog.webex.com\\\/collaboration\\\/hybrid-work\\\/accuracy-of-machine-learning-transcription-engines\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/blog.webex.com\\\/wp-content\\\/uploads\\\/2022\\\/03\\\/webex-assistant-and-machine-learning-feature.jpg\",\"keywords\":[\"Collaboration Solutions\",\"Collaboration Solutions\",\"k\u00fcnstliche Intelligenz\",\"Maschinelles Lernen\",\"Tools f\u00fcr die Zusammenarbeit\",\"Webex-Assistent\"],\"articleSection\":[\"Hybrides Arbeiten\",\"Zusammenarbeit\"],\"inLanguage\":\"de-DE\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/blog.webex.com\\\/collaboration\\\/hybrid-work\\\/accuracy-of-machine-learning-transcription-engines\\\/\",\"url\":\"https:\\\/\\\/blog.webex.com\\\/collaboration\\\/hybrid-work\\\/accuracy-of-machine-learning-transcription-engines\\\/\",\"name\":\"Wenn die Suche nach Tschaikowsky bei Skifahren und Chai Tea endet: Die Bewertung der Genauigkeit von maschinell lernenden Transkriptions-Engines | Webex Blog\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/blog.webex.com\\\/es\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/blog.webex.com\\\/collaboration\\\/hybrid-work\\\/accuracy-of-machine-learning-transcription-engines\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/blog.webex.com\\\/collaboration\\\/hybrid-work\\\/accuracy-of-machine-learning-transcription-engines\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/blog.webex.com\\\/wp-content\\\/uploads\\\/2022\\\/03\\\/webex-assistant-and-machine-learning-feature.jpg\",\"datePublished\":\"2022-03-23T21:40:10+00:00\",\"author\":{\"@id\":\"https:\\\/\\\/blog.webex.com\\\/es\\\/#\\\/schema\\\/person\\\/22d9b7eaca9f0fac8df343c66932fe51\"},\"breadcrumb\":{\"@id\":\"https:\\\/\\\/blog.webex.com\\\/collaboration\\\/hybrid-work\\\/accuracy-of-machine-learning-transcription-engines\\\/#breadcrumb\"},\"inLanguage\":\"de-DE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/blog.webex.com\\\/collaboration\\\/hybrid-work\\\/accuracy-of-machine-learning-transcription-engines\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\\\/\\\/blog.webex.com\\\/collaboration\\\/hybrid-work\\\/accuracy-of-machine-learning-transcription-engines\\\/#primaryimage\",\"url\":\"https:\\\/\\\/blog.webex.com\\\/wp-content\\\/uploads\\\/2022\\\/03\\\/webex-assistant-and-machine-learning-feature.jpg\",\"contentUrl\":\"https:\\\/\\\/blog.webex.com\\\/wp-content\\\/uploads\\\/2022\\\/03\\\/webex-assistant-and-machine-learning-feature.jpg\",\"width\":980,\"height\":520,\"caption\":\"The Webex interface shows 6 screens with various people in each, with a bottom overlay of real-time transcriptions happening.\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/blog.webex.com\\\/collaboration\\\/hybrid-work\\\/accuracy-of-machine-learning-transcription-engines\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/blog.webex.com\\\/de\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Wenn die Suche nach Tschaikowsky bei Skifahren und Chai Tea ...\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/blog.webex.com\\\/es\\\/#website\",\"url\":\"https:\\\/\\\/blog.webex.com\\\/es\\\/\",\"name\":\"Webex Blog\",\"description\":\"Webex by Cisco powers collaboration through industry-leading video conferencing, cloud calling and contact center solutions\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/blog.webex.com\\\/es\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de-DE\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/blog.webex.com\\\/es\\\/#\\\/schema\\\/person\\\/22d9b7eaca9f0fac8df343c66932fe51\",\"name\":\"Mayada Abdelrahman\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de-DE\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/2d4711a6fb3e39414ded77ece6f37472cb2cc44707600554a795208180851a66?s=96&d=wp_user_avatar&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/2d4711a6fb3e39414ded77ece6f37472cb2cc44707600554a795208180851a66?s=96&d=wp_user_avatar&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/2d4711a6fb3e39414ded77ece6f37472cb2cc44707600554a795208180851a66?s=96&d=wp_user_avatar&r=g\",\"caption\":\"Mayada Abdelrahman\"},\"description\":\"Mayada Abdelrahman, leads product management for Speech AI\\\/ML features designed for Webex including Cisco\u2019s Webex Assistant, the first-of-its-kind enterprise digital meeting assistant. In this role, Mayada drives the strategy and roadmap for speech AI\\\/ML features for Webex with the goal of transforming the meeting experience and revolutionizing the way we work providing an inclusive meeting experience for everyone. Prior to joining Cisco, Mayada led product and program management at Voicea, an AI\\\/ML startup that built \u201cEva\u201d the meeting assistant which was later acquired by Cisco in 2019. Mayada has a computer science degree from the American University in Cairo and an MBA from Duke University.\",\"sameAs\":[\"https:\\\/\\\/www.linkedin.com\\\/in\\\/mayada-abdelrahman-795b7b15\\\/\"],\"url\":\"https:\\\/\\\/blog.webex.com\\\/de\\\/contributors\\\/mayada-abdelrahman\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Wenn die Suche nach Tschaikowsky bei Skifahren und Chai Tea endet: Die Bewertung der Genauigkeit von maschinell lernenden Transkriptions-Engines | Webex Blog","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/","og_locale":"de_DE","og_type":"article","og_title":"Wenn die Suche nach Tschaikowsky bei Skifahren und Chai Tea endet: Die Bewertung der Genauigkeit von maschinell lernenden Transkriptions-Engines | Webex Blog","og_description":"Seit wir 2020 Webex Assistant eingef\u00fchrt haben, lautet die meistgestellte Frage unserer Kunden: \u201eIst er genau?\u201c Das ist nachvollziehbar. Kunden [&hellip;]","og_url":"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/","og_site_name":"Webex Blog","article_published_time":"2022-03-23T21:40:10+00:00","og_image":[{"width":980,"height":520,"url":"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/webex-assistant-and-machine-learning-feature.jpg","type":"image\/jpeg"}],"author":"Mayada Abdelrahman","twitter_misc":{"Verfasst von":"Mayada Abdelrahman","Gesch\u00e4tzte Lesezeit":"7 Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/#article","isPartOf":{"@id":"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/"},"author":{"name":"Mayada Abdelrahman","@id":"https:\/\/blog.webex.com\/es\/#\/schema\/person\/22d9b7eaca9f0fac8df343c66932fe51"},"headline":"Wenn die Suche nach Tschaikowsky bei Skifahren und Chai Tea ...","datePublished":"2022-03-23T21:40:10+00:00","mainEntityOfPage":{"@id":"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/"},"wordCount":1511,"image":{"@id":"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/#primaryimage"},"thumbnailUrl":"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/webex-assistant-and-machine-learning-feature.jpg","keywords":["Collaboration Solutions","Collaboration Solutions","k\u00fcnstliche Intelligenz","Maschinelles Lernen","Tools f\u00fcr die Zusammenarbeit","Webex-Assistent"],"articleSection":["Hybrides Arbeiten","Zusammenarbeit"],"inLanguage":"de-DE"},{"@type":"WebPage","@id":"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/","url":"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/","name":"Wenn die Suche nach Tschaikowsky bei Skifahren und Chai Tea endet: Die Bewertung der Genauigkeit von maschinell lernenden Transkriptions-Engines | Webex Blog","isPartOf":{"@id":"https:\/\/blog.webex.com\/es\/#website"},"primaryImageOfPage":{"@id":"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/#primaryimage"},"image":{"@id":"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/#primaryimage"},"thumbnailUrl":"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/webex-assistant-and-machine-learning-feature.jpg","datePublished":"2022-03-23T21:40:10+00:00","author":{"@id":"https:\/\/blog.webex.com\/es\/#\/schema\/person\/22d9b7eaca9f0fac8df343c66932fe51"},"breadcrumb":{"@id":"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/#breadcrumb"},"inLanguage":"de-DE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/"]}]},{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/#primaryimage","url":"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/webex-assistant-and-machine-learning-feature.jpg","contentUrl":"https:\/\/blog.webex.com\/wp-content\/uploads\/2022\/03\/webex-assistant-and-machine-learning-feature.jpg","width":980,"height":520,"caption":"The Webex interface shows 6 screens with various people in each, with a bottom overlay of real-time transcriptions happening."},{"@type":"BreadcrumbList","@id":"https:\/\/blog.webex.com\/collaboration\/hybrid-work\/accuracy-of-machine-learning-transcription-engines\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/blog.webex.com\/de\/"},{"@type":"ListItem","position":2,"name":"Wenn die Suche nach Tschaikowsky bei Skifahren und Chai Tea ..."}]},{"@type":"WebSite","@id":"https:\/\/blog.webex.com\/es\/#website","url":"https:\/\/blog.webex.com\/es\/","name":"Webex Blog","description":"Webex by Cisco powers collaboration through industry-leading video conferencing, cloud calling and contact center solutions","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/blog.webex.com\/es\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de-DE"},{"@type":"Person","@id":"https:\/\/blog.webex.com\/es\/#\/schema\/person\/22d9b7eaca9f0fac8df343c66932fe51","name":"Mayada Abdelrahman","image":{"@type":"ImageObject","inLanguage":"de-DE","@id":"https:\/\/secure.gravatar.com\/avatar\/2d4711a6fb3e39414ded77ece6f37472cb2cc44707600554a795208180851a66?s=96&d=wp_user_avatar&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/2d4711a6fb3e39414ded77ece6f37472cb2cc44707600554a795208180851a66?s=96&d=wp_user_avatar&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/2d4711a6fb3e39414ded77ece6f37472cb2cc44707600554a795208180851a66?s=96&d=wp_user_avatar&r=g","caption":"Mayada Abdelrahman"},"description":"Mayada Abdelrahman, leads product management for Speech AI\/ML features designed for Webex including Cisco\u2019s Webex Assistant, the first-of-its-kind enterprise digital meeting assistant. In this role, Mayada drives the strategy and roadmap for speech AI\/ML features for Webex with the goal of transforming the meeting experience and revolutionizing the way we work providing an inclusive meeting experience for everyone. Prior to joining Cisco, Mayada led product and program management at Voicea, an AI\/ML startup that built \u201cEva\u201d the meeting assistant which was later acquired by Cisco in 2019. Mayada has a computer science degree from the American University in Cairo and an MBA from Duke University.","sameAs":["https:\/\/www.linkedin.com\/in\/mayada-abdelrahman-795b7b15\/"],"url":"https:\/\/blog.webex.com\/de\/contributors\/mayada-abdelrahman\/"}]}},"_links":{"self":[{"href":"https:\/\/blog.webex.com\/de\/wp-json\/wp\/v2\/posts\/392621","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blog.webex.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blog.webex.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blog.webex.com\/de\/wp-json\/wp\/v2\/users\/5580"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.webex.com\/de\/wp-json\/wp\/v2\/comments?post=392621"}],"version-history":[{"count":0,"href":"https:\/\/blog.webex.com\/de\/wp-json\/wp\/v2\/posts\/392621\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blog.webex.com\/de\/wp-json\/wp\/v2\/media\/407510"}],"wp:attachment":[{"href":"https:\/\/blog.webex.com\/de\/wp-json\/wp\/v2\/media?parent=392621"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.webex.com\/de\/wp-json\/wp\/v2\/categories?post=392621"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.webex.com\/de\/wp-json\/wp\/v2\/tags?post=392621"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}