Großraumbüros, standortabhängiges Arbeiten und klassische Bürozeiten von 9 bis 17 Uhr sind in Unternehmen nicht mehr die Regel. Heute gehören Agilität sowie Remote Work zum Arbeitsalltag der meisten Firmen dazu. Beschleunigt wurde der Wandel des Arbeitslebens nicht zuletzt wegen der COVID-19-Pandemie. In diesem Transformationsprozess gewinnt auch professionelle Spracherkennung an Bedeutung. Doch welche Einsatzmöglichkeiten für die Software gibt es, was kann sie leisten und wo liegen die Vorteile sowie (noch) die Grenzen?
31. März 2021
|
Lesedauer: ca. 4 Min.
Bild: © Nuance
Remote Work und die damit verbundene Möglichkeit, von überall aus zu arbeiten, ist für viele Arbeitnehmer ein großer Anreiz. Laut eines Beitrags des Fachmagazins marconomy.de sorgt das Angebot von Remote Work bei vielen Unternehmen für mehr Kreativität. Außerdem trete ein weiterer positiver Nebeneffekt ein – nämlich fähige Talente anzuziehen. Dies führe wiederum zu einem deutlichen Wettbewerbsvorteil. Wörtlich heißt es im Artikel: „Flexible Arbeit muss auf organisatorischer Ebene normalisiert und etabliert werden, aber Remote Work ist natürlich noch kein Erfolgsgarant; es ist nur ein Puzzlestück, wenn auch ein überaus wichtiges.“
Unternehmen und Arbeitnehmer können gleichermaßen von diesem Modell profitieren, wobei letztere auch weitere Ansprüche an das Arbeiten hegen: Wie das Fachportal welt.de berichtet, sollen althergebrachte Hierarchien, Status- und Machtdenken sowie übermäßiger Leistungsdruck aus dem Arbeitsalltag so weit wie möglich verschwinden.
Aber nicht nur auf dieser Ebene sind Veränderungen zu verzeichnen. Auch Fortschritte in der Künstlichen Intelligenz (KI) sorgen für Modernisierungen am Arbeitsplatz: So können Tastatur und Maus nach und nach von modernen Ausstattungen wie Spracherkennungssystemen abgelöst werden. Diese nutzen zum Beispiel KI, um gesprochene Texte nahezu fehlerfrei erkennen und umsetzen zu können.
Auch durch die Verbreitung von Cloud Computing nimmt der Gebrauch von Spracherkennungslösungen zu. Beispielsweise hat sich der Anbieter Nuance mit seiner Software Dragon Professional Anywhere auf den Einsatz von professioneller Spracherkennung in der Cloud spezialisiert. Mit dieser cloudbasierten Spracherkennungslösung können Mitarbeiter von jedem Standort aus auf Unternehmensressourcen zugreifen und so vor allem Routine-Aufgaben effizienter erledigen.
Ob es nun um die digitale Erfassung von handschriftlichen Notizen, Arbeitsanweisungen von Führungskräften, Berichten von Außendienstlern oder Mandanten- oder Patientenakten geht – Spracherkennungssoftware erleichtert in vielen Branchen den Arbeitsalltag.
Mitarbeiter, die Texte und Systembefehle diktieren statt eingeben, haben die Hände frei für andere Dinge und können sich besser auf ihr Gegenüber konzentrieren. Als besonders effizient erweist sich der Einsatz von medizinischer Spracherkennung: Studien belegen, dass sich in Kliniken damit unter anderem die Nutzung digitaler Dokumentationssysteme (elektronische Gesundheitsakte, klinische Berichte etc.) und der damit verbundene Workflow deutlich verbessert, was Ärzte und Patienten zufriedener macht.
Hersteller sagen, dass sich Texte mit Spracherkennung dreimal so schnell erstellen lassen wie durch herkömmliches Tippen. Auch wenn es auf das individuelle Arbeitstempo ankommt, ist die Zeitersparnis durch Spracherkennungssoftware ein klares Plus. Und das spart Kosten, auch weil zum Beispiel das Transkribieren durch externe Dienstleister entfällt.
Auch im Hinblick auf das Miteinander im Unternehmen kann sich Spracherkennung lohnen: So lassen sich damit unter anderem gehörlose Kollegen leichter integrieren, wenn sie das Gesprochene der Kollegen in Echtzeit mitlesen können. Und auch fürs betriebliche Gesundheitsmanagement ergeben sich Vorteile, denn Tippen und Mausklicken verursachen oft schmerzhafte Verspannungen.
Während der Nutzung von Spracherkennungsprogrammen sollte ein hochwertiges Mikrofon anstelle günstiger Headsets verwendet werden. So lässt sich verhindern, dass Störgeräusche wie Verkehrslärm oder die Geräuschkulisse in Großraumraumbüros die Nutzung beeinträchtigen.
Für unmittelbare, einwandfreie Ergebnisse beim Diktat ist es wichtig, sich eine exakte Sprechweise anzugewöhnen, die auch Befehle für Zeichensetzung und Schreibweisen beinhaltet. Allerdings verzeichnen professionelle Spracherkennungsprogramme immer größere technische Fortschritte. Dank dem Einsatz von Künstlicher Intelligenz sind diese heute in der Lage, die Sprechweise einer bestimmen Person zunehmend besser zu verstehen – selbst wenn die Person mit Dialekt spricht.
Komplexe Kommandos oder Fragen überfordern viele Programme noch, weil einzelne Worte zwar erkannt, aber nicht korrekt interpretiert werden ‒ etwa weil der Kontext unklar ist oder es für ein Wort je nach Aussprache mehrere Bedeutungen gibt. Hier gilt es, die künstlichen neuronalen Netze weiter mit Daten zu speisen, um sich dem menschlichen Sprachverständnis anzunähern.
Abgesehen von Hemmungen, vor Kollegen frei mit einem Gerät zu sprechen, können auch Datenschutzbedenken oder fehlende Geduld, sich mit komplexer Software auseinanderzusetzen, Gründe dafür sein, Spracherkennung nicht zu verwenden.
Professionelle Spracherkennungsprogramme müssen eine hohe Datensicherheit aufweisen und in der Lage sein, sich an Kundenanforderungen zu orientieren. Das Unternehmen Nuance betont, dass ihre Software Dragon genau diese Anforderungen erfüllt. Laut Hersteller lässt sich Dragon maßgeschneidert in bestehende Workflows integrieren und gewährleistet ein hohes Sicherheitsniveau.
Bild: © Nuance
Tatsächlich heißt die seit Jahren meistverkaufte Spracherkennungssoftware Dragon – in Deutschland auch unter dem Namen Dragon Naturally Speaking bekannt – und kommt von Nuance. Vom Anbieter als „Produktivitätslösung“ bezeichnet, gibt es sie in mehreren PC- und Smartphone-Versionen, sowohl für Unternehmen und spezielle Branchen wie Medizin und Recht (Dragon Medical und Dragon Legal) als auch für den privaten Gebrauch. Zudem bietet der Hersteller mit „Dragon Professional Anywhere“ eine dedizierte, cloudbasierte Variante seiner Spracherkennungssoftware an.
Neben der hohen Datensicherheit ist ein zentraler USP der Einsatz von Künstlicher Intelligenz: Dragon stellt sich individuell auf den Nutzer und seine Sprachgewohnheiten ein. Dazu absolviert dieser zu Beginn ein akustisches Training, indem er zum Beispiel Texte vorliest. Durch das automatische Analysieren von geschäftlichen E-Mails etc. erlernt das Programm zudem ein spezifisches Vokabular, das sich manuell erweitern lässt. Mit der Zeit erreicht Dragon so laut Nuance eine Erkennungsgenauigkeit von 99 Prozent.
Sie möchten mehr über Spracherkennungssoftware erfahren oder eine unverbindliche Beratung erhalten? Hier geht es zur exklusiven Themenseite.
Dieser Artikel gehört zu einer vierteiligen Serie zum Thema Spracherkennung. Die weiteren Bestandteile sind: