<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=908082315970423&amp;ev=PageView&amp;noscript=1">

UPGREAT Blog

Bald wieder an der Tagesordnung: Das Diktat im Büro.

Spracherkennungssoftware ist effizienter als jemals zuvor. Denn anstatt nur Befehle unter Windows auszuführen, die Wettervorhersage zu erfahren oder Suchen zu initiieren, kann man mit Microsofts Spracherkennung in Office für Windows nunmehr auch Briefe schreiben. Und das ganz ohne Tastatur. Microsoft Dictate nutzt hierzu unter anderem Cortana, die Sprachassistentin von Windows 10. Erfahren Sie in diesem Blogbeitrag ob dies ein mögliches Zukunftsszenario der Interaktion zwischen Nutzer und PC ist.

Was ist Microsoft Dictate?

Microsoft Dictate entstammt der experimentellen Entwicklungsschmiede Microsoft Garage, die seit 2009 kleinere Projekte im Hause Microsoft vorantreibt. Dictate wurde als Add-in konzipiert, lässt sich also einfach in jede installierte Office-Version ab Version 2013 inkl. Office 365 einbinden. Direkt nach der Installation erscheint „Dictation“ in Office-Anwendungen wie Word als zusätzlicher Reiter. Die kostenlose Erweiterung für Microsoft Office steht als 32- und 64-Bit-Variante zum Download zur Verfügung und beherrscht verschiedene Sprachen, darunter auch Deutsch. Wir brachten die 64-Bit-Variante nicht zum Laufen, mit der 32-Bit-Variante funktionierte es auf Anhieb.

Tippen mit der Stimme

Mit Dictate kann der Benutzer in Word, PowerPoint und Outlook Spracheingaben in Text verwandeln. Der Benutzer muss nur das Mikrofon anschliessen beziehungsweise aktivieren und die Diktiersprache auswählen. Schon kann er damit beginnen, mit seiner Stimme zu „tippen“. Zwar versteht Microsoft Dictate die deutsche Sprache, muss aber bei Satzzeichen und Cursorsteuerungen noch passen. Hierfür stehen jedoch ein paar Befehle in englischer Sprache zur Verfügung. So bedeutet „Question mark“ Fragezeichen und „New line“ versetzt den Cursor auf die nächste Zeile.

Wie funktioniert Dictate?

Die Umwandlung von Spracheingaben in Text funktioniert in 29 Sprachen, darunter auch Deutsch. "Schwyzerdütsch" wird aktuell allerdings noch nicht unterstützt. Um Sprache in Text umzuwandeln, nutzt Microsoft die Sprachassistentin Cortana und das BingSpeech API. Künstliche Intelligenz ist natürlich ebenfalls ein wichtiger Teil der Spracherkennung. Neben dieser bietet Microsoft zudem eine Echtzeit-Übersetzungsfunktion, die sogar 60 Sprachen unterstützt. Bei Microsoft arbeitete man schon sehr lange an einem derartigen Projekt. Dem Forscherteam gelang es hierbei, die digitale Spracherkennung kontinuierlich zu verbessern. Das System ist mit einer Wortfehlerrate von nur noch 5,1 Prozent inzwischen so effizient wie die Spracherkennung eines Menschen.

Sicherheit und Datenspeicherung

Viele Nutzer fragen sich, welche ihrer Daten bei der Nutzung von Microsoft Dictate wie genutzt und gespeichert werden. Genaue Angaben dazu finden sich leider nicht. Da Dictate allerdings auf Funktionen von Cortana zurückgreift, ist anzunehmen, dass ähnliche Datenschutzbestimmungen gelten wie bei deren Nutzung. Um das Plug-In zu nutzen, muss der Nutzer jedoch letztlich nicht online sein. Wer also einen vertraulichen Geschäftsbrief lokal auf seinem Rechner speichern will, kann Microsoft Dictate wahrscheinlich ohne Bedenken als Tastaturersatz verwenden.

Einsatz von Microsoft Dictate am Arbeitsplatz

Der Einsatz von Sprachsteuerung im Allgemeinen und Microsoft Dictate im Besonderen wirft bei vielen Nutzern und IT-Verantwortlichen Fragen auf. Etwa, ob ein Einsatz im Grossraumbüro wegen des erhöhten Geräuschpegels technisch machbar und sinnvoll ist. Wenn alle mit ihrem PC reden, entsteht Lärm, der die normale Kommunikation erschweren könnte. Nun kommt es natürlich immer auf die konkrete Arbeitssituation an. Im Callcenter beispielsweise nutzen Mitarbeiter Headsets nicht nur, um beide Hände freizuhaben, sondern auch, um sich gegen akustische Störeinflüsse der Umgebung abzuschirmen. Ein ähnliches Szenario ist auch beim grossflächigen Einsatz von Spracherkennung und Spracheingaben denkbar. Ein Headset würde dann zum unverzichtbaren Bestandteil einer jeden Arbeitsplatzausstattung. Das könnte dem Verkauf von Headsets zugutekommen. Ob es tatsächlich so kommt, bleibt abzuwarten.

Spracherkennung und -steuerung auf dem Vormarsch

Es ist unübersehbar, dass Spracherkennung und -steuerung im privaten Bereich immer mehr an Bedeutung gewinnen. Zahlreiche bekannte Unternehmen bieten inzwischen Systeme an, die man nach der Uhrzeit oder dem Wetter fragen kann oder dazu nutzt, online einzukaufen. Einige Sprachlösungen wie Siri können sogar Notizen schreiben. Für viele ist das aber noch ein Nice-to-have. Microsoft geht mit Dictate jedoch einen Schritt weiter, indem es seine Spracherkennung als Alternative zur Tastatureingabe in eine komplette Office-Umgebung integriert und damit zum Teil einer modernen Bürokommunikation macht.

Eigene Erfahrung und Fazit

Diese Theorie ist schön und gut, ich wollte aber selber testen, wie einfach und praktisch Dictate wirklich ist. Hierbei habe ich folgende Erfahrungen gemacht:

  • Die Installation von Dictate ist kinderleicht, ein paar mal auf Weiter klicken und schon ist das Add-In einsatzbereit.
  • Einfache Sätze sind kein Problem. Bei längeren Sätzen, mit schwierigeren Wörtern hat das Programm noch Schwierigkeiten.
  • Die Handhabung ist sehr einfach, hat aber noch einige Macken, vor allem wenn man Punkt, Komma, oder eine neue Linie machen will. Diese werden auf Deutsch als Wörter und nicht als Befehle erkannt. Auf diese Einschränkung weisst Microsoft bereits hin.
  • Die Englische Spracherkennung hat beim Testen am besten funktioniert, bei Schweizerdeutsch werden die meisten Wörter einfach auf Hochdeutsch übersetzt. Einige kann es aber überhaupt nicht verstehen, z.B. wird aus "Chuchichästli"  "Kuchen rechtlich". 

Einen lustigen Moment erlebte ich, als ich vergessen hatte die Aufnahme zu beenden: Ich sagte: "Cooli Sach, das Progrämmli" und sogar das hat es als "Coole Sache das Programm lieb“ aufgenommen.

Fazit: Beste Spracherkennung die ich bis jetzt gesehen habe. Hat aber immer noch zu viele Probleme, als das man damit effektiv arbeiten könnte. Die Texte muss man unbedingt kontrollieren, insbesondere da einige Wörter jeweils nicht korrekt erkannt werden.

Den Einstieg mit Office 365 machen

Wir begleiten den digitalen Wandel unserer Kunden durch hochflexible, effizienzsteigernde und sichere Informationstechnologien. Microsoft Office 365 mit all seinen Komponenten ist ein Teil davon. Wenn Sie mehr über die Vorteile einer Office-365-Integration einschliesslich der Möglichkeiten, Text in Office-Anwendungen mit der Stimme tippen zu können, erfahren möchten, fragen Sie uns einfach. Wir helfen Ihnen gerne weiter.

Topics: Microsoft, Office 365