Digitale Werkzeuge: Spracherkennungssoftware

In dieser Reihe stellen wir digitale Hilfsmittel vor, die für die Arbeit an der Universität Erfurt nützlich sein können – für die Forschung, kollaboratives Arbeiten oder die (Selbst)Organisation.
Anregungen für neue Beiträge nimmt gerne entgegen: Dr. Katrin Ott

Heute stellt Victoria Fischer, Wissenschaftliche Mitarbeiterin am Lehrstuhl für Quantitative Methoden der empirischen Sozialforschung, eines ihrer Arbeitsinstrumente vor:

Eine Spracherkennungssoftware

Kommunikation ist eine Schlüsselkompetenz in der heutigen Gesellschaft. Der Austausch von Informationen, das Formulieren und das Darlegen von Inhalten ist für viele Berufe der Grundstein. Dabei sitzt man, je nach Fingerfertigkeit, kürzer oder länger an einem Text und damit sehr oft am Schreibtisch.

Bei meiner Arbeit transkribiere ich wissenschaftliche Interviews. Dazu höre ich das gesprochene Wort aus dem Interview, welches ich Stück für Stück der Software diktiere. Gleichzeitig lese ich mit, korrigiere und formatiere händisch. Dieses Prozedere ist zwar sehr anstrengend, weil ich mehrere Sinne gleichzeitig gebrauche. Aber wenn das Tippen entfällt, spare ich etwa ein Drittel der Zeit. Populäre smarte Assistenten wie „Alexa“ oder „Cortana“ zeigen, dass Spracherkennung immer mehr in den Alltag integriert wird, aber heute möchte ich meine Arbeit mit der Spracherkennungssoftware DragonNaturally Speaking beschreiben.

Mit Hilfe dieser Software lassen sich in einem Textverarbeitungsprogramm o.ä. mittels eines Headsets Worte diktieren, die unmittelbar auf dem Bildschirm als Text erscheinen, wobei die Software die individuelle (Aus-)Sprache und die Formulierungsgewohnheiten ihrer Anwender lernt. Mit ein wenig Übung ist es sogar möglich, die Inhalte unterwegs in ein externes Aufnahmegerät zu sprechen und im Anschluss von der Software automatisch „transkribieren“, also niederschreiben zu lassen. Die Software bringt einige Befehle mit, die im ersten Moment gewöhnungsbedürftig erscheinen, aber mit ein wenig Übung immer selbstverständlicher werden. So kann man die Aufnahme des Mikrophons mit dem Befehl „Geh schlafen“ pausieren oder mit „Wach auf“ wieder aktivieren. Will man ein Fremdwort diktieren, lautet der Befehl „schreib >Fremdwort<“. Nach der Erstellung eines Textes lassen sich mit „Markiere …“, „Ersetze …“ oder „Lösche …“ mehr oder weniger gut Veränderungen vornehmen. Für diejenigen, die flink mit den Händen sind oder sich weniger auf die Software einlassen wollen, besteht jederzeit die Option, mit Maus und Tastatur in den Text einzugreifen.

Derartige Tools bieten also Zeitersparnis gegenüber oft mühsamer Verschriftlichung. Doch die Handhabung muss erprobt werden, und es braucht eine ruhige Umgebung. Dann kann sie aber Erleichterung schaffen für alle, die nicht gut tippen können. Das betrifft nicht nur Menschen mit Einschränkungen, sondern mitunter auch die prä-digitale Generation. Daher können Spracherkennungstools als inklusive Software nur empfohlen werden. Für Beschäftigte der Universität Erfurt bietet ein solches Tool gegebenenfalls eine Arbeitserleichterung in der Forschung oder Verwaltung.