Sprachverarbeitung auf dem Vormarsch

  • Foto: Shutterstock 571228546Foto: Shutterstock 571228546

Wie entwickelt sich der Markt für Sprachverarbeitung? Welche neuen Anwendungsgebiete zeichnen sich ab?

Sprachverarbeitung dringt in immer weitere Bereiche des ärztlichen Alltags und des Krankenhausalltags insgesamt vor. wenn auch oft nur zögerlich oder ganz im Verborgenen. Teils so verborgen, dass bei der Spracherkennung früher oder später ein Skandal ans Licht kommt, wie zuletzt bei einigen Anbietern von Geselligen Medien. Dort wurde mitgehörter sprachlicher Input ohne Kenntnis der User von Mitarbeitern der Unternehmen ausgewertet, wenn auch – selbstverständlich – nur zur Verbesserung der Spracherkennung.

Auch über Diktiersysteme sowie über Sprachverarbeitung im weiteren Sinne ist schon viel geschrieben worden – oft jedoch über die typischen Anwendungsfälle in der konkreten Arbeit des Arztes bei der Befundung oder Dokumentation. Eine weitere, mit Künstlicher Intelligenz (KI) verknüpfte Anwendungsmöglichkeit für die Spracherkennung und -verarbeitung könnte eine automatisierte Einschätzung von Behandlungsrisiken sein. Dazu werden natürlich sprachliche Befunde und Dokumentationen nach spezifischen Begriffen untersucht und die Findungen in ihrem Kontext analysiert. Gekoppelt mit KI könnten hier aus den verschiedenen Diktaten der beteiligten Mediziner auch die Diagnose automatisiert oder zumindest durch den Computer unterstützt werden. Der Vorteil gegenüber der herkömmlichen Vorgehensweise ist schlussendlich der, dass bereits alle Informationen digitalisiert sind. Damit werden Suchen in Datenbanken bezüglich Therapie und Medikation überflüssig.

Markt für Sprachverarbeitung wächst

Die tägliche Nutzung solcher virtuellen Assistenten, und hier ist ausdrücklich gesprochene Sprache gemeint, wird sich bei Menschen, die digital arbeiten von zwei Prozent im Jahr 2019 auf 25 Prozent bis 2021 steigern (weltweit), mutmaßt das US-amerikanische Marktforschungsunternehmen Gartner, allerdings ohne die Anteile im Gesundheitswesen zu spezifizieren. Das Marktvolumen für die Anwendungen mit Text-to-Speech und Speech-to-Text umreißt Gartner mit 3,5 Mrd. US-Dollar.

Dabei sollen laut Gartner Ferndiagnosen und Altenpflege sowie die medizinische Dokumentation zu den wichtigen Anwendungsgebieten der Sprachverarbeitung gehören.

Spracherkennung soll aber auch für die administrativen Abläufe wie eine Labortest-Bestellung nutzbar sein. Die Adaption von Sprach-Verarbeitung aus anderen Branchen soll demnach auch die Verbreitung im Gesundheitswesen steigern.

Die Technologien für diese Anwendungen gibt es bereits und langsam dringen sie in den Alltag vor wie „einst“ die Diktiergeräte. Deshalb wird es Zeit, einen Blick in die Kristallkugel zu werfen und zu überlegen, welche Anwendungen und Ideen sich deutlicher abzeichnen und welche vage zu erkennen sind.

Anleitungen und Findhilfen

Ebenfalls nicht uninteressant ist der Gedanke, die Sprachverarbeitung für die Anleitung von Mitarbeitern generell anzuwenden. In bestimmten Situationen wie z.B. dem Ordnen von Materialien könnte die sprachliche Eingabe „Wohin gehört ...?“ oder „Wo finde ich ...?“ klinische Anordnungen ersetzen. Dabei muss die Eingabe nicht zwingend gesprochen werden, sondern kann natürlich auch schriftlich über eine Tastatur oder ein Dokument kommen, wobei der Unterschied zur klassischen IT ist, dass dort bestimmte Formatierungen, Tabellenstrukturen oder Masken-Eingaben erforderlich waren. Technologien zum Aufbau solcher Lösungen sind vorhanden. Die Anwendungen selbst müssen heute noch individuell programmiert werden. Das können sich möglicherweis nur sehr große Einrichtungen oder Häuser mit einem Programmierfundus in Form einer Informatik-Fakultät in der gleichen Universität leisten. Kleinere Häuser werden warten müssen, bis es „out-of-the-box“-Lösungen gibt.

Zugangskontrolle und Sicherheit

Eine weitere Anwendung ergibt sich dann auch weit außerhalb von medizinischen Anwendungen. Ganz vorn steht da die Zugangskontrolle zu Einrichtungen und zu Geräten. Die Gesichtserkennung ist eine Möglichkeit, die es seit einigen Jahren gibt. Bilderkennungssysteme könnten aber mit sehr guten Fälschungen auch überlistet werden. Bilder von Benutzern gibt es – zumindest dann, wenn diese sich in Social Media bewegen – zu Hauf. Die Sprache hingegen liegt weitaus seltener als digitales Muster vor. Daher könnten sprachbasierende Zugangskontrollen ein hohes Maß an Sicherheit bieten. Identifizierung und Autorisierung sind über ein Stimmmuster eindeutiger als über eine Bilderkennung.

Fertige Lösungen entstehen erst beim Anwender

Hier zeigt sich (im Gegensatz zur Welt des Diktierens) auch eine Krux in aktuellen Produktstrategien der Software-Hersteller im Bereich fortgeschrittener Anwendungen wie KI mit Sprachverarbeitung: immer seltener werden fertige Komplettlösungen entwickelt. Es gibt eine Black-box mit einer Anzahl von Kernalgorithmen wie eben Verarbeitung von Sprache, die eigentliche Lösung wird dann jedoch „agil“ entwickelt, nach Anwendervorgaben. Es wird also müßig, auf fertige Lösungen zu warten. Die Entwicklermodelle verschieben sich und die Anwender müssen sich auf dieses agile Entwickeln einstellen. Deswegen betonen die Software-Hersteller auch immer wieder die Fähigkeiten ihrer Modelle für das Deep Learning und die Vielfalt und Größe ihrer Software-Libraries, obwohl dort eben „nur“ die Software-Routinen lagern, aus denen die Anwendungen gebaut werden. Faszinierend ist aber in jedem Fall die Vielfalt an solchen Software-Routinen, mit denen Computer (mit ein bißchen Aufwand) schon ganz gut die Erledigung der Aufgaben eines Menschen nachahmen können. Es erfordert aber auch ein Umdenken in der Beschaffung: Es gibt dann nicht mehr die Lösung xy, wo die Nutzung für eine bestimmte Laufzeit lizenziert wird. Es wird immer öfter notwendig werden, dass sich verschiedene Leistungserbringer und Kostenträger zusammenschließen, um zu einer Lösung zu kommen.

Breiteres Spektrum an Anwendungen

Spracherkennung und -verarbeitung werden künftig in einem deutlich breiten Anwendungsspektrum als bislang zu finden sein. Dabei rücken nach den Einsatzgebieten in der medizinischen Befundung und Dokumentation nun auch administrative Bereich in auf den Schirm. 

 

 

 

Authors

Jetzt registrieren!

Die neusten Informationen direkt per Newsletter.

To prevent automated spam submissions leave this field empty.