Sycor Group LogoSycor Group Logo
Sycor Group LogoSycor Group Logo
Microsoft
Spracherkennung mit Machine Learning

Spracherkennung mit Machine Learning

19. Juli 2018

Wenn wir eine neue Sprache lernen stellen wir schnell fest, dass natürliche Sprache (geschrieben oder gesprochen) sehr komplex ist. Die großen Player wie Microsoft, Google und Amazon entwickelten Lösungen, um natürliche Sprache technisch verarbeiten zu können. Ein gutes Beispiel ist Alexa von Amazon. Auch wenn es immer wieder Erfolge auf diesem Gebiet zu verzeichnen gibt, ist die Technik doch noch weit hinter der Alltagstauglichkeit zurück. Aber dieses Thema ist nicht nur für den Privatbereich interessant, Unternehmen können sich die Verarbeitung von Sprache ebenfalls zu Nutze machen. Hier sind das Potential und der Mehrwert für die Unternehmen enorm. Denken Sie beispielsweise an die Einzelworterkennung in der Lagerhaltung. Komplexität in natürlicher Sprache besteht darin, die Intention, die ein Sprecher mit einem Satz hat, herauszufinden. Intention hängt häufig an kleinen Details. Auch können mehrere Intentionen in einem Satz stecken, oder gar keine. Neben Intentionen müssen auch relevante Informationen wie Personen, Orts- oder Zeitangaben und allgemeine Objekte technisch erkannt werden. Und das in diversen Ausführungen und Variationen.

Microsoft LUIS meets LifeSciences

Mit LUIS (Language Understanding Intelligent Service) bietet Microsoft einen Service für die Sprachverarbeitung an. Für die LifeSciences-Branche haben wir die Microsoft-Lösung für die Erkennung von Intentionen bei Besuchsberichten von Beratern bei Kunden (häufig im CRM Umfeld) weiterentwickelt. Dabei wurde ein konkretes Szenario mit einer begrenzten Anzahl an möglichen Intentionen, wie zum Beispiel Telefontermin, Opportunity anlegen, Personen informieren, Unterlagen/Informationen verschicken, betrachtet. 

Spracherkennung mit Microsoft LUIS

Hinzu kommen relevante Informationen, wie der Tag, die Uhrzeit und die Teilnehmer für den Telefontermin, welche Person soll über was informiert werden, oder wem soll was wann geschickt werden. Im ersten Schritt, wird der eingegebene Text ins Englische übersetzt, da die Spracherkennung für die englische Sprache am weitesten fortgeschritten ist. Zwar ist die Übersetzung nicht hundertprozentig perfekt, aber da sie rein technisch verarbeitet wird, ist sie fast immer ausreichend gut, um den Sinn des Satzes bzw. der Aussage zu verstehen. Mit Spracherkennungsmethoden (Part-of-Speech-Tagging) wird dann der gesamte Text analysiert und in seine Einzelteile zerlegt. Hieraus können mehrere Sätze mit jeweils einer Intention extrahiert werden, auch wenn sie sich formal in einem Satz befinden (nicht durch Punkt getrennt). Einzelne Sätze werden an Microsoft LUIS geschickt. Dieses Tool hat auf Basis von Trainingssätzen gelernt Sätzen Intentionen zuzuweisen. Außerdem gibt das Tool auch relevante Informationen zurück.

Im letzten Schritt werden aus den jeweiligen Intentionen und ihren relevanten Informationen, entsprechende Aktionen (z.B. im CRM) vorgeschlagen.

Im letzten Schritt werden aus den jeweiligen Intentionen und ihren relevanten Informationen, entsprechende Aktionen (z.B. im CRM) vorgeschlagen.

Ablauf

Dieses System lässt sich leicht auf jegliche Spracheingabe- und Analyseszenarien adaptieren. Es bedarf einiger (~20 pro Intention) Beispielsätze und der jeweiligen Information, was erkannt werden soll. Daraus lässt sich dann ein Verfahren für den konkreten Anwendungsfall erstellen.

Ihr Ansprechpartner

Udo Burbrink

Bereichsleitung Microsoft Dynamics

Kontaktformular

Unsere Partner

Alle Partner