Transfer Learning - rasche Erfolge mit wenigen Daten

Mehr Einsatzszenarien für Künstliche Intelligenz

07.08.2020

Transfer Learning ist eine Methode aus dem Deep Learning. Dabei wird ein vortrainiertes künstliches neuronales Netz für die Lösung neuer Problemstellungen genutzt. Weil man damit schnelle und ressourcenschonende Erfolge bei neuen Aufgabenstellungen erzielt, ist Transfer Learning ein wichtiges Werkzeug, um Künstliche Intelligenz leichter und in einer größeren Zahl von Anwendungsfällen einsetzen zu können.

KI funktioniert gut für diejenigen Firmen, die viele Daten besitzen und sich Modelle maßschneidern lassen können: DeepL hat einen leistungsfähigen Übersetzungsdienst, weil das Unternehmen Daten gesammelt hat und weil es viel in sein Übersetzungsverfahren investiert hat. Google kann Chihuahuas von anderen Hunden in Bildern unterscheiden, weil man dort über die entsprechenden Daten verfügt und sich Modelle gezielt für diese Sorte Bildklassifikation zurechtschneiden kann. Automobilhersteller arbeiten mit großen Datenmengen an der Entwicklung und Perfektionierung autonomer Fahrsysteme.

Funktioniert KI auch ohne Massendaten?

Trotz dieser Erfolge werden die meisten Bürojobs durch KI kaum vereinfacht. Woran liegt das? Es liegt nicht nur daran, dass die Massendaten fehlen, sondern auch daran, dass Bürotätigkeiten sehr vielfältig sind. Es ist also praktisch unmöglich für jede einzelne Tätigkeit in einem Unternehmen große Datenmengen zu sammeln, ein Modell maßzuschneidern, es den Knowledge Workern wie ein Spracherkenner als fertiges System an die Hand zu geben und ihnen zu sagen: “Ab jetzt musst du dieses SAP-Formular nicht mehr ausfüllen, die KI macht es für Dich”.

IntraFind verfolgt als Spezialist für Enterprise Search und Content Analytics deshalb das Ziel, den Wissensarbeitern das Werkzeug an die Hand zu geben und der Maschine beizubringen, was die Anwender von ihr brauchen. Unsere Software lernt im Praxiseinsatz an Ort und Stelle den Menschen zu helfen. Die Optimierungen werden nicht a priori eingebaut. Vielmehr muss das System gewissermaßen als generische Lernmaschine fungieren.

Transfer Learning kommt also dann ins Spiel, wenn man das Lernen einer Aufgabe durch generisches Vorwissen beschleunigen möchte. Wählen wir das Beispiel Vertragsanalyse: Nehmen wir an, die Tätigkeit verlangt die Erkennung von Home Office-Regelungsklauseln in Arbeitsverträgen. Anstatt bei der Erkennung von Fachthemen bei Null anzufangen (Was sind Buchstaben? Wie unterscheiden sich Wörter syntaktisch, morphologisch? etc.) macht es Sinn, ein System ab einem bestimmten Wissenstand zu trainieren. Das heißt, man nimmt ein vortrainiertes Modell mit einem umfassenden Sprachverständnis, das Sätze und Grundformen von Wörtern etc. bereits erkennt. Dann trainiert beziehungsweise justiert man es mit relativ wenigen Trainingsdaten auf ein bestimmtes Fachgebiet, wo es dann in der Lage ist, Zusammenhänge zu erkennen. Die Erkennung von Home Office-Klauseln basiert dann also auf einem schon funktionierenden Sprachmodell. Dieses Vorwissen ist bereits codiert und somit benötigt man weniger Dokumente, um die Fähigkeit zu trainieren, dass entsprechende Klauseln und Regelungs-Textstellen automatisch erkannt werden.

Transfer Learning als Werkzeug für die Demokratisierung von KI

Transfer Learning, das ursprünglich aus der Bildverarbeitung stammt, hat sich auch für Sprachmodelle als zukunftsfähige Methode erwiesen. Diese Technik kann mit verhältnismäßig wenigen Daten und geringeren Rechenressourcen dabei helfen, Modelle mit hoher Qualität zu erzeugen, wozu sonst riesige Datensätze und enorme Rechenleistungen nötig wären. Das klingt vielversprechend und einfach, ist in Wirklichkeit aber ein höchst komplexer Prozess, der des Einsatzes von Experten bedarf. Transfer Learning wird sich weiterentwickeln und ist bereits jetzt ein wichtiger Schritt den Einsatz von KI in der Unternehmenswelt vermehrt zu ermöglichen - also KI zu demokratisieren.

Zurück

Der Autor

Breno Faria

Breno Faria, Head of Development, ist seit 2012 für die IntraFind Software AG tätig. Seit den späten 2000er Jahren beschäftigt er sich intensiv mit den Themen Content Analytics und Information Retrieval. 2015 übernahm er die Rolle des Entwicklungsleiters bei IntraFind.

 

 

Zurück