Inhalte von Dokumenten mit Enterprise Metadaten Management schneller verstehen

Hohe Standardisierung für ein sicheres Wiederfinden

Der Tagging Service unterstützt Unternehmen, Metadaten, Keywords, Schlagworte automatisch, einheitlich und standardisiert aus Dokumententexten und -inhalten zu erzeugen um sie in einem zweiten Schritt in Unternehmensprozessen zu nutzen. So erhalten beispielsweise Unternehmen, die bereits eine Enterprise Search Lösung einsetzen qualitativ hochwertige Filter oder können besser Dokumenteninhalte inhaltlich auswerten. Zusätzlich lassen sich einheitlich verschlagwortete Dokumente und redaktionelle Inhalte viel besser wiederfinden.

Der IntraFind Tagging Service besteht aus unterschiedlichen, standardisierten, aber auch konfigurierbaren Tagging-/ Verschlagwortungstypen:

  • Freie statistische Verschlagwortung
  • Kontrollierte statistische und regelbasierte Verschlagwortung
  • Entitäten-Verschlagwortung
  • Textklassifikation
Automatische statt aufwändige manuelle Verschlagwortung

Der Tagging Service identifiziert automatisch semantische Deskriptoren (Schlagworte, Entitäten, Themen) aus Dokumenten und liefert zusätzlich eine inhaltliche Betrachtung des Dokumentes. Die extrahierten semantischen Deskriptoren können dann in Anwendungen oder in die unternehmensweite Suche integriert werden oder sogar weitere Prozessketten anstoßen. Der Tagging Service dient damit der inhaltsbezogenen Informationsextraktion bzw. der Verschlagwortung von unstrukturiertem Text.

In Verbindung mit einer unternehmensweiten Suche oder mit dem Enterprise CMS begründen diese semantischen Deskriptoren eine Wissensbasis des gesamten Dokumentenbestandes und ermöglichen u.a. eine semantische Suche in Unternehmensdaten oder das automatische Taggen von Dokumenten. Der Tagging Service kann als Software-as-a-Service (SaaS) betrieben werden, d.h. er läuft als unabhängiger Service wahlweise auf dem lokalen Server des Kunden oder aber auch auf einem Remote-Server und stellt alle wesentlichen Funktionalitäten durch Web Services zur Verfügung.

Der Output kann z.B. als Word- oder Explorer-Plugin in beliebige Nutzungskontexte beim Kunden eingebunden werden, um zu einem erstellten Text Verschlagwortungsvorschläge zu generieren oder um als Backendkomponente für die Analyse, Verschlagwortung und Anreicherung von Massendaten (z.B. Dateien auf Fileservern) mit Metadaten zu fungieren.

Text-to-Web-to-Tag – ein Webservice

Für die Extraktion der semantischen Deskriptoren (Schlagwörter, Themen, Entitäten) aus einem unstrukturierten Text stehen je nach gewünschtem Rückgabeformat unterschiedliche Web Services zur Verfügung.

Mit HTML und XML werden derzeit zwei Rückgabeformate unterstützt. Die HTML-Rückgabe führt tabellarisch die Ergebnisse der Informationsextraktion auf und ist für Demonstrations- und Testzwecke gedacht. Natürlich kann ein kundenspezifisches Format, inklusive eines anderen HTML-Formats, ohne weiteres definiert und eingebunden werden. Das XML-Format bietet die Möglichkeit, die Extraktionsergebnisse programmatisch weiterzuverwenden, beispielsweise durch Microsoft SharePoint-Plugins oder via Ajax in einer Webseite.

Der Tagging Service ist linear skalierbar und ist deshalb auch für große Datenmengen geeignet.

IntraFind Tagging Service: Metadaten erzeugen – erfolgreich Informationen finden

Metadaten sind per Definition Daten, die Texte bzw. eine Ansammlung von Daten und Dokumenten beschreiben. Sie spiegeln, intelligent aufgebaut, den Inhalt eines Dokumentes, wie Autor, Erstellungsdatum, Ort der Erstellung, Verantwortlicher, aber auch Textbausteine, die besonders relevant sind, wider, so dass ein inhaltlicher Überblick eines einzelnen Dokumentes ohne eine aufwendige Betrachtung gegeben ist. Darüber hinaus können solche Metadaten dokumentenübergreifend kombiniert werden und somit wichtige Einblicke in die Unternehmensdaten gewährleisten.

In Unternehmen ist der Aufbau von Metadaten entweder als Prozessstufe nicht vorhanden oder oft ein manueller Vorgang; Journalisten verschlagworten ihre neuen Artikel, Mitarbeiter Inhalte, die sie in eine SharePoint-Infrastruktur hochladen. Metadaten stellen also auch sicher, dass beispielsweise Mitarbeiter Informationen übergreifend wiederauffindbar bereitstellen. Doch gelingt dies über einen manuellen Prozess?

IntraFind sieht hier ein großes Risiko, denn gerade die manuelle Metadatenerzeugung ist oft  fehlerbehaftet, da menschlich und damit subjektiv. Jeder von uns hat eine unterschiedliche Ansicht über das wesentlich Wichtige eines Textes und verschlagwortet so nach bestem Wissen und Gewissen. Der Kollege aus dem gleichen Team hingegen bewertet die Inhalte ganz anders und verschlagwortet sie deshalb auch anders. Leidtragender ist in diesem Fall der Informationssuchende, der letztendlich nicht das gewünschte Dokument erhält und für das Suchen und Finden von Inhalten wesentlich mehr Zeit und Geduld aufbringen muss.

IntraFind bietet an dieser Stelle mit dem Tagging Service eine umfangreiche Lösung. Vollautomatische Metadatenanreicherung für Microsoft SharePoint-Instanzen, Dateisystemen, DMS oder Archivierungssystem sind nur einige mögliche Integrationsmöglichkeiten.

Weitere Anwendungsbeispiele:

Die mit dem Tagging Service erzeugten Metadaten können für folgende Einsatzzwecke genutzt werden:

  • Anreicherung der Informationen
  • Verbesserung der Suche
  • Klassifizierungsaufgaben
  • Steuerung von Workflows
  • Identifikation Compliance-relevanter Daten oder
  • Identifikation von Dokumenten, die aus Revisionsgründen in ein DMS oder Archiv überführt werden sollen