Intelligente Informationen

Ein Überblick

Das Schlagwort “Intelligente Informationen” ist derzeit in aller Munde und vereint viele Konzepte der Technischen Dokumentation in sich. In diesem Beitrag wollen wir einen Überblick über Content, Delivery, Klassifikationen und deren Automatisierbarkeit geben.

 

Content Delivery

Unter dem Schlagwort „Content Delivery“ werden mittlerweile alle Anwendungen und Methoden zusammengefasst, die sich mit der situativen, kontext- und zielgruppenabhängigen Bereitstellung von Content beschäftigen. In der Regel sind modulare und klassifizierte Inhalte die Grundlage für diese Funktionalitäten, doch die Integration unstrukturierter Datenquellen rückt durch die Anforderungen aus der Industrie immer weiter in den Fokus, denn viele Firmen möchten mit dem Einsatz eines Content-Delivery-Portals nicht nur ihre modularen Informationen online anbieten, sondern auch Zugriff auf weitere Unternehmensdaten (z.B. aus dem Marketing) geben.

Anwendungen, die Methoden des Content Delivery nutzen, um Informationen zu verteilen, werden als Content-Delivery-Portale (CDP) bezeichnet. Prof. Dr. Wolfgang Ziegler definierte 2013 die entsprechenden Portalanwendungen wie folgt: „CDP bieten die webbasierte Bereitstellung von modularen oder aggregierten Informationen für den Zugriff durch unterschiedliche Zielgruppen mit Hilfe von content-bezogenen Suchmechanismen.“

Vereinfacht gesagt vereinen CDP damit zwei wesentliche Blickrichtungen:

  • Die Integration mehrerer Datenquellen mit unterschiedlichen Datenformaten
  • Den gezielten und einheitlichen Zugriff auf Informationen durch Filter und Suchen

 

Metadaten und Klassifikationen

Metadaten sind für ein effizientes Content Management unerlässlich und machen aus einfachen Inhalte oft erst die gewünschten „intelligenten Informationen“. Neben den beschreibenden Metadaten spielt hier besonders die Klassifikation eine entscheidende Rolle.

Klassifizierter Content lässt sich automatisiert zu Dokumenten für ein bestimmtes Endprodukt zusammenführen oder wird durch ein Content-Delivery-Portal semantisch filterbar und über eine Facettensuche zugänglich gemacht. Aber auch beim Erstellungsprozess kann eine gute Klassifikation dem Redakteur helfen, Module im Redaktionssystem zu finden und dadurch die Wiederverwendung zu steigern. Im Bereich der Technischen Dokumentation ist die Methode PI-Class® hervorzuheben, die für die Klassifikation von Modulen verwendet werden kann.

Bei PI-Class® handelt es sich um eine Methode, die für die Klassifikation von Modulen verwendet werden kann. PI-Klassifikationen werden als Taxonomien definiert und können systemunabhängig eingesetzt werden. Intrinsische Klassifikationen kategorisieren eindeutig die Informationsart des Inhalts (Informationsklasse) und verknüpfen ihn mit den beschriebenen Produktkomponenten (Produktklasse). Extrinsische Klassifikationen ergänzen die Methode um die vorgesehene (auch mehrfache) Verwendung des Contents für Produktmodelle und Dokumenttypen.

Mit Hilfe vergebener Klassifikationen lassen sich Module automatisiert zu Dokumenten zusammenführen oder in einem Content-Delivery-Portal filtern. Beim Erstellen von Inhalten kann eine gute Klassifikation dem Redakteur helfen, Module im CMS zu finden oder voneinander abzugrenzen und dadurch deren Wiederverwendung zu steigern.

 

Anwendungen und Potentiale

Durch den Einsatz von Klassifikationen und Content Delivery ergeben sich zahlreiche Anwendungsszenarien, die von codierten Filterinformationen in RFID-Chips oder QR-Codes über Augmented-Reality-Anwendungen bis hin zu vollständig integrierten Service-Prozessen mit auftragsbezogener Informationsaufbereitung reichen.

 

Automatisierte Aufbereitung

Wer die Vorteile von intelligenten Informationen nutzen möchte, jedoch noch keine entsprechend aufbereiteten Daten zur Hand hat, steht oft vor einer Mammutaufgabe: der nachträglichen Nachklassifizierung des Dokumentationsbestands. Doch mit Hilfe von modernen Machine-Learning-Verfahren können Inhalte auch automatisiert klassifiziert und angereichert werden, und somit Redakteure beim „aufschlauen“ ihrer Informationen behilflich sein.

Als „Machine Learning“ (dt.: maschinelles Lernen) bezeichnet man im Allgemeinen Verfahren, die auf Basis von Erfahrung neues Wissen generieren. Dabei werden Lerndaten verwendet, um Muster und Gesetzmäßigkeiten zu erkennen, welche dann auf Daten angewendet werden können, die dem System nicht bekannt sind (sog. Lerntransfer). Im Allgemeinen sind Machine-Learning-Verfahren eine Unterform der Künstlichen Intelligenz (KI). Da die meisten Inhalte einer Technischen Dokumentation weiterhin textbasiert sind, ist besonders die maschinelle Textklassifizierung interessant. Maßgeschneiderte Verfahren zur automatisierten Vergabe von intrinsischen PI-Klassifikationen für Module aus dem Bereich der Technischen Kommunikation sind Gegenstand aktueller Forschung.