Sie sind hier

WeST erforscht dritte Generation von Text Mining Algorithmen

Die erste Generation von Text Mining Algorithmen bestand im Wesentlichen aus einer Reihe von Heuristiken. Die zweite Generation basiert auf inzwischen erprobten und skalierbaren wahrscheinlichkeitsbasierten Verfahren, die genau ausdrücken, was die Algorithmen finden. Forscher am Institut WeST widmen sich inzwischen der dritten Generation. Die neuen Algorithmen verwenden komplexe Modelle, um nicht nur Text zu analysieren, sondern einen Zusammenhang zu finden zwischen Text und weiteren strukturierten Informationen, zum Beispiel:

  • Informationen über die geographische Abstammung des einzelnen Textes,
  • Beziehungen zu den Autoren und der Erstellungszeit,
  • soziale Netzwerke von Leuten, die Texte verfasst haben, oder
  • explizite Informationen darüber, was bestimmte Worte bedeuten, etwas positive oder negative Meinungen.

Neuere Publikationen und Vorträge stellen den Zusammenhang zwischen den
einzelnen Verfahren her, die in den letzten zwei Jahren im Institut WeST entwickelt wurden. Ein erste Übersicht erhält der Interessierte aus verschiedenen Foliensätzen, z.B. den Folien von einem Industrievortrag (http://de.slideshare.net/steffenstaab/von-information-zu-wissen-einsichten-gewinnen-text-mining) oder von der eDigital Konferenz in Oxford
(http://de.slideshare.net/steffenstaab/topic-discovery-in-unstructured-data-the-next-generation).

03.10.2012