Sie sind hier

Web Search and Data Mining

Das World Wide Web ist heutzutage zweierlei: Ein riesiges Netzwerk verknüpfter Informationen sowie ein virtueller Raum, in dem Menschen miteinander interagieren, sich begegnen und sich austauschen. In der Arbeitsgruppe Web Search and Data Mining untersuchen wir mit einem gemeinsamen Werkzeugkasten an Methoden und Lösungsansätzen beide dieser Aspekte. Ein Schwerpunkt liegt hierbei auf der Bestimmung der behandelten Themen. Wir verwenden probabilistische Modelle, um Themen zu beschreiben und um anzugeben, inwieweit ein Thema in einem Dokument angesprochen wird. Hierfür analysieren wir nicht nur die Wörter, die in den Dokumenten auftauchen, sondern auch den Dokumentkontext, z. B. den Ort oder den sozialen Kontext. Diese Sicht kann genutzt werden, um aus der riesigen Flut an Online-Artikeln einen repräsentativen Überblick über ein Thema zu geben. In sozialen Netzwerken findet man Inhalte, die Benutzer eingestellt haben, aber auch soziale Interaktionen zwischen Benutzern. Aus den darin enthaltenen Strukturen lässt sich beispielsweise voraussagen, ob zwei Nutzer Kontakt aufnehmen sollten, wann ein Nutzer ein soziales Netzwerk vermutlich verlässt und worin der Vorteil läge, dem 'like' Button in einer Plattform für soziale Netze einen 'dislike' Button hinzuzufügen.

Prof. Dr. Steffen Staab

B 108
+49 261 287-2761
staab@uni-koblenz.de

Kurzlebenslauf

Ich habe Informatik und Computerlinguistik an der Universität Erlangen-Nürnberg und an der University of Pennsylvania studiert. Ich habe in der früheren Computerlinguistik-Forschungsgruppe an der Universität Freiburg gearbeitet und meinen Dr. rer. nat. in Informatik an der Technischen Fakultät (damals: Fakultät für angewandte Wissenschaften) 1998 erworben. Danach war ich an der Universität Stuttgart, am Institut IAT, und bei Fraunhofer IAO tätig, bevor ich zur Universität Karlsruhe (jetzt: KIT) wechselte, wo ich als Projektleiter, wissenschaftlicher Assistent und Oberassistent arbeitete. 2004 wurde ich zum Professor für Datenbanken und Informationssystem an der Universität Koblenz-Landau ernannt, wo ich 2009 das Institute for Web Science and Technologies (WeST) gründete. Seit März 2015 halte ich außerdem einen Chair for Web and Computer Science an der University of Southampton.

Forschungsinteressen

Auf dem Rechner beschreiben Daten die Welt. Die Welt ist spannend, aber Daten sind ganz schön langweilig, wenn man nicht weiß, was sie bedeuten. Ich interessiere mich dafür, wie Daten spannend werden, indem man ihre Bedeutung versteht.

Wie aber kommt Bedeutung zustande? 

  • Man kann die Bedeutung von Daten und Informationen modellieren. Begriffliche Modelle und Ontologien sind die Grundlage für Wissensnetze, die dem Rechner erlauben bedeutungsvoll mit Daten umzugehen.
  • Text und Data Mining sowie Informationsextraktion finden bedeutungstragende Muster in Daten (z.B. mittels Ontology Learning oder Text Clustering) und auch Zusammenhänge zwischen Daten und ihrer Verwendung im Kontext (z.B. mit Smartphones). So werden Wissensnetze in Daten gefunden.
  • Menschen kommunizieren Informationen. Um zu verstehen, was Daten und Informationen bedeuten, muss man soziale Interaktionen verstehen. Im Kontext von sozialen Netzwerken werden Wissensnetze bedeutungsvoll für Menschen.
  • Bedeutung ist nichts absolut Gesetztes. Letzten Endes muss die Bedeutung von Daten und Informationen wieder an den Menschen kommuniziert werden, der diese Daten und Informationen nutzt. Interaktion zwischen Menschen und Rechnern muss der Bedeutung von Daten und Informationen gerecht werden.

Das größte Konstrukt, das die Menschheit erfunden hat, um Daten mit Bedeutung zu kommunizieren ist das World Wide Web. Web Science untersucht, wie Netzwerke von Personen und Wissen im Web entstehen, wie Menschen damit umgehen und welche Folgen das für uns alle hat. Das Web ist eine Bedeutungsmaschine, die ich durch meine Forschung verstehen möchte.

Wo ich sonst zu finden bin

Wenn ich nicht gerade im Büro oder auf Dienstreise bin, bin ich am Liebsten zum Laufen im Stadtwald, im Changa oder beim AHS. Watch out!