Institute for Web Science and Technologies · Universität Koblenz - Landau
Institute WeST

Text Mining und Social Media Papiere auf 4 Spitzenkonferenzen

[zur Übersicht]

Vom 24. bis 28. Februar fand in New York (USA) die Konferenz für Web Search and Data Mining (WSDM) statt. Die WSDM ist eine angesehene und hochkompetitive Konferenz zur Suche und zum Data-Mining im Web. Hier präsentierte Christoph Carl Kling vom Institut WeST das Papier „Detecting Non-Gaussian Geographical Topics in Tagged Photo Collections“. Der neue Ansatz ermöglicht eine bessere Themenerkennung, indem Nachbarschaftsbeziehungen zwischen geographischen Regionen in großen Dokumentenkorpora berücksichtigt werden. Bisherige Verfahren unterstützen die Erkennung von Themen mit komplexen geographischen Strukturen nicht.

Weiterhin ist die International AAAI Conference on Weblogs and Social Media (ICWSM) eine der führenden Konferenzen für Forschung an der Schnittstelle von Sozialwissenschaften und Informatik. Sie findet vom 2. bis 4. Juni in Ann Arbor (USA) statt. WeST ist dort auch dieses Jahr vertreten und präsentiert eine in Kooperation mit dem GESIS - Leibniz Institut für Sozialwissenschaften entstandene Arbeit. Im Forschungspapier „When politicians talk“ werden die Ergebnisse einer empirischen Untersuchung vorgestellt, die die Konversationspraxis deutscher Politiker vor, während und nach den deutschen Bundestagswahlen 2013 auf Twitter analysiert. Neben den konkreten empirischen Befunden stellen die Autoren ihren generellen Ansatz zur Messung von Konversationspraxen vor.

Drittens findet im April dieses Jahres in Seoul (Korea) die 23. Ausgabe der prestigträchtigen International World Wide Web-Konferenz (WWW) statt. Die WWW widmet sich künftigen Entwicklungen des Webs. Claudia Wagner und Markus Strohmaier vom Institut WeST werden dort die Ergebnisse einer Kooperation mit Philipp Singer von der Technischen Universität Graz und Bernardo Huberman von HP Labs vorstellen. Das Forschungspapier mit dem Titel „Semantic Stability in Social Tagging Streams“ diskutiert bestehende Methoden, mit denen sich die semantische Stabilität in Social-Tagging-Systemen messen lassen. Ausgehend von den dort identifizierten Schwächen schlagen die Autoren eine neue und geeignetere Methode zum Vergleich des semantischen Stabilisierungsgrades unterschiedlicher Systeme vor.

Und schließlich findet die diesjährige Kernkonferenz der Association for Computational Linguistics (ACL 2014) vom 23.-25.6. in Baltimore (USA) statt. Im Themenbereich natürliche Sprachverarbeitung präsentieren Rene Pickhardt, Thomas Gottron, Martin Körner, Paul Wagner, Till Speicher und Steffen Staab ihr Papier „A Generalized Language Model as the Combination of Skipped n-grams and Modified Kneser Ney Smoothing“. Die Arbeit beschreibt ein generalisiertes Language Model, das zusammen mit dem modifizierten Kneser-Ney-Smoothing eine ca. 10%ige Leistungssteigerung gegenüber den seit 15 Jahren am besten funktionierenden Language Modellen bietet. Language Models finden aufgrund des weitverbreiteten Noisy Channel Models in fast allen Gebieten der natürlichen Sprachverarbeitung vielfältige Anwendungen. Der Quellcode ist zu finden unter https://github.com/renepickhardt/generalized-language-modeling-toolkit; dort wird auch das Paper verlinkt werden. Die Grundlagen dieser Arbeit wurden von Paul Wagner und Till Speicher in ihrer Jugend-Forscht-Arbeit gelegt, die im Anschluss an einen Kurs an der Deutschen Schülerakademie von Rene Pickhardt betreut wurde


21.03.14

Kontakt für Rückfragen: west@uni-koblenz.de