Information Retrieval
[go to overview]Summer Term 2009
Prof. Dr. Dr. Sergej Sizov Dr. Klaas Dellschaft
Organisation - Inhalte - Aufgaben - Folien
Termine für mündliche Prüfungen:
- 10.07.09 10 - 13 Uhr
- 13.07.09 10 - 13 Uhr
- nach Vereinbarung Ende September
Bitte per Email bei den Verantwortlichen mit Terminwunsch melden.
Übungsblatt 8 ist das letzte theoretische Übungsblatt!!!
Ergebnisse der mündlichen Prüfungen: hier klicken!
Die Evaluation der IR-Vorlesung läuft! Die üblichen TAN-Nummern des Evali-systems erhalten Sie in der Vorlesung sowie in den Übungen.
Vorlesung | Mo 14-16 | E 523 | Prof. Dr. Dr. Sergej Sizov |
Übungen | Mo 9-10 | B 017 |
- Die Veranstaltung hat den Umfang von 2 + 2 SWS.
- Anmeldung über Klips: Vorlesung, Übung
- Zielgruppe: Bachelor Informatik, Computervisualistik.
- Empfohlene Voraussetzungen für die Teilnahme: erfolgreich abgeschlossene Vorlesung "Datenbanksysteme", Hintergrundwissen in linearer Algebra, Wahrscheinlichkeitsrechnung und Stochastik. Die Vorlesung vermittelt erforderliches Basiswissen zu den genannten Bereichen, erfordert jedoch ggf. tiefere eigenständige Einarbeitung mit Hilfe zusätzlicher Quellen.
- Bedingungen für den Scheinerwerb:
- Die erfolgreiche Bearbeitung der praktischen Übungsaufgaben
- Leistungskontrolle: mündliche Prüfung am Ende des Semesters
Inhalte
Information Retrieval ist ein Sammelbegriff für Methoden und Technologien der Suche, Analyse, und automatischer Organisation von Datensammlungen verschiedener Art: Textdokumente, Multimedia Inhalte, strukturierte oder semi-strukturierte Wissensrepräsentation. Die Vorlesung vermittelt tieferen Einblick in mathematische Modelle und Algorithmen der Suchmaschinen für World Wide Web, Intranets und digitale Bibliotheken. Als Grundlage dienen dabei mathematische Werkzeuge der linearen Algebra und Regressionsanalyse (z.B. Singular Value Decomposition), Wahrscheinlichkeitsrechnung und Statistik (z.B. Markovketten und Bayesische Netze).
Ziele der Vorlesung: tieferes Verständnis für Funktionsweise von modernen Suchmaschinen, deren Grenzen und aktuelle Entwicklungstrends. Fähigkeiten zur Konzeption und Verbesserung von Information Retrieval Systemen.
Themen der Vorlesung
- Motivation, Überblick, Systemarchitekturen
- Technische Grundlagen: lineare Algebra, Wahrscheinlichkeitsrechnung und Statistik
- Klassische IR Systeme: Vektorraum-basierte Ansätze, Linkanalyse und Autoritätsranking, Retrieval für Multimediadaten. Architektur und Funktionsweise von modernen Suchmaschinen, Organisation und Ranking von Suchergebnissen
- Erweiterte IR Systeme: erweiterte Linkanalyse, top-k Suchalgorithmen, Ontologien und Konzept-basierte Informationssuche, Fokussiertes Crawling, Deep Web Informationsquellen, Suche und Ranking für semistrukturierte Daten und XML
- Automatische Wissensaquisition aus Web-Daten und heterogenen Dokumentsammlungen
- Moderne Peer-to-Peer Suchsysteme und Algorithmen
Folien zur Vorlesung
Foliensatz (PDF) | Vorlesung(en) |
Introduction | 20.04. |
Text Search in a Nutshell | 27.04. |
Technical Basics | 04.-11.05. |
Text Retrieval | 18.05.-08.06 |
Classification and Clustering | 15.06. |
Social Network Analysis | 22+29.06 |
Web Advertising and Spam | 06.07. |
Distributed IR | 13.07. |
Information Retrieval at ISWeb | 20.07. |
Übungsaufgaben
Die Übungen umfassen im wöchentlichen Wechsel theoretische und praktische Aufgaben. Die Bearbeitung der Übungsaufgaben erfolgt in Gruppen von 2-3 Personen. Weitere Details zur Durchführung und Abgabe der praktischen Übungen befinden sich auf dem Aufgabenblatt für die erste praktische Übung.
Übungsblatt | Ausgabe | Abgabe | Besprechung |
27.04.09 | 04.05.09 | 11.05.09 | |
04.05.09 | 11.05.09 | 18.05.09 | |
11.05.09 | 18.05.09 | 25.05.09 | |
18.05.09 | 25.05.09 | 08.06.09 | |
25.05.09 | 08.06.09 | 15.06.09 | |
08.06.09 | 15.06.09 | 22.06.09 | |
22.06.09 | 29.06.09 | 06.07.09 | |
29.06.09 | 06.07.09 | 13.07.09 |
Übungsblatt | Ausgabe | Praxisabnahme |
1. Praktische Übung | 04.05.09 |
25.05.09-29.05.09 |
2. Praktische Übung | 08.06.09 | 29.06.09 um 8:30 in B017 |
Material
- IR Resources online
- Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.