Sie sind hier

Koldfish

Ein Entwickler wird beim Design einer Anwendung für den Zugriff und die Verarbeitung der Linked Open Data (LOD) Cloud auf einige Probleme stoßen: die Anwendung könnte abhängig sein von Schemainformation, die für die relevanten Datenquellen nicht explizit verfügbar ist; es könnte unerwartete Probleme mit der Datenqualität geben; die Anwendung könnte auf Provenance-Information angewiesen sein; Datenquellen könnten zumindest zeitweise unerreichbar für Zugriffe sein.

Stellen wir uns Alice vor. Sie möchte eine Anwendung entwickeln, die es Benutzern erlaubt nach interessanten Orten zu suchen, basierend auf thematischen Keywords. Welchen Problemen müsste sie sich dabei stellen? Zunächst müsste Alice relevante Datenquellen aus der LOD-Cloud sorgfältig auswählen. Danach müsste sie sich eine Möglichkeit überlegen Keywords auf Abfragen abzubilden und solche Abfragen auch vorbereiten. Nach dem Erstellen einer passenden Benutzeroberfläche, kann Sie schließlich ihre Queries mit GUI und Programmlogik passend verknüpfen. Die Anwendung kann im Ergebnis großartig aussehen, aber der Weg dorthin ist für Alice nicht leicht.

Angesichts der Beschaffenheit der Linked-Data-Cloud stellt sich die Frage, was bei den im Laufe der Zeit zu erwartenden Veränderungen zu tun ist. Wie kann Alice dabei geholfen werden, ihre Applikation zu warten?

Das Ziel von Koldfish ist es, Entwicklern wie Alice das Leben zu erleichtern und es ihnen zu ermöglichen von wiederkehrenden LOD-Management-Aufgaben zu abstrahieren.

Key-Features von Koldfish sind:

  • serviceorierentierte Middleware für Linked-Data-Anwendungen
  • RESTful APIs für den Zugriff auf Servicefunktionalitäten
  • automatische Schemaextraktion für die Unterstützung von Queries
  • Unterstützung zur Design-Zeit durch schemabasierte Exploration des Datenraums
  • eingebautes Management der Datenqualität

Koldfisch bietet eine Reihe von Services, die jeweils durch RESTful APIs von außen verfügbar sind. Ein Crawler stellt zunächst jedem seiner Subscriber Daten der LOD-Cloud zur Verfügung. Zu diesen Subscribern zählt der Data Service, der die eingehenden Daten für den späteren Zugriff lokal speichert. Für die Dereferenzierung von IRIs beauftragt der Data Service seinerseits das Data Access Module, das entsprechende Request entgegen nimmt und direkt an die  zugehörigen LOD-Datenquellen richtet. Ein Provenance Service ermöglicht es, Provenance-Information abzufragen, die das System bereits zu bestimmten Ressourcen gesammelt hat. Für den schemabasierten Datenzugriff extrahiert und verwaltet der Schema Service automatisch Typhierarchien und -Beziehungen. Der Service erstellt dazu auch einen Index, der auf relevante Datenquellen und Statements verweist. Schließlich besitzt das System einen Quality Service. Dieser bewertet kontinuierlich die Qualität der vom Data Service gespeicherten Daten nach verschiedenen Gesichtspunkten und unterstützt das Management der Datenqualität.

project-coldfish.png

Das Koldfish-Projekt entwickelte sich durch Umbenennung aus SEPAL, verfolgt aber dieselben Ideen, die auch in der SEPAL-Projektbeschreibung dargestellt werden.

Laufzeit:

  • aktuell

Geldgeber:

  • TBD

Partner:

  • TBD
Beteiligte: 

Prof. Dr. Steffen Staab

staab@uni-koblenz.de

Publications:
N/A

Dr. Matthias Thimm

thimm@uni-koblenz.de

Publications:
N/A

Dominik Brosius

dbrosius@uni-koblenz.de

Publications:
N/A

Daniel Janke

danijank@uni-koblenz.de

Publications:
N/A

Timo Homburg

thomburg@uni-koblenz.de

Publications:
N/A

Leon Kastler

lkastler@uni-koblenz.de

Publications:
N/A

Martin Leinberger

mleinberger@uni-koblenz.de

Publications:
N/A

Cristina Sarasua

csarasua@uni-koblenz.de

Publications:
N/A