Institute for Web Science and Technologies · Universität Koblenz - Landau

Machine Learning with Knowledge Graphs

[go to overview]

Most successful applications of statistical machine learning focus on response learning or signal-reaction learning where an output is produced as a direct response to an input. An important feature is a quick response time, the basis for, e.g., real-time ad-placement on the Web, real-time address reading in postal automation, or a fast reaction to threats for a biological being. One might argue that knowledge about specific world entities and their relationships is necessary if the complexity of an agent's world increases, for example if an agent needs to function in a complex social community. As one is quite aware in the Semantic Web community, a natural representation of knowledge about entities and their relationships is a directed labeled graph where nodes represent entities and where a labeled link stands for a true fact. A number of successful graph-based knowledge representations, such as DBpedia, YAGO, Freebase and the Google Knowledge Graph, have recently been developed and are the basis of applications ranging from the support of search and information extraction to the realization of question answering systems. Statistical machine learning can play an important role in knowledge graphs as well. By exploiting statistical relational patterns one can predict the likelihood of new facts, find entity clusters and determine if two entities refer to the same real world object.
Furthermore, one can analyze new entities and map them to existing entities (recognition) and predict likely relations for the new entity. A major new application is the support of automated knowledge base construction, e.g., as demonstrated in Google’s Knowledge Vault. These learning tasks can elegantly be approached by first transforming the knowledge graph into a 3-way tensor where two of the modes represent the entities in the domain and the third mode represents the relation type. Generalization is achieved by tensor factorization using, e.g., the RESCAL approach. A particular feature of RESCAL is that it exhibits collective learning where information can propagate in the knowledge graph to support a learning task. In the presentation  the RESCAL approach will be introduced and applications of RESCAL to different learning and decision tasks will be presented.

 

CV von Volker Tresp:

Volker Tresp studierte Physik an der Universität  Göttingen, setzte sein Studium im Anschluss an der Yale Universitä fort, und erwarb dort den  M.Sc., M.Phil. und 1989 den Ph.D. . Seit 1990 ist er bei der Siemens AG als leitender Wissenschaftler für verschiedene Forschungsteams im Bereich Maschinelles Lernen verantwortlich, mit erfolgreichen Anwendungen in der Stahlverarbeitung, der Medizinischen Entscheidungsunterstützung und der Chip Fertigung. Aus seinen Arbeiten entstanden über 50 Patente und er ist einer der Siemens Erfinder des Jahres. Er ist Autor von weit Über 100 Publikationen. Sein Schwerpunkt in den letzten Jahren ist Maschinelles Lernen in vernetzten Systemen mit Anwendungen in der Modellierung von Wissensgraphen, Klinischen Entscheidungsprozessen und Sensornetzen. Er ist einer der Siemens Key-Experts zu Big Data und ist Projektleiter im Siemens Campus Automatisierung und Digitalisierung. Er leitet eines der ersten BMWi Projekte zu Big Data mit dem Ziel der Realisierung von Precision Medicine basierend auf der Analyse großer klinischen Datenmengen. Seit 2011 lehrt Volker Tresp als Professor für Informatik in der Lehr- und Forschungseinheit für Datenbanksysteme an der LMU.


21.01.15

Contact for inquiries: west@uni-koblenz.de