Knowledge Discovery Group

Über Googles Tellerrand hinaus: Inhaltliche Erfassung und Vernetzung von Infografiken mit Linked Open Data

Personen

Prof. Dr. Ansgar Scherp

Falk Böschen, MSc.

Kurzfassung

In diesem Projekt wird die inhaltiche Erfassung von Infografiken und Vernetzung und Anreicherung mit Linked Open Data behandelt. Es werden verschieden Fragestellungen in kleinen Gruppen bearbeitet und praktische Implementationen vorgenommen und bewertet.

Lernziele

Die Studenten lernen eigenständiges Arbeiten im Team, erlangen praktische Erfahrungen im Umgang mit dem Web der Daten und/oder der Analyse von Infografiken.

Lehrinhalte

Aktuelle Suchmaschinen wie Google und Bing indexieren die Bilder im Web nur anhand des umliegenden Textes. Infografiken sind eine besonders interessante Gruppe von Bildern im Web. Sie sind ein beliebtes und verbreitetes Mitte, um Daten leicht verständlich darzustellen. Sie bieten sich als konkretes Beispiel an, um die inhaltliche Erfassung und Suche in Bildern voranzubringen, da sie aus Grafikelementen und Text bestehen. In diesem Kontext bieten sich folgende Projektthemen an:

  • Robuste Textlokalisation und -erkennung in Infografiken: Es ist notwendig, die Textvorkommen in Infografikbildern zu lokalisieren und den Text zu erkennen, damit der volle Umfang der Infografik erfasst werden kann.
  • Korrektur fehlerhafter Texterkennung (OCR) und semantische Anreicherung durch das Web der Daten: Auch wenn es bereits verschiedene OCR Implementierungen gibt, so besteht doch immer noch Verbesserungspotential. Ein Ansatz ist die Korrektur und Anreicherung der OCR Resultate unter Verwendung des Webs der Daten, um eine akkuratere und kompaktere Inhaltsrepräsentation zu erhalten.
  • Intelligente Infografik-Segmentierung in Grafikelemente und deren Klassifizierung: Auf der Verarbeitungsschiene des Grafikanteils der Infografiken besteht die Möglichkeit sich mit der Segmentierung in einzelne Grafikelemente und der Erkennung derselben auseinander zusetzen.
  • Erkennung relevanter Komponenten in Infografiken unter Verwendung von Eye-Trackern: Ein alternativer Ansatz um den Inhalt von Infografiken zu erfassen, ist die Nutzung von Eye-Trackern, um die wichtigen Komponenten zu extrahieren.

Alle Themen beinhalten eine kontinuierliche Evaluation der Ergebnisse, wobei die Studierenden angeregt werden sich mit eigenen Ideen zur Verbesserung der Resultate einzubringen.

OLAT

Die Projektgruppe ist im OLAT an folgender Stelle zu finden: https://lms.uni-kiel.de/url/RepositoryEntry/274497621/CourseNode/89901125223276
Interessenten wenden sich bitte per Email an Falk Böschen .

Voraussetzungen

Erfahrung mit objekt-orientierter Programmierung, Kenntnisse über Bildverarbeitung oder Semantic Web und Linked Open Data sind von Vorteil.

 

News

  • Homepage kicked off!