Projekt

Intellektix

Intelligente Informationsextraktion für das Entdecken und Verknüpfen von Wissen

  • Laufzeit:

Ziel ist, ein Informationsextraktionssystem mit höherer Abdeckung und größerer Genauigkeit zu entwickeln als bisher vorhanden. Der zugehörige Forschungsbereich der automatischen Analyse natürlichsprachiger Texte hat klare Anwendungsgebiete im Wirtschaftsbereich, zum Beispiel bei der Überwachung von branchenspezifischen Nachrichtenpublikationen bezüglich neuer Trends oder bei der Verarbeitung von technischen Dokumentationen und Schriftverkehr und deren Anreicherung mit semantischen Informationen. Der Schwerpunkt der Arbeit wird sein, sowohl Abdeckung als auch Genauigkeit des Systems gegenüber dem aktuellen Technikstand zu verbessern. Dazu wird existierendes Domänenwissen ausgenutzt, zum Beispiel in Form von unternehmensinternen Datenbanken oder im Internet frei verfügbaren Datenquellen. Die Daten dienen zuerst zur Generierung einer großen Zahl von Trainingsbeispielen, wodurch das System eine hohe Abdeckung in der Erkennung von Fakten erhält. Später wird ein Mechanismus entwickelt, der aus Texten extrahierte Kandidatenfakten gegen vorhandene Daten abgleicht und auf Konsistenz und Plausibilität prüft.

Fördergeber

BMBF - Bundesministerium für Bildung und Forschung

BMBF - Bundesministerium für Bildung und Forschung

Projekt teilen auf:

Publikationen zum Projekt

Andrea Moro, Roberto Navigli, Hans Uszkoreit,

In: The Semantic Web - ISWC 2013 - 12th International Semantic Web Conference. International Semantic Web Conference (ISWC-13) 12th October 21-25 Sydney NSW Australia 1 ISBN 978-3-642-41334-6 Springer 2013.

Zur Publikation

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence