Sprachtechnologie und Multilingualität

QAIE Team

Wir sind ein Team am MLT-Labor am DFKI, die sich auf Fragenbeantwortung (QA) und Informationsextraktion (IE) – einfach QAIE – spezialisiert hat.

Question Answering (Finden und Extrahieren von Antworten auf natürlichsprachliche Fragen aus Text) und Information Extraction (Extrahieren von Entitäten und Relationen aus Text) sind eng miteinander verwandt: beide teilen eine Reihe von Teilaufgaben wie Named Entity Recognition, Relation Extraction und Entity Linking. Wir erforschen und entwickeln Methoden, die Sprachtechnologie, Maschinelles Lernen und Deep Learning kombinieren, von Kernkomponenten bis hin zu kompletten End-to-End-Lösungen. Wir entwickeln QAIE-Lösungen in vielen Anwendungsbereichen, darunter e-Health, BioNLP, e-Learning und intelligente Assistenz.
 

Demo: Automatische Fragengenerierung mit tiefem Lernen


Auswahl aktueller Projekte

3SC – Semantische Suche für die Wissenschaftskommunikation

Das 2019 gestartete, gemeinsame Projekt von Informationsdienst Wissenschaft (idw) und DFKI setzt die Generalized Semantics Retrieval Engine (GSRE) der Forschungsgruppe QAIE für die Semantische Suche auf dem Distributionsdienst für wissenschaftliche Pressemitteilungen in Deutschland ein.

Projektseite

PRECISE4Q

Laufzeit: 01.05.2018–30.04.2022
Personalisierte Medizin durch prädiktive Modellierung im Schlaganfall für eine bessere Lebensqualität, finanziert von der EU.

Projektseite

Fair Forward

Laufzeit: 01.05.2020–30.06.2021
Beratungsdienste für die Gesellschaft für Internationale Zusammenarbeit (GIZ) zu technischen Aspekten der KI in der internationalen Zusammenarbeit einschließlich Verarbeitung natürlicher Sprache (NLP), Trainingsdaten und Datenzugang für FAIR Forward - Künstliche Intelligenz für alle. GIZ Project No. 19.2010.7-003.00

Projektseite

CORA4NLP

Co(n)textual Reasoning and Adaptation for Natural Language Processing
Laufzeit: 01.10.2020-30.09.2023, durch BMBF gefördert.

Projektseite

XAINES

XAINES (01.09.2020 - 31.08.2024): Explaining AI with Narratives, funded by BMBF (01IW20005).

Projektseite


Ausgewählte neuere Veröffentlichungen

  • Stalin Varanasi, Saadullah Amin and Günter Neumann (2021) AutoEQA: Auto-Encoding Questions for Extractive Question Answering, In Proceedings of Conference on Empirical Methods in Natural Language Processing (EMNLP-2021), Nov. 2021.
  • Saadullah Amin, Günter Neumann (2021) T2NER: Transformers based transfer learning framework for named entity recognition, In Proceedings of EACL, 2021.
  • Saadullah Amin, Stalin Varanasi, Katherine Dunfield, Günter Neumann (2020) LowFER: Low-rank Bilinear Pooling for Link Prediction. In: Proceedings of the 37th International Conference on Machine Learning (ICML-2020), Online, PMLR 119, 2020.
  • Saadullah Amin, Katherine Dunfield, Anna Vechkaeva, Günter Neumann (2020) A Data-driven Approach for Noise Reduction in Distantly Supervised Biomedical Relation Extraction. In: BioNLP 2020 Workshop on Biomedical Natural Language Processing. Workshop on Current Trends in Biomedical Natural Language Processing (BioNLP-2020) located at The 58th Annual Meeting of the Association for Computational Linguistics July 9-9 ACL 2020.
  • Stalin Varanasi, Saadullah Amin, Günter Neumann (2020) CopyBERT: A Unified Approach to Question Generation with Self-Attention. In: NLP for Conversational AI - Proceedings of the 2nd Workshop. NLP for Conversational AI (NLPConvAI-2020) July 9-9 Pages 25-31 ISBN 978-1-952148-08-8 ACL 2020.
  • Alejandro Figueroa, Carlos Gómez-Pantoja, Günter Neumann (2019) Integrating heterogeneous sources for predicting question temporal anchors across Yahoo! Answers. In: Information Fusion 50 Pages 112-125 Elsevier 10/2019.

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence