Sprachtechnologie und Multilingualität

QAIE Team

Wir sind ein Team am MLT-Lab des DFKI, das sich auf die Bereiche Question Answering (QA) und Information Extraction (IE) spezialisiert hat – kurz QAIE.

Question Answering (Finden und Extrahieren von Antworten auf natürlichsprachliche Fragen aus Text) und Information Extraction (Extrahieren von Entitäten und Relationen aus Text) sind eng miteinander verbunden und haben viele gemeinsame Methoden und Teilaufgaben. Wir erforschen und entwickeln Methoden, die Sprachtechnologie, maschinelles Lernen und Deep Learning kombinieren – von Kernkomponenten bis hin zu kompletten End-to-End-Lösungen. Wir entwickeln QAIE-Lösungen für viele Anwendungsbereiche, darunter E-Health, BioNLP, E-Learning und intelligente Assistenz.

Demo: Automatische Fragengenerierung mit tiefem Lernen

Auswahl aktueller Projekte

AI4KOnCO

Das Hauptziel des AI4KOnCO Projekts besteht darin, Eltern und Patienten die notwendige Unterstützung zu bieten, damit sie sich fundiert und selbstbewusst für die empfohlenen Behandlungsoptionen entscheiden können. Das Projekt wird durch HEALTH.AI finanziert.

Projektseite

HEGEMON

Ziel des von der cyperagentur geförderten HEGEMON-Projekts ist es, domänenspezifische Benchmark-Sätze – bestehend aus Aufgaben, Metriken und Testdatensätzen – sowie maßgeschneiderte KI-Modelle für definierte Anwendungsfälle zu entwickeln, um eine gründliche Bewertung vortrainierter generativer KI-Basismodelle, wie beispielsweise Text-Bild-Modelle, zu ermöglichen.

Projektseite

AtLaS

Das von der EU finanzierte AtLaS-Projekt, dessen Schwerpunkt auf der Weiterentwicklung der Sprachtechnologie (HLT) liegt, kombiniert künstliche Intelligenz (KI) und natürliche Sprachverarbeitung (NLP), um Daten von geringer Qualität und mehrsprachige Daten zu verarbeiten.

Projektseite

PERKS

Eliciting and Exploiting Procedural Knowledge in Industry 5.0.

Das von der EU finanzierte PERKS-Projekt unterstützt die ganzheitliche Verwaltung von prozeduralem Wissen (Procedural Knowledge, PK) in der Industrie über dessen gesamten Lebenszyklus hinweg, von der Erfassung über die Verwaltung bis hin zum Zugriff und zur Nutzung.

Projektseite

Meere Online

Meere Online ist ein Projekt der Deutschen Meeresforschung im Kernbereich des Transfers. Auf dem digitalen Informationsportal Meere Online werden wissenschaftliche Fakten zu relevanten Meeresthemen zusammengestellt. Als Highlight wird eine KI-unterstützte Suche den Nutzern den Zugang zu den Themen erleichtern.

Projektseite

Ausgewählte neuere Veröffentlichungen

Julian Schlenker, Jenny Kunz, Tatiana Anikina, Günter Neumann, and Simon Ostermann (2025) Only for the Unseen Languages, Say the Llamas: On the Efficacy of Language Adapters for Cross-lingual Transfer in English-centric LLMs, Proceedings of the 63st Annual Meeting of the Association for Computational Linguistics (Student Research Workshop). ACL Student Research Workshop (ACL-IJCNLP-SRW-2025), located at ACL (ACL-IJCNLP-SRW-2025), Italy, 2025.
Muhammad Umer Tariq Butt; Stalin Varanasi, and Günter Neumann (2025) Enabling Low-Resource Language Retrieval: Establishing Baselines for Urdu MS MARCO, Proceedings of 47th European Conference on Information Retrieval (ECIR 2025), Italy, 2025.
Noon Pokaratsiri, Saadullah Amin, and Günter Neumann (2024) Towards Understanding Attention-based Reasoning through Graph Structures in Medical Codes Classification, Proceedings of TextGraphs-17: Graph-based Methods for Natural Language Processing at ACL-2024 (TextGraphs 2024), Bangkok, Thailand, 2024.
Stalin Varanasi, Muhammad Umer Butt, and Günter Neumann (2023) AutoQIR: Auto-Encoding Questions with Retrieval Augmented Decoding for Unsupervised Passage Retrieval and Zero-shot Question Generation, Proceedings of Recent Advances in Natural Language Processing (RANLP-2023), Bulgaria, 2023.
Saadullah Amin, Pasquale Minervini, David Chang, Pontus Stenetorp, and Günter Neumann (2022) MedDistant19: Towards an Accurate Benchmark for Broad-Coverage Biomedical Relation Extraction, Proceedings of The 29th International Conference on Computational Linguistics (Coling-2022), October 12-17, 2022, Gyeongju, Republic of Korea
Ioannis Dikeoulias, Saadullah Amin, and Günter Neumann (2022) Temporal Knowledge Graph Reasoning with Low-rank and Model-agnostic Representations , Proceedings of the 7th Workshop on Representation Learning for NLP. ACL-2022, RepL4NLP May 2022, Pages 111-120 ACL 5/2022 (RepL4NLP-2022), May, 2022.
Saadullah Amin, Noon Pokaratsiri, Morgan Wixted, Alejandro García-Rudolph, Catalina Martínez-Costa, and Günter Neumann (2022) Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of Code-Mixed Clinical Texts , Proceedings of the 21st Workshop on Biomedical Language Processing. ACL-2022 BioNLP, May 22-27, Pages 200-211 ACL 5/2022. (BioNLP-2022), May, 2022

Links

QAIE Mitglieder

Teamleitung:

Prof. Dr. Günter Neumann
neumann@dfki.de

Teammitglieder:

Yasser Hamidullah
Nicholas Jennings
Aravind Krishnan
Cennet Oguz
Jörg Steffen
Noon Pokaratsiri

Studierende im Masterstudiengang und wissenschaftliche Mitarbeiter:

Betül Bahceci
Katja Konermann
Eduardo Venegas