Projekt | TextQ

Laufzeit: 01.08.2020 - 31.07.2023

Analyse und automatische Abschätzung der Qualität maschinell generierter Texte

Forschungsthemen

Sprache & Textverstehen

Das Forschungsvorhaben beschäftigt sich mit der wahrgenommenen Qualität von maschinell generierten Texten. Der Fokus liegt hierbei auf den beiden Texttypen maschinelle Übersetzung und maschinelle Zusammenfassung. Ziel des Projektes ist es, perzeptive Qualitätsdimensionen zu identifizieren, subjektive Methoden zu ihrer Quantifizierung bereitzustellen, automatisiert extrahierbare Parameter zu bestimmen, die mit der Textqualität korrelieren und daraus Vorhersagemodelle zu entwickeln, welche eine Schätzung der Gesamtqualität eines maschinell generierten Textes liefern können.Die Entwicklung der Vorhersagemodelle erfolgt mittels verschiedener Korpora für die deutsche und englische Sprache. Auf Basis dieser Korpora werden für die Qualitätsschätzung relevante Dimensionen bestimmt und in Probandentests (durch Crowdsourcing und im Labor) überprüft. Für jede identifizierte Qualitätsdimension werden relevante Textparameter automatisiert aus den Texten extrahiert, und diese mit den subjektiven Dimensionsbewertungen korreliert. Auf Basis der Parameter werden Vorhersagemodelle für beide Texttypen erstellt, sowohl für einzelne Qualitätsdimensionen wie auch für die Gesamtqualität, und bezüglich der Unterschiede zwischen den Texttypen analysiert. Abschließend werden diese Vorhersagemodelle in einer unabhängigen Testreihe auf ihre Generalisierbarkeit getestet.

Keyfacts

Beteiligte Forschungsbereiche

Speech and Language Technology

Leitung

Vivien Macketanz, M.A.

Publikationen

Alle Publikationen

Quality of experience of German machine translation and automatic text summarization
Shushen Manakhimova; Vivien Macketanz; Sebastian Möller
In: Sven Grawunder (Hrsg.). Elektronische Sprachsignalverarbeitung 2025 - Tagungsband der 36. Konferenz. Elektronische Sprachsignalverarbeitung (ESSV-2025), March 5-7, Halle/Saale, Germany, Pages 212-222, Studientexte zur Sprachkommunikation, Vol. 110, ISBN 978-3-95908-803-9, TUDpress, Dresden, 2025.
Error Span Annotation: A Balanced Approach for Human Evaluation of Machine Translation
Tom Kocmi; Vilém Zouhar; Eleftherios Avramidis; Roman Grundkiewicz; Marzena Karpinska; Maja Popovic; Mrinmaya Sachan; Mariya Shmatova
In: Proceedings of the Ninth Conference on Machine Translation. Conference on Machine Translation (WMT-2024), located at EMNLP 2024, November 15-16, Miami, Florida, USA, Association for Computational Linguistics, 11/2024.
Exploring the Potential of Large Language Models in Adaptive Machine Translation for Generic Text and Subtitles
Abdelhadi Soudi; Mohamed Hannani; Kristof Van Laerhoven; Eleftherios Avramidis
In: Pierre Zweigenbaum; Reinhard Rapp; Serge Sharoff (Hrsg.). Proceedings of the 17th Workshop on Building and Using Comparable Corpora. Workshop on Building and Using Comparable Corpora (BUCC-2024), located at LREC 2024, May 20, Torino, Italy, Pages 51-58, ELRA and ICCL, 5/2024.

Projekt | TextQ

Analyse und automatische Abschätzung der Qualität maschinell generierter Texte

Forschungsthemen

Keyfacts

Beteiligte Forschungsbereiche

Leitung

Publikationen

Quality of experience of German machine translation and automatic text summarization

Error Span Annotation: A Balanced Approach for Human Evaluation of Machine Translation

Exploring the Potential of Large Language Models in Adaptive Machine Translation for Generic Text and Subtitles

Fördergeber

DFG - Deutsche Forschungsgemeinschaft

MO 1038/31-1, 436813723

Forschungsthemen

Projekt teilen auf:

Keyfacts

Beteiligte Forschungsbereiche

Leitung

Quality of experience of German machine translation and automatic text summarization

Error Span Annotation: A Balanced Approach for Human Evaluation of Machine Translation

Exploring the Potential of Large Language Models in Adaptive Machine Translation for Generic Text and Subtitles

Fördergeber

DFG - Deutsche Forschungsgemeinschaft

MO 1038/31-1, 436813723