COLLATE

Wege von der Forschung in den Markt verkürzen

 
 
 

Wenn der Arzt dem Computer einen Befund diktiert und wenn der PC einem blinden Benutzer seine Email vorliest, dann sind Softwareprogramme am Werke, in denen umfangreiches Wissen über die Natur und Struktur der menschlichen Sprache steckt. Sprachtechnologie heißt die ingenieurwissenschaftliche Disziplin, die solche Programme entwickelt. Sprachtechnologie kommt auch zum Einsatz, wenn eine Internet-Suchmaschine dem Benutzer anbietet, eine portugiesische Seite ins Englische zu übersetzen, oder wenn Microsoft Word einen Artikel auf Fehler korrigiert.

In dem vom Bundesministerium für Bildung und Forschung geförderten Projekt COLLATE wird in Saarbrücken ein Kompetenzzentrum für Sprachtechnologie aufgebaut, das den Stand der deutschen Forschung und Entwicklung im internationalen Wettbewerb stärken soll und den Weg vom Forschungslabor in die industrielle Entwicklung verkürzt. Das Projekt wird gemeinsam vom DFKI und der Universität des Saarlandes durchgeführt. Die Förderung in Höhe von ca. 9 Millionen DM kommt aus den Versteigerungserlösen der UMTS-Lizenzen.

In der Wirtschaft gilt die Sprachtechnologie als eine der Schlüsseltechnologien der Informations- und Wissensgesellschaft. Von ihren Erfolgen hängen die Akzeptanz der Computertechnologie im Arbeitsalltag sowie die Beherrschung der ständig zunehmenden Mengen an elektronisch verfügbarer Information ab. Zugleich ist die Sprachtechnologie einer der forschungsintensivsten Bereiche in der Informationstechnologie. Die menschliche Sprache als evolutionär gewachsenes Medium zur Repräsentation und Weitergabe der kompliziertesten Ideen und Wissensinhalte ist von einer Komplexität, welche die Wissenschaft bisher erst sehr unvollständig erfassen kann.

Mit Saarbrücken wurde ein Standort gewählt, der sich im nationalen Maßstab eine Führungsrolle in der Sprachtechnologie erworben hat und auch international zu den wichtigsten Zentren der Computerlinguistik und Sprachtechnologie gehört. In mehreren Sonderforschungsbereichen und Graduiertenkollegs haben Saarbrücker Wissenschaftler entscheidende Beiträge zur theoretischen Fundierung der relevanten Technologien erbracht. In den Studiengängen Computerlinguistik, Informatik und Phonetik können sich Studierende für die Arbeit in der sprachtechnologischen Forschung und Entwicklung spezialisieren.

In der Sprachtechnologie und auch in ihrer Grundlagenwissenschaft, der Computerlinguistik, spielt die deutsche Forschung in der ersten Liga. Das neue Kompetenzzentrum soll die Stellung der deutschen Forschung im internationalen Maßstab stärken und sowohl die Anbieter als auch die Abnehmer der wissenschaftlichen Ergebnisse beim Transfer von der Forschung in die Anwendung unterstützen.

 

Wissenschaftliche Forschung in drei Kernbereichen der Sprachtechnologie soll neue Verfahren aus der universitären Forschung für den Einsatz in praktischen Systemen bereitstellen. Die drei Bereiche sind

  • die gezielte Extraktion von Information aus großen Mengen digitaler Texte
  • die natürliche Interaktion mit elektronischen Informationsdiensten
  • die Beherrschung großer Informationsmengen durch verbesserte Suche und Textzusammenfassungen

Zu dem Kompetenzzentrum wird auch ein virtuelles Informationszentrum gehören, das den aktuellsten und umfassendsten Informationsdienst zu allen Aspekten und Teilbereichen der internationalen Sprachtechnologie anbietet. Da am DFKI bereits seit zehn Jahren das weltweite Verzeichnis sprachtechnologischer Computerprogramme und andere Metainformationen gepflegt werden, kann das Informationszentrum auf einer soliden Basis an Wissen und Erfahrung aufsetzen. Eine weitere Dienstleistung, für die das COLLATE-Projekt Vorlaufforschung leistet, ist ein Demonstrationszentrum für sprachtechnologische Software. Bisher gibt es weltweit keinen Ort, an dem man Forschungsresultate und Produkte aus verschiedenen Bereichen der Sprachtechnologie im Einsatz betrachten und ausprobieren kann. Das Demonstrationszentrum am DFKI wird die wichtigsten Systeme aus der internationalen Forschung und Entwicklung installieren und sachkundig vorführen.

Die dritte Säule des Kompetenzzentrums ist ein Evaluationszentrum. Hierbei geht es weniger um eine Messung der Leistungsfähigkeit einzelner Technologien, wie sie bereits in internationalen Wettbewerben praktiziert wird, sondern vielmehr um die Beurteilung von sprachtechnologischen Anwendungen in Bezug auf realistische Einsatzszenarien.

Nutznießer der angebotenen Forschungs- und Dienstleistungen sollen einmal die industriellen Hersteller und Anwender der Sprachtechnologie sein. Die fachliche Kompetenz des DFKI und seine Gemeinnützigkeit garantieren anwendungsübergreifende und vom Hersteller unabhängige Beratung. Auch die nationale und internationale Forschung wird vom Angebot des Kompetenzzentrums profitieren.

Kontakt
Prof. Dr. Hans Uszkoreit
Email: Hans.Uszkoreit@dfki.de
Tel. 0681 302-5281
Fax. 0681 302-5338