D2: Korpustechnologie

Projektleiter: Prof. Dr. Henning Lobin und Prof. Dr. Joachim Zinke (FH Gießen-Friedberg)
Wissenschaftlicher Mitarbeiter: Dr. Harald Lüngen

Das zweite Entwicklungsprojekt hat die Entwicklung einer sprach- und textbezogenen Forschungsinfrastruktur für Korpora zum Gegenstand. Textkorpora bilden für eine Vielzahl kulturwissenschaftlicher Disziplinen eine wichtige Grundlage – im Bereich der Sprachwissenschaft werden strukturelle Eigenschaften anhand von Korpora untersucht, im Bereich der Literaturwissenschaft inhaltliche und stilistische Bezüge zwischen literarischen Werken hergestellt und in der Geschichtswissenschaft historische Dokumente verfügbar und auswertbar gemacht. Während in den USA und Großbritannien derartige Anforderungen bereits häufig in eigenen Zentren für „Computing in the Humanities“ zusammengefasst werden, setzt diese Entwicklung im deutschsprachigen Raum erst mit Verspätung ein. Eine Schwerpunktsetzung bietet somit neben den forschungspraktischen Aspekten auch die Möglichkeit, ein innovatives Forschungsfeld frühzeitig zu besetzen. Zunächst in Zusammenarbeit mit den Projekten A2 und A4 sollen XML-basierte Auszeichnungsverfahren Anwendung finden, um Textkorpora mit Zusatzinformationen anzureichern. Dabei sollen insbesondere innovative Verfahren der automatisierten Textauszeichnung und des Retrievals über mehrere alternative Strukturebenen hinweg entwickelt werden. In korpustechnologischer Hinsicht bestehen im Arbeitsbereich Computerlinguistik (Prof. Dr. Henning Lobin) umfangreiche Vorarbeiten hinsichtlich des Aufbaus synchroner Korpora für relationale Textstrukturen im Rahmen des 2002-2008 als Teil einer DFG-Forschergruppe durchgeführten Projekts SemDok. Einen weiteren, aktuellen Bezugspunkt des Entwicklungsprojekts bildet seit 2008 die Beteiligung dieses Arbeitsbereichs am vom BMBF geförderten deutschen Zweig D-SPIN des EU-Vorhabens CLARIN („Common Language Resources and Technology Infrastructure”; Verbundprojekt im Rahmen des FP7), das den Aufbau einer Forschungsinfrastruktur für Sprachressourcen zum Gegenstand hat. Das LOEWE-Entwicklungsprojekt soll von vornherein in diesen Forschungskontext eingebettet werden.LOEWE Kugeln Mit der Johann-Wolfgang-Goethe-Universität Frankfurt (Prof. Gippert) und der Justus-Liebig-Universität sind zwei der neun im deutschen Zweig dieses Vorhabens beteiligten Partner an hessischen Universitäten ansässig – zur Zeit befindet sich auch eine spezifische Kooperation dieser beiden hessischen Partner in Vorbereitung.