Als Repräsentantin des CLARIN ERIC spricht Prof. Dr. Franciska de Jong von der Universität Utrecht auf dem Forum CA3 2016 in Hamburg über CLARIN als eine Forschungsinfrastruktur für ein multilinguales Europa.
Welche Probleme entstehen bei der Arbeit mit multilingualen Daten, Sprachwandel und Sprachvarietät und was bedeutet Multilingualität eigentlich? Diesen Fragen und deren Lösung durch eine Forschungsinfrastruktur die Wissen, Fachkenntnisse, Interoperabilität, Kooperationswillen und mehr verbindet, geht Frau Jong in ihrem Vortrag nach.
Was ist Multilingualität und welche Herausforderungen und Perspektiven bringt sie für eine Forschungsinfrastruktur wie CLARIN mit sich?
Europa stellt mit seinen 24 Amtssprachen und diversen Dialekten ein Paradebeispiel multilingualen Zusammenlebens dar, welches für die meisten Menschen die Norm bildet. Die daraus entstehenden Herausforderungen und Perspektiven für eine Forschungsinfrastruktur sind beispielsweise
- Einrichtung eines einheitlichen digitalen Binnenmarktes
- Überschreitung sprachlicher Barrieren im Sinne von sprach- und schriftübergreifender Interoperabilität
- Möglichkeiten kontrastiver Forschung
- Analyseservices für Text- und Sprachdaten als Standbeine sozialer und kultureller Analytik
- Beiträge zur Entwicklung neuer methodologischer Rahmenbedingungen zur integrativen Verarbeitung unterschiedlicher Datentypen und multidisziplinärer Forschungsplanung
- Austausch von Wissen und Expertise im Sinne offener Wissenschaft und Multidisziplinarität
- Kooperation, zum Beispiel mit anderen Forschungsinfrastrukturen wie DARIAH oder CESSDA
- Multimodalität durch Videos, Bilder, Audiodateien und mehr
- Sprache und Text als kulturelle und sprachliche Daten
Sprachtechnologische Fortschritte wie die Entwicklung maschinellen Übersetzens seit Mitte des 20. Jahrhunderts und der Digital Turn mit der Entwicklung statistischer und regelbasierter Modelle, sprachübergreifender Suchmaschienen sowie Projekte wie die Europeana Libraries machen das Lösen solcher Aufgaben möglich. Seit dem 21. Jahrhundert nahm auch die Rolle von Sprache als Daten für die natürliche Sprachverarbeitung zu, was unter anderem die so genannte European Science Cloud Arbeit ermöglichte.
Report
My comments