Transkribus: Künstliche Intelligenz liest Handschriften

Die an der Uni Innsbruck mitentwickelte Transkribus-Plattform macht diese Technologie der Öffentlichkeit zugänglich.

Handschriften sind so individuell wie Menschen. Dennoch sind Computer heute in der Lage, handschriftliche Texte in unterschiedlichsten Sprachen automatisch zu erkennen. Die von der Universität Innsbruck mitentwickelte Software-Plattform Transkribus macht diese Technologie der Wissenschaftsgemeinde, interessierten Archiven und der breiten Öffentlichkeit zugänglich. Über 90.000 Nutzer:innen aus aller Welt verwenden die Plattform bereits, um handschriftliche Dokumente lesbar und durchsuchbar zu machen.

Eine immer größer werdende Gruppe interessiert sich für ihre Familiengeschichte und begibt sich in Kirchenbüchern, Verträgen oder in historischen Dokumenten auf die Suche nach ihren Vorfahren. „Die händische Suche in diesen Dokumenten kann eine sehr mühsame Angelegenheit sein. Durch unsere Technologie wird die Erforschung der Familiengeschichte nun wesentlich erleichtert“, sagt Günter Mühlberger von der zuständigen Arbeitsgruppe an der Uni Innsbruck.

Der Innsbrucker Germanist Günter Mühlberger ist einer der Köpfe hinter der Transkribus-Plattform. Fotos: Uni Innsbruck

In Archiven und Bibliotheken lagern historische Dokumente von unschätzbarem Wert. Diese Dokumente nehmen viel Platz ein. So füllen zum Beispiel die Dokumente im Staatsarchiv in Wien 350 Regalkilometer. Der Großteil dieser Dokumente liegt nur handschriftlich vor und ist für viele Benutzer nicht mehr lesbar, da sie in Kurrentschrift verfasst sind.

„Hier hilft die Transkribus-Plattform, auf der diese Handschrift automatisiert erkannt und damit für alle lesbar gemacht wird“, so Mühlberger. Die Dokumente werden dadurch auch durchsuchbar. Das erleichtert die Recherche in historischen Beständen enorm, weil auf diese Weise tausende Dokumente gleichzeitig nach Familiennamen oder anderen Begriffen durchstöbert werden können.

Kurrent, Arabisch und Chinesisch lesen

Transkribus arbeitet mit neuronalen Netzen. Diese maschinenlernenden Methoden haben den großen Vorteil, dass sie nicht mehr speziell für eine bestimmte Handschrift programmiert werden müssen. „Die Benutzer:innen bringen der Maschine bei, die Schrift zu lesen“, sagt Mühlberger. „Und eine Maschine ermüdet nicht, das heißt, sie kann auch Millionen von Seiten automatisiert verarbeiten. Das haben wir beispielsweise für das finnische Nationalarchiv gemacht, bei dem nunmehr über zwei Millionen Dokumente aus dem 19. Jahrhundert für alle durchsuchbar sind.“

Die verwendete Technologie ist völlig unabhängig von der Sprache und der eigentlichen Schriftart. Transkribus erkennt nicht nur Kurrentschrift oder auch moderne Handschriften, sondern auch mittelalterliche Schriften, aber auch Hebräisch, Arabisch oder indische Schriften. Chinesisch soll bald folgen.

Transkribus kann verschiedene Handschriften verarbeiten. Gibt es kein passendes Modell, können Nutzer:innen die Maschine selbst trainieren.

Auch in der Wissenschaft sind die Anwendungsmöglichkeiten von Transkribus vielfältig. Der Innsbrucker Altphilologe William Barton, der für seine Forschung mit Unterstützung von Transkribus den mit 1,2 Millionen Euro dotierten START-Preis erhalten hat, entschlüsselt beispielsweise verloren geglaubte Tagebuchaufzeichnungen von Karl Benedikt Hase aus dem 19. Jahrhundert, geschrieben in handschriftlichem Altgriechisch.

„Ich habe der Maschine anhand von 100 Seiten ein Modell für Hases Handschrift antrainiert. Jetzt ist sie selbst in der Lage, alle seine Tagebücher zu lesen und den Text zuverlässig zu transkribieren“, so Barton vom Institut für Neulateinische Studien. Laut einer aktuellen Studie der Universität Edinburgh sind inzwischen über 400 wissenschaftliche Publikationen erschienen, die mit Hilfe von Transkribus entstanden sind.

Transkribus wurde mit Unterstützung der Europäischen Union entwickelt und wird seit 2019 von der europäischen Genossenschaft READ-Coop betrieben, die mittlerweile mehr als 120 Mitglieder aus 27 Ländern zählt. Heute, am 30. September, treffen sich an der Uni Innsbruck über 200 Expert:innen für Handschriftenerkennung sowie Nutzer:innen von Transkribus, um die jüngsten Fortschritte der Technologie und deren Anwendungen auf unterschiedlichsten Gebieten zu diskutieren.

Hier geht es zur Transkribus-Plattform.

Ein Posting

Chronos

Wow, ich bin begeistert! Die Fortschritte in der Technologie - Software Entwicklung mit einem breit gefächerten Anwendungsspektrum. Großes Lob an die mitentwickelten Wissenschaftler der Uni-IBK

Danke, Dolomitenstadt für den interessanten Beitrag!

 
0
8
Sie müssen angemeldet sein, um ihre Stimme für dieses Posting abzugeben.
Ein Posting verfassen

Sie müssen angemeldet sein, um ein Posting zu verfassen.
Anmelden oder Registrieren