Das Transkribieren frühneuzeitlicher Urkunden

Künstliche Intelligenz (KI) ist momentan in aller Munde – positiv wie negativ. Erst im letzten Heft wurden die Sorgen von Autoren und Fotografen dargestellt, welche um ihre Zukunft bangten. „So was kann mir nicht passieren!“, hatte ich mir dabei noch gedacht. Ist doch alles, mit dem ich mich beschäftige, zu alt, um von einer Maschine erfasst zu werden. Muss man die Akten doch selbst in die Hand nehmen, um sich mit der Geschichte zu beschäftigen. Und prompt wurde ich eines Besseren belehrt … Ein Ortsheimatpfleger machte mich kurz vor Weihnachten darauf aufmerksam, dass es jetzt eine KI gebe, welche im Stande sein solle, Handschriften zu transkribieren (also zu entziffern). Diese nennt sich Transkribus und funktioniert relativ simpel. Auf der Webseite lädt man seinen Text als Bilddatei hoch und die KI erledigt den Rest. Am Ende kommt dann ein Text heraus, den man als Word-Datei herunterladen kann. Aber wie gut ist die KI momentan wirklich? Muss jetzt auch ich befürchten, von einem Computer ersetzt zu werden? Das Ganze wollte ich an einem Beispiel austesten.

Aber dafür erstmal ein paar Schritte zurück … Im Oktober 2023 erhielt ich einen Anruf von einem Herrn aus Berghausen, welcher Unterlagen des Hofes Köster in Berghausen abzugeben hatte. Die Unterlagen waren überschaubar, aber hatten es in sich: Ein Ordner an Unterlagen zur Familiengeschichte der unterschiedlichsten Bewohner des Hofes (den Familien Köster, Albers und Püttmann) sowie zu weiteren Berghausener Familien; ein weiterer Ordner mit mehreren Originalurkunden für die Zeit zwischen 1650 und 1706 sowie eine gerahmte Urkunde aus dem Jahre 1543. Der Hof war lange Zeit Besoldungsgut des Küsters zu Berghausen gewesen, weshalb sich auch dazu einige Urkunden wiederfinden. Damit bildet der Bestand einen sehr guten Einblick in das bäuerliche Leben der Frühen Neuzeit.

Für alle Urkunden lagen zum Glück schon Zusammenfassungen vor, was die Aufnahme in das Archivprogramm er leichterte. Das Transkribieren von Texten des 19. und 20. Jahrhunderts ist – je nach Leserlichkeit der Handschrift – gut möglich und gehört zum Standardhandwerk für Historiker. Bei älteren Texten gelangt man schon mal mit seinem Latein (bzw. Frühneuhochdeutsch) ans Ende. Die perfekte Möglichkeit also, sich von einer KI helfen zu lassen.

Die Urkunde, welche ich von der KI transkribiert haben wollte, war die Älteste der Sammlung. Ausgestellt am 4. März 1543, hält sie den Rechtsakt um das Erbe der Familie Knocke fest. Die beiden Brüder Hans und Manthe einigten sich, dass der ältere Bruder (Hans) das elterliche Gut in Berghausen erbe, Manthe hingegen das Gut in Huxel. Dieser wird zudem verpflichtet, seinem älteren Bruder eine jährliche Rente sowie weitere Gebühren zu zahlen.

Was die KI ausspuckte, war eine Art frühneuhochdeutsches Kauderwelsch. Manche Wörter muteten komisch an, weil sie nicht das bekannte Hochdeutsch waren, andere wirkten komisch, weil die KI einzelne Buchstaben schlichtweg falsch erkannt hatte. Und auch was Eigennamen anging, war die KI nicht immer fehlerfrei: Zwar erkannte die KI „Hans Knocke“ richtig, machte aus „Manthe“ aber „Mantho Knocke“. Auch mit Berghausen hatte sie ein Problem: Anstatt der damals gebräuchlichen Schreibweise „Berchusen“ machte die KI aus dem Ort „berthase“.

Es gibt also noch kleine Unstimmigkeiten, und selbst wenn die KI es eines Tages schaffen sollte, den gesamten Text fehlerfrei zu transkribieren, müsste man das Frühneuhochdeutsch noch in Hochdeutsch übersetzen. Und solange es dafür keine KI gibt, können Historiker auf der ganzen Welt erleichtert aufatmen …