MultiHTR

MultiHTR – Multilinguale Handschriftenerkennung

Fachliche Zuordnung

Projektkategorie

Projektzeitraum

06/01/2020 – 31/05/2024

Projektstart: 06/01/2020 – Projektende: 31/05/2024

Kurzbeschreibung des Projekts

Das MultiHTR-Team setzt die erfolgreiche erste Projektphase (01. Juni 2020 bis 31. Mai 2022) fort, um in der zweiten Phase (01. Juni 2022 bis 31. Mai 2024) das Sprachenportfolio zu erweitern und neueste Fortschritte in der Handschriftenerkennung (HTR) mittels künstlicher Intelligenz (KI) für die Bevölkerung und die Academia nutzbar zu machen. Schwerpunkte des Gesamtprojekts sind die (Weiter-)Entwicklung von Stenographie-Modellen für das Deutsche, das im hebräischen Alphabet geschriebene Jiddische, das Ukrainische, Russische, Serbische und Osmanische. Durch die automatisierten Transliterations- und Transkriptionsmodelle soll der Öffentlichkeit und der Forschung der Zugang zu bisher unzugänglichen handschriftlichen Materialien ermöglicht werden.

Projektinhalt

Das MultiHTR-Team setzt die Ergebnisse der ersten erfolgreichen Projektphase (01. Juni 2020 bis 31. Mai 2022) fort, um in der zweiten Projektphase (01. Juni 2022 bis 31. Mai 2024) das Sprachenportfolio auszuweiten und die neuesten Fortschritte im Bereich der Handschriftenerkennung (HTR) für die Bevölkerung und die Academia nutzbar zu machen.
In dieser Fortsetzung werden mittels künstlicher Intelligenz (KI) fortschrittliche Handschriftenerkennungsmodelle für bisher nicht berücksichtigte Sprachen und Schriften entwickelt. Ziel ist es, den Zugang zu komplexen handschriftlichen Materialien zu ermöglichen, die für die meisten Nutzer*innen bisher unzugänglich waren.
Die Schwerpunkte der zweiten Phase umfassen die (Weiter-)Entwicklung der Stenographie-Modelle für das Deutsche. Zusätzlich wird ein Modell für Dokumente in hebräischer Schrift geschriebenem Jiddisch entwickelt, um sie den Nachkommen und der Öffentlichkeit zugänglich zu machen. Eine weitere Komponente widmet sich der Entwicklung eines HTR-Modells für die ukrainische Sprache, um die Erschließung ukrainischsprachiger Archivbestände effizienter zu gestalten. Parallel dazu werden Osmanisch-Türkisch- und Russisch-Modelle weiterentwickelt.
Das übergeordnete Ziel des Projekts besteht darin, die Fortschritte im Bereich der Handschriftenerkennung auf Basis von KI systematisch voranzutreiben und die erworbenen Technologien zum Wohl der Bevölkerung einzusetzen. Insbesondere konzentriert sich das Vorhaben auf die Entwicklung von Handschriftenerkennungsmodellen für das Deutsche sowie für relevante Migrationssprachen in Deutschland/Baden-Württemberg. Diese Modelle sollen durch KI trainiert werden, um Archivmaterialien, Egodokumente und Korrespondenzen automatisch zu entschlüsseln.
In der ersten Projektphase veröffentlichte das Projekt Modelle für das Serbische und Russische.
Die automatisch entschlüsselten Texte dienen einerseits als Grundlage für geisteswissenschaftliche Forschungen, insbesondere für mikrohistorische, diskursanalytische und soziolinguistische Analysen. Andererseits profitiert die Bevölkerung direkt, indem komplexe, mehrsprachige Dokumente ohne paläographische Kenntnisse zugänglich werden. Das Projekt wird vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg im Rahmen der Landesdigitalisierungsstrategie digital@bw gefördert.

Förderung

Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg im Rahmen der Landesdigitalisierungsstrategie digital@bw

Fachliche Zuordnung

Projektkategorie

Kontakt

achim.rabus@slavistik.uni-freiburg.de
multihtr@slavistik.uni-freiburg.de

Erfahren Sie mehr unter
www.multihtr.uni-freiburg.de

Projektmitarbeitende

Prof. Dr. Achim Rabus, Milanka Matić-Chalkitis, Aleksej Tikhonov, Lesley Loew, Martin Meindl

Neues Projekt anmelden

Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.

Weitere Projekte

Wörterbuchnetz

Das Trierer Wörterbuchnetz bietet Zugriff auf mehr als 40 Wörterbücher und Nachschlagewerke, die entweder einzeln aufgerufen oder mittels einer übergreifenden

Weiterlesen →

Oekonomische Enzyclopaedie

Digitale Ausgabe der 1773 bis 1858 in 242 Bänden erschienenen Oekonomisch-technologischen Enzyklopädie von J. G. Krünitz.

Weiterlesen →

Arbeitskreis digitale Kunstgeschichte

Der Arbeitskreis organsiert das #ArthistoCamp, die Schriftenreihe Computing in Art and Architecture und den #arthistocast – der Podcast zur Digitalen

Weiterlesen →

DisKo steht für Diversitäts-Korpus und ist ein literaturwissenschaftliches Projekt mit Digital-Humanities-Komponente. Mit Methoden des maschinellen Lernens wollen wir einen Algorithmus

Weiterlesen →

Der Webservice correspSearch wurde entwickelt um ein lange bestehendes Desiderat von Briefeditionen zu beheben: Die edierten Briefe editionsübergreifend durchsuchen zu

Weiterlesen →

Das MultiHTR-Team setzt die Ergebnisse der ersten erfolgreichen Projektphase (01. Juni 2020 bis 31. Mai 2022) fort, um in der

Weiterlesen →

Peter Handke Notizbücher

In einem langfristigen Kooperationsprojekt von Österreichischer Nationalbibliothek und Deutschem Literaturarchiv Marbach werden alle bis 1990 entstandenen 75 Notizbücher in einer kommentierten digitalen Edition erstmals veröffentlicht und frei zugänglich gemacht.

Weiterlesen →

Handkeonline

Die Website schafft einen schnellen und unkomplizierten Zugang zu den Werkmaterialien des österreichischen Literaturnobelpreisträgers Peter Handke.

Weiterlesen →