
DARIAH-DE (gefördert 2011-2019) unterstützt die mit digitalen Ressourcen und Methoden arbeitenden Geistes- und Kulturwissenschaftler/innen in Forschung und Lehre. Dazu baut
Kurzbeschreibung des Projekts
Das MultiHTR-Team setzt die erfolgreiche erste Projektphase (01. Juni 2020 bis 31. Mai 2022) fort, um in der zweiten Phase (01. Juni 2022 bis 31. Mai 2024) das Sprachenportfolio zu erweitern und neueste Fortschritte in der Handschriftenerkennung (HTR) mittels künstlicher Intelligenz (KI) für die Bevölkerung und die Academia nutzbar zu machen. Schwerpunkte des Gesamtprojekts sind die (Weiter-)Entwicklung von Stenographie-Modellen für das Deutsche, das im hebräischen Alphabet geschriebene Jiddische, das Ukrainische, Russische, Serbische und Osmanische. Durch die automatisierten Transliterations- und Transkriptionsmodelle soll der Öffentlichkeit und der Forschung der Zugang zu bisher unzugänglichen handschriftlichen Materialien ermöglicht werden.
Projektinhalt
Das MultiHTR-Team setzt die Ergebnisse der ersten erfolgreichen Projektphase (01. Juni 2020 bis 31. Mai 2022) fort, um in der zweiten Projektphase (01. Juni 2022 bis 31. Mai 2024) das Sprachenportfolio auszuweiten und die neuesten Fortschritte im Bereich der Handschriftenerkennung (HTR) für die Bevölkerung und die Academia nutzbar zu machen.
In dieser Fortsetzung werden mittels künstlicher Intelligenz (KI) fortschrittliche Handschriftenerkennungsmodelle für bisher nicht berücksichtigte Sprachen und Schriften entwickelt. Ziel ist es, den Zugang zu komplexen handschriftlichen Materialien zu ermöglichen, die für die meisten Nutzer*innen bisher unzugänglich waren.
Die Schwerpunkte der zweiten Phase umfassen die (Weiter-)Entwicklung der Stenographie-Modelle für das Deutsche. Zusätzlich wird ein Modell für Dokumente in hebräischer Schrift geschriebenem Jiddisch entwickelt, um sie den Nachkommen und der Öffentlichkeit zugänglich zu machen. Eine weitere Komponente widmet sich der Entwicklung eines HTR-Modells für die ukrainische Sprache, um die Erschließung ukrainischsprachiger Archivbestände effizienter zu gestalten. Parallel dazu werden Osmanisch-Türkisch- und Russisch-Modelle weiterentwickelt.
Das übergeordnete Ziel des Projekts besteht darin, die Fortschritte im Bereich der Handschriftenerkennung auf Basis von KI systematisch voranzutreiben und die erworbenen Technologien zum Wohl der Bevölkerung einzusetzen. Insbesondere konzentriert sich das Vorhaben auf die Entwicklung von Handschriftenerkennungsmodellen für das Deutsche sowie für relevante Migrationssprachen in Deutschland/Baden-Württemberg. Diese Modelle sollen durch KI trainiert werden, um Archivmaterialien, Egodokumente und Korrespondenzen automatisch zu entschlüsseln.
In der ersten Projektphase veröffentlichte das Projekt Modelle für das Serbische und Russische.
Die automatisch entschlüsselten Texte dienen einerseits als Grundlage für geisteswissenschaftliche Forschungen, insbesondere für mikrohistorische, diskursanalytische und soziolinguistische Analysen. Andererseits profitiert die Bevölkerung direkt, indem komplexe, mehrsprachige Dokumente ohne paläographische Kenntnisse zugänglich werden. Das Projekt wird vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg im Rahmen der Landesdigitalisierungsstrategie digital@bw gefördert.
achim.rabus@slavistik.uni-freiburg.de
multihtr@slavistik.uni-freiburg.de
Erfahren Sie mehr unter
www.multihtr.uni-freiburg.de
Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.
DARIAH-DE (gefördert 2011-2019) unterstützt die mit digitalen Ressourcen und Methoden arbeitenden Geistes- und Kulturwissenschaftler/innen in Forschung und Lehre. Dazu baut
Das Heinrich-Heine-Portal schöpft aus den Arbeitsergebnissen mehrerer Forschergenerationen, indem es die beiden historisch-kritischen Heine-Gesamtausgaben, die unabhängig voneinander in der Bundesrepublik
Die im aschkenasischen Europa und Norditalien verbreiteten Pinkasim – Protokollbücher jüdischer Gemeinden – sind zentrale Quellen zur Erforschung der jüdischen
Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) wird seit 2008 am Leibniz-Institut für Deutsche Sprache aufgebaut. Das Korpus enthält Audio-
DARIAH-DE (gefördert 2011-2019) unterstützt die mit digitalen Ressourcen und Methoden arbeitenden Geistes- und Kulturwissenschaftler/innen in Forschung und Lehre. Dazu baut
Das Trierer Wörterbuchnetz bietet Zugriff auf mehr als 40 Wörterbücher und Nachschlagewerke, die entweder einzeln aufgerufen oder mittels einer übergreifenden
Von 1958 bis 1973 lebte und arbeitete der anglo-amerikanische Dichter Wystan Hugh Auden (1907-1973) viele Monate im Jahr im niederösterreichischen
Publikation der Daten zu Textzeugen des altägyptischen Totenbuchs aus dem Akademievorhaben „Altägyptisches Totenbuch“ (1994/2004–2012). Das 2012 veröffentlichte Portal bietet Beschreibungen, Bildmaterial und Bibliografie zu rund 3000 Textzeugen des Totenbuchs, sowie Visualisierungen und Auswertungen zu den Objekten, Totenbuchspüchen und enthaltenen Motiven. Es ist eine zentrale Ressource der internationalen Totenbuchforschung und wird kontinuierlich am CCeH betreut.
Wir verwenden Cookies und ähnliche Funktionen zur Verarbeitung von Daten. Die Zustimmung ist freiwillig und kann jederzeit widerrufen werden.