
ZenMEM ist ein dezidiert offener Verbund von Wissenschaftler*innen und darum bemüht, gemeinsam neue, digital gestützte Forschungsmöglichkeiten im Bereich der Kulturwissenschaften
Kurzbeschreibung des Projekts
Das MultiHTR-Team setzt die erfolgreiche erste Projektphase (01. Juni 2020 bis 31. Mai 2022) fort, um in der zweiten Phase (01. Juni 2022 bis 31. Mai 2024) das Sprachenportfolio zu erweitern und neueste Fortschritte in der Handschriftenerkennung (HTR) mittels künstlicher Intelligenz (KI) für die Bevölkerung und die Academia nutzbar zu machen. Schwerpunkte des Gesamtprojekts sind die (Weiter-)Entwicklung von Stenographie-Modellen für das Deutsche, das im hebräischen Alphabet geschriebene Jiddische, das Ukrainische, Russische, Serbische und Osmanische. Durch die automatisierten Transliterations- und Transkriptionsmodelle soll der Öffentlichkeit und der Forschung der Zugang zu bisher unzugänglichen handschriftlichen Materialien ermöglicht werden.
Projektinhalt
Das MultiHTR-Team setzt die Ergebnisse der ersten erfolgreichen Projektphase (01. Juni 2020 bis 31. Mai 2022) fort, um in der zweiten Projektphase (01. Juni 2022 bis 31. Mai 2024) das Sprachenportfolio auszuweiten und die neuesten Fortschritte im Bereich der Handschriftenerkennung (HTR) für die Bevölkerung und die Academia nutzbar zu machen.
In dieser Fortsetzung werden mittels künstlicher Intelligenz (KI) fortschrittliche Handschriftenerkennungsmodelle für bisher nicht berücksichtigte Sprachen und Schriften entwickelt. Ziel ist es, den Zugang zu komplexen handschriftlichen Materialien zu ermöglichen, die für die meisten Nutzer*innen bisher unzugänglich waren.
Die Schwerpunkte der zweiten Phase umfassen die (Weiter-)Entwicklung der Stenographie-Modelle für das Deutsche. Zusätzlich wird ein Modell für Dokumente in hebräischer Schrift geschriebenem Jiddisch entwickelt, um sie den Nachkommen und der Öffentlichkeit zugänglich zu machen. Eine weitere Komponente widmet sich der Entwicklung eines HTR-Modells für die ukrainische Sprache, um die Erschließung ukrainischsprachiger Archivbestände effizienter zu gestalten. Parallel dazu werden Osmanisch-Türkisch- und Russisch-Modelle weiterentwickelt.
Das übergeordnete Ziel des Projekts besteht darin, die Fortschritte im Bereich der Handschriftenerkennung auf Basis von KI systematisch voranzutreiben und die erworbenen Technologien zum Wohl der Bevölkerung einzusetzen. Insbesondere konzentriert sich das Vorhaben auf die Entwicklung von Handschriftenerkennungsmodellen für das Deutsche sowie für relevante Migrationssprachen in Deutschland/Baden-Württemberg. Diese Modelle sollen durch KI trainiert werden, um Archivmaterialien, Egodokumente und Korrespondenzen automatisch zu entschlüsseln.
In der ersten Projektphase veröffentlichte das Projekt Modelle für das Serbische und Russische.
Die automatisch entschlüsselten Texte dienen einerseits als Grundlage für geisteswissenschaftliche Forschungen, insbesondere für mikrohistorische, diskursanalytische und soziolinguistische Analysen. Andererseits profitiert die Bevölkerung direkt, indem komplexe, mehrsprachige Dokumente ohne paläographische Kenntnisse zugänglich werden. Das Projekt wird vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg im Rahmen der Landesdigitalisierungsstrategie digital@bw gefördert.
achim.rabus@slavistik.uni-freiburg.de
multihtr@slavistik.uni-freiburg.de
Erfahren Sie mehr unter
www.multihtr.uni-freiburg.de
Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.
ZenMEM ist ein dezidiert offener Verbund von Wissenschaftler*innen und darum bemüht, gemeinsam neue, digital gestützte Forschungsmöglichkeiten im Bereich der Kulturwissenschaften
Die Website „Der Holocaust in Ungarn und die Deportationen nach Norddeutschland“ präsentiert Ergebnisse aus dem transnationalen Projekt „Digitale Gedenk- und
In einem langfristigen Kooperationsprojekt von Österreichischer Nationalbibliothek und Deutschem Literaturarchiv Marbach werden alle bis 1990 entstandenen 75 Notizbücher in einer
VerbaAlpina widmete sich der Dokumentation der dialektalen lexikalischen Variation im Alpenraum innerhalb regionstypischer Konzeptdomänen.
Das DTA ist ein Archiv für deutschsprachige, historische Textsammlungen an der Berlin-Brandenburgischen Akademie der Wissenschaften. Es umfasst annotierte Volltexttranskriptionen von
Die Edition „Hamburger Schlüsseldokumente zur deutsch-jüdischen Geschichte“ soll sowohl einem akademischen Publikum als auch der interessierten Öffentlichkeit einen niedrigschwelligen Zugang
Die drei von Text+ adressierten Datendomänen Sammlungen, lexikalische Ressourcen und Editionen gehören zu den klassischen Feldern geisteswissenschaftlicher Forschung. Das Plus-Zeichen
Das von der NRW Akademie der Wissenschaften und der Künste sowie der Union der Deutschen Akademien finanzierte Langzeitprojekt an der Universität Bonn untersucht die Schrift und Sprache der klassischen Mayakultur. Es zielt darauf ab, Maya-Schriftzeugnisse in einer Datenbank zu dokumentieren und die Hieroglyphensprache in einem Wörterbuch zu erfassen. Textträger werden in Literatur, Archiven und Fotosammlungen recherchiert, in der virtuellen Forschungsumgebung TextGrid erschlossen und online veröffentlicht. Informationen und Inschriftenabbildungen werden in einer Objektdatenbank und im „Maya Image Archive“ gespeichert, einem Open-Access-Archiv mit rund 15.000 Bildern, das kostenlos nutzbar ist.
Wir verwenden Cookies und ähnliche Funktionen zur Verarbeitung von Daten. Die Zustimmung ist freiwillig und kann jederzeit widerrufen werden.