
HGIS de las Indias ist eine historisch-geographische Datenbank zum Spanisch-Amerika der ausgehenden Kolonialzeit.
Kurzbeschreibung des Projekts
Das MultiHTR-Team setzt die erfolgreiche erste Projektphase (01. Juni 2020 bis 31. Mai 2022) fort, um in der zweiten Phase (01. Juni 2022 bis 31. Mai 2024) das Sprachenportfolio zu erweitern und neueste Fortschritte in der Handschriftenerkennung (HTR) mittels künstlicher Intelligenz (KI) für die Bevölkerung und die Academia nutzbar zu machen. Schwerpunkte des Gesamtprojekts sind die (Weiter-)Entwicklung von Stenographie-Modellen für das Deutsche, das im hebräischen Alphabet geschriebene Jiddische, das Ukrainische, Russische, Serbische und Osmanische. Durch die automatisierten Transliterations- und Transkriptionsmodelle soll der Öffentlichkeit und der Forschung der Zugang zu bisher unzugänglichen handschriftlichen Materialien ermöglicht werden.
Projektinhalt
Das MultiHTR-Team setzt die Ergebnisse der ersten erfolgreichen Projektphase (01. Juni 2020 bis 31. Mai 2022) fort, um in der zweiten Projektphase (01. Juni 2022 bis 31. Mai 2024) das Sprachenportfolio auszuweiten und die neuesten Fortschritte im Bereich der Handschriftenerkennung (HTR) für die Bevölkerung und die Academia nutzbar zu machen.
In dieser Fortsetzung werden mittels künstlicher Intelligenz (KI) fortschrittliche Handschriftenerkennungsmodelle für bisher nicht berücksichtigte Sprachen und Schriften entwickelt. Ziel ist es, den Zugang zu komplexen handschriftlichen Materialien zu ermöglichen, die für die meisten Nutzer*innen bisher unzugänglich waren.
Die Schwerpunkte der zweiten Phase umfassen die (Weiter-)Entwicklung der Stenographie-Modelle für das Deutsche. Zusätzlich wird ein Modell für Dokumente in hebräischer Schrift geschriebenem Jiddisch entwickelt, um sie den Nachkommen und der Öffentlichkeit zugänglich zu machen. Eine weitere Komponente widmet sich der Entwicklung eines HTR-Modells für die ukrainische Sprache, um die Erschließung ukrainischsprachiger Archivbestände effizienter zu gestalten. Parallel dazu werden Osmanisch-Türkisch- und Russisch-Modelle weiterentwickelt.
Das übergeordnete Ziel des Projekts besteht darin, die Fortschritte im Bereich der Handschriftenerkennung auf Basis von KI systematisch voranzutreiben und die erworbenen Technologien zum Wohl der Bevölkerung einzusetzen. Insbesondere konzentriert sich das Vorhaben auf die Entwicklung von Handschriftenerkennungsmodellen für das Deutsche sowie für relevante Migrationssprachen in Deutschland/Baden-Württemberg. Diese Modelle sollen durch KI trainiert werden, um Archivmaterialien, Egodokumente und Korrespondenzen automatisch zu entschlüsseln.
In der ersten Projektphase veröffentlichte das Projekt Modelle für das Serbische und Russische.
Die automatisch entschlüsselten Texte dienen einerseits als Grundlage für geisteswissenschaftliche Forschungen, insbesondere für mikrohistorische, diskursanalytische und soziolinguistische Analysen. Andererseits profitiert die Bevölkerung direkt, indem komplexe, mehrsprachige Dokumente ohne paläographische Kenntnisse zugänglich werden. Das Projekt wird vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg im Rahmen der Landesdigitalisierungsstrategie digital@bw gefördert.
achim.rabus@slavistik.uni-freiburg.de
multihtr@slavistik.uni-freiburg.de
Erfahren Sie mehr unter
www.multihtr.uni-freiburg.de
Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.

HGIS de las Indias ist eine historisch-geographische Datenbank zum Spanisch-Amerika der ausgehenden Kolonialzeit.

GAMS ist ein OAIS-konformes Repositorium zur Verwaltung, Publikation und Langzeitarchivierung digitaler Ressourcen aus allen geisteswissenschaftlichen Fächern.

Nachhaltiges Forschungsdatenmanagement ist zentral für künftige Forschungen! Dies zeigt etwa die Geschichte der Bonner Längsschnittstudie des Alterns. Fast zwanzig Jahre

Das MultiHTR-Team setzt die Ergebnisse der ersten erfolgreichen Projektphase (01. Juni 2020 bis 31. Mai 2022) fort, um in der

Das Akademienvorhaben hat die philologische Erschließung und kritische Edition antiker und byzantinischer Kommentare, Paraphrasen, Kompendien und Scholien zu den Schriften

ELAN wird am Max-Planck-Institut für Psycholinguistik im Sprach-Archiv (TLA – The Language Archive) entwickelt. Es wird in der Programmiersprache Java

Das Fach ist BUA-finanziert und am Seminar für Semitistik und Arabistik angelegt. Es fokussiert sich auf die Analyse des status

Das forTEXT Portal bietet einsteigerfreundlich aufbereitete, zitierfähige Methodenbeschreibungen und Reviews von Textsammlungen und Tools – von Digitalisierung über Annotation zu Interpretation und Visualisierung von Literatur.
Wir verwenden Cookies und ähnliche Funktionen zur Verarbeitung von Daten. Die Zustimmung ist freiwillig und kann jederzeit widerrufen werden.