
Das von der NRW Akademie der Wissenschaften und der Künste sowie der Union der Deutschen Akademien finanzierte Langzeitprojekt an der
Kurzbeschreibung des Projekts
ELAN wird am Max-Planck-Institut für Psycholinguistik im Sprach-Archiv (TLA – The Language Archive) entwickelt. Es wird in der Programmiersprache Java geschrieben, die Quellen sind erhältlich für non-kommerzielle und kommerzielle Zwecken. Mit ELAN kann ein Benutzer eine unbegrenzte Anzahl von Annotationen zu primären Audio- und Video-Daten erstellen. Eine Annotation kann z.B. ein Satz, Wort oder Morphem sein, oder eine Glosse, ein Kommentar, eine Übersetzung, oder ein Tag oder Beschreibung irgendeine Feature, die in den Medien beobachtet wurde.
Projektinhalt
Annotationen können mit sogenannten Tiers vielschichtig erstellt werden. Diese Tiers können dabei hierarchisch miteinander verbunden sein. Auf einem separaten Tier sind Annotationen zeitlich synchron zu den Medien angeordnet – der Benutzer bestimmt oder verändert Start- und Endpunkt jeder Annotation. Auf abhängigen Tiers, weiter unten in der Hierarchie, beziehen Annotationen sich auf andere existierende Annotationen, hierbei können sie entweder dieselben Start- und Endzeiten nutzen (eins-zu-eins-Beziehung), oder den Zeitabschnitt einer Annotation auf einem Tier, der höher in der Hierarchie steht, weiter unterteilen (1:n-Beziehung). Ein Tier kann zum Beispiel Annotationen mit Satz-bezogenen Transkriptionen beinhalten, und abhängige eins-zu-eins-Tiers können Übersetzungen in andere Sprachen beinhalten. Oder eine abhängiger 1:n- Tier beinhaltet eine Annotation für jedes Wort oder jedes Morphem des Tiers auf der höheren Ebene, und ein weiterer beinhaltet gleichzeitig ein Glossierung für jedes Wort oder Morphem. Zahlreiche 1:n-Beziehungen sind möglich, z.B. davon abhängend ob innere Start- und Endzeiten auf den abhängigen Tiers bestimmt werden können. Diese Flexibilität innerhalb der Tier-Relationen erlaubt es, die komplexen ontologischen Verhältnisse von Features zu modellieren, die auf verschiedenen Tiers annotiert werden. Die hierarchischen Konfigurationen können wieder für verschiedene Sprecher verwandt werden und sogar als Vorlage für die Erstellung von neuen Annotations-Dokumenten dienen. Annotationen können durch die Benutzung einer Einzel- oder Multi-Tier-Suche mit regulären Ausdrücken durchsucht werden, innerhalb eines einzelnen Dokuments oder über eine Auswahl von Annotations-Dokumenten. Die Annotationen werden immer in separaten Dateien, unabhängig von den zugehörigen Multimedia-Dateien, erstellt und gespeichert; Letztere bleiben unverändert. Der textuelle Inhalt von Annotationen ist immer in Unicode gehalten und die Annotations-Dateien sind in einem speziellen XML-Format gespeichert, dem “EAF” (ELAN Annotation Format). Wenn die Dateien in The Language Archive archiviert sind, können ELAN-Daten zusammen mit den zugehörigen Mediendateien online in einem Web-Browser angezeigt werden.
Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.

Das von der NRW Akademie der Wissenschaften und der Künste sowie der Union der Deutschen Akademien finanzierte Langzeitprojekt an der

Digitale Ausgabe der 1773 bis 1858 in 242 Bänden erschienenen Oekonomisch-technologischen Enzyklopädie von J. G. Krünitz.

Die digitale Arbeitsumgebung ediarum ist eine aus mehreren Softwarekomponenten bestehende Lösung, die es Wissenschaftler*innen erlaubt, Transkriptionen von Manuskripten und Drucken

Nachhaltiges Forschungsdatenmanagement ist zentral für künftige Forschungen! Dies zeigt etwa die Geschichte der Bonner Längsschnittstudie des Alterns. Fast zwanzig Jahre

Der Webservice correspSearch wurde entwickelt um ein lange bestehendes Desiderat von Briefeditionen zu beheben: Die edierten Briefe editionsübergreifend durchsuchen zu

DisKo steht für Diversitäts-Korpus und ist ein literaturwissenschaftliches Projekt mit Digital-Humanities-Komponente. Mit Methoden des maschinellen Lernens wollen wir einen Algorithmus

Das MultiHTR-Team setzt die Ergebnisse der ersten erfolgreichen Projektphase (01. Juni 2020 bis 31. Mai 2022) fort, um in der

Das Projekt erarbeitet eine Neuedition der fränkischen Herrschererlasse („Kapitularien”), die zu den zentralen Rechtsquellen des europäischen Mittelalters gehören. Zum einen werden die Herrschererlasse als Einzelstücke kritisch ediert und in ihrer rekonstruierten Form mit Übersetzung in Buchform publiziert; zum anderen die für die Wirkungs- und Rezeptionsgeschichte zentralen Sammlungen erschlossen und in einer digitalen Edition für die Forschung zugänglich gemacht.
Wir verwenden Cookies und ähnliche Funktionen zur Verarbeitung von Daten. Die Zustimmung ist freiwillig und kann jederzeit widerrufen werden.