
DARIAH-DE (gefördert 2011-2019) unterstützt die mit digitalen Ressourcen und Methoden arbeitenden Geistes- und Kulturwissenschaftler/innen in Forschung und Lehre. Dazu baut
Kurzbeschreibung des Projekts
ELAN wird am Max-Planck-Institut für Psycholinguistik im Sprach-Archiv (TLA – The Language Archive) entwickelt. Es wird in der Programmiersprache Java geschrieben, die Quellen sind erhältlich für non-kommerzielle und kommerzielle Zwecken. Mit ELAN kann ein Benutzer eine unbegrenzte Anzahl von Annotationen zu primären Audio- und Video-Daten erstellen. Eine Annotation kann z.B. ein Satz, Wort oder Morphem sein, oder eine Glosse, ein Kommentar, eine Übersetzung, oder ein Tag oder Beschreibung irgendeine Feature, die in den Medien beobachtet wurde.
Projektinhalt
Annotationen können mit sogenannten Tiers vielschichtig erstellt werden. Diese Tiers können dabei hierarchisch miteinander verbunden sein. Auf einem separaten Tier sind Annotationen zeitlich synchron zu den Medien angeordnet – der Benutzer bestimmt oder verändert Start- und Endpunkt jeder Annotation. Auf abhängigen Tiers, weiter unten in der Hierarchie, beziehen Annotationen sich auf andere existierende Annotationen, hierbei können sie entweder dieselben Start- und Endzeiten nutzen (eins-zu-eins-Beziehung), oder den Zeitabschnitt einer Annotation auf einem Tier, der höher in der Hierarchie steht, weiter unterteilen (1:n-Beziehung). Ein Tier kann zum Beispiel Annotationen mit Satz-bezogenen Transkriptionen beinhalten, und abhängige eins-zu-eins-Tiers können Übersetzungen in andere Sprachen beinhalten. Oder eine abhängiger 1:n- Tier beinhaltet eine Annotation für jedes Wort oder jedes Morphem des Tiers auf der höheren Ebene, und ein weiterer beinhaltet gleichzeitig ein Glossierung für jedes Wort oder Morphem. Zahlreiche 1:n-Beziehungen sind möglich, z.B. davon abhängend ob innere Start- und Endzeiten auf den abhängigen Tiers bestimmt werden können. Diese Flexibilität innerhalb der Tier-Relationen erlaubt es, die komplexen ontologischen Verhältnisse von Features zu modellieren, die auf verschiedenen Tiers annotiert werden. Die hierarchischen Konfigurationen können wieder für verschiedene Sprecher verwandt werden und sogar als Vorlage für die Erstellung von neuen Annotations-Dokumenten dienen. Annotationen können durch die Benutzung einer Einzel- oder Multi-Tier-Suche mit regulären Ausdrücken durchsucht werden, innerhalb eines einzelnen Dokuments oder über eine Auswahl von Annotations-Dokumenten. Die Annotationen werden immer in separaten Dateien, unabhängig von den zugehörigen Multimedia-Dateien, erstellt und gespeichert; Letztere bleiben unverändert. Der textuelle Inhalt von Annotationen ist immer in Unicode gehalten und die Annotations-Dateien sind in einem speziellen XML-Format gespeichert, dem “EAF” (ELAN Annotation Format). Wenn die Dateien in The Language Archive archiviert sind, können ELAN-Daten zusammen mit den zugehörigen Mediendateien online in einem Web-Browser angezeigt werden.
Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.
DARIAH-DE (gefördert 2011-2019) unterstützt die mit digitalen Ressourcen und Methoden arbeitenden Geistes- und Kulturwissenschaftler/innen in Forschung und Lehre. Dazu baut
Das Ziel der Bibliotheca legum ist es, einen Überblick über die handschriftliche Produktion weltlichen Rechts in der Karolingerzeit zu geben.
Das Projekt aggregiert Informationen zu digitalen Projekten und Konsortien, die sich im weitesten Sinne mit nicht-lateinischen Schriften beschäftigen. Die gesammelten
Das Hidden Kosmos – Reconstructing Alexander von Humboldt’s »Kosmos-Lectures« widmete sich von 2014–16 der Ermittlung und Verzeichnung, Bild- und Volltext-Digitalisierung
Die Virtuelle Forschungsumgebung TextGrid ist optimiert für die digitale Erschließung geisteswissenschaftlicher Quellen und deren langfristige Archivierung in einem Web-Archiv, insbesondere
CLARIAH-DE ist ein Beitrag zur digitalen Forschungsinfrastruktur für die Geisteswissenschaften und benachbarte Disziplinen. Durch die Zusammenführung der Verbünde CLARIN-D und
Das DTA ist ein Archiv für deutschsprachige, historische Textsammlungen an der Berlin-Brandenburgischen Akademie der Wissenschaften. Es umfasst annotierte Volltexttranskriptionen von Drucken, Zeitungen, Zeitschriften sowie handgeschriebene Dokumente verschiedener Gattungen und Textarten. Für die Transkriptionen steht mit dem DTABf ein etabliertes Basisformat zur Verfügung.
Das Hamburger Zentrum für Sprachkorpora berät und unterstützt bei der Erstellung und Nutzung digitaler Sprachkorpora in Forschung und Lehre: Es versteht sich als Kompetenzzentrum, das technische, methodische und organisatorische Expertise für die Arbeit mit Sprachkorpora aufbaut und bündelt.
Wir verwenden Cookies und ähnliche Funktionen zur Verarbeitung von Daten. Die Zustimmung ist freiwillig und kann jederzeit widerrufen werden.