
Annotieren, Analysieren, Interpretieren und Visualisieren: In CATMA können Textwissenschaftler:innen so arbeiten, wie es ihren Fragestellungen am besten entspricht: qualitativ oder
Kurzbeschreibung des Projekts
ELAN wird am Max-Planck-Institut für Psycholinguistik im Sprach-Archiv (TLA – The Language Archive) entwickelt. Es wird in der Programmiersprache Java geschrieben, die Quellen sind erhältlich für non-kommerzielle und kommerzielle Zwecken. Mit ELAN kann ein Benutzer eine unbegrenzte Anzahl von Annotationen zu primären Audio- und Video-Daten erstellen. Eine Annotation kann z.B. ein Satz, Wort oder Morphem sein, oder eine Glosse, ein Kommentar, eine Übersetzung, oder ein Tag oder Beschreibung irgendeine Feature, die in den Medien beobachtet wurde.
Projektinhalt
Annotationen können mit sogenannten Tiers vielschichtig erstellt werden. Diese Tiers können dabei hierarchisch miteinander verbunden sein. Auf einem separaten Tier sind Annotationen zeitlich synchron zu den Medien angeordnet – der Benutzer bestimmt oder verändert Start- und Endpunkt jeder Annotation. Auf abhängigen Tiers, weiter unten in der Hierarchie, beziehen Annotationen sich auf andere existierende Annotationen, hierbei können sie entweder dieselben Start- und Endzeiten nutzen (eins-zu-eins-Beziehung), oder den Zeitabschnitt einer Annotation auf einem Tier, der höher in der Hierarchie steht, weiter unterteilen (1:n-Beziehung). Ein Tier kann zum Beispiel Annotationen mit Satz-bezogenen Transkriptionen beinhalten, und abhängige eins-zu-eins-Tiers können Übersetzungen in andere Sprachen beinhalten. Oder eine abhängiger 1:n- Tier beinhaltet eine Annotation für jedes Wort oder jedes Morphem des Tiers auf der höheren Ebene, und ein weiterer beinhaltet gleichzeitig ein Glossierung für jedes Wort oder Morphem. Zahlreiche 1:n-Beziehungen sind möglich, z.B. davon abhängend ob innere Start- und Endzeiten auf den abhängigen Tiers bestimmt werden können. Diese Flexibilität innerhalb der Tier-Relationen erlaubt es, die komplexen ontologischen Verhältnisse von Features zu modellieren, die auf verschiedenen Tiers annotiert werden. Die hierarchischen Konfigurationen können wieder für verschiedene Sprecher verwandt werden und sogar als Vorlage für die Erstellung von neuen Annotations-Dokumenten dienen. Annotationen können durch die Benutzung einer Einzel- oder Multi-Tier-Suche mit regulären Ausdrücken durchsucht werden, innerhalb eines einzelnen Dokuments oder über eine Auswahl von Annotations-Dokumenten. Die Annotationen werden immer in separaten Dateien, unabhängig von den zugehörigen Multimedia-Dateien, erstellt und gespeichert; Letztere bleiben unverändert. Der textuelle Inhalt von Annotationen ist immer in Unicode gehalten und die Annotations-Dateien sind in einem speziellen XML-Format gespeichert, dem “EAF” (ELAN Annotation Format). Wenn die Dateien in The Language Archive archiviert sind, können ELAN-Daten zusammen mit den zugehörigen Mediendateien online in einem Web-Browser angezeigt werden.
Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.

Annotieren, Analysieren, Interpretieren und Visualisieren: In CATMA können Textwissenschaftler:innen so arbeiten, wie es ihren Fragestellungen am besten entspricht: qualitativ oder

Das forTEXT Portal bietet einsteigerfreundlich aufbereitete, zitierfähige Methodenbeschreibungen und Reviews von Textsammlungen und Tools – von Digitalisierung über Annotation zu

Das Akademienvorhaben hat die philologische Erschließung und kritische Edition antiker und byzantinischer Kommentare, Paraphrasen, Kompendien und Scholien zu den Schriften

Das DTA ist ein Archiv für deutschsprachige, historische Textsammlungen an der Berlin-Brandenburgischen Akademie der Wissenschaften. Es umfasst annotierte Volltexttranskriptionen von

Das von der NRW Akademie der Wissenschaften und der Künste sowie der Union der Deutschen Akademien finanzierte Langzeitprojekt an der

Die digitale Ausgabe der Werke Friedrichs des Großen der Universitätsbibliothek Trier bietet eine XML-konforme und recherchierbare elektronische Volltextversion der von

Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) wird seit 2008 am Leibniz-Institut für Deutsche Sprache aufgebaut. Das Korpus enthält Audio- und Videoaufnahmen von natürlichen Interaktionen aus unterschiedlichsten Bereichen des gesellschaftlichen Lebens (Arbeit, Freizeit, Bildung, öffentliches Leben, Dienstleistungen usw.) im deutschen Sprachraum.

Das Projekt aggregiert Informationen zu digitalen Projekten und Konsortien, die sich im weitesten Sinne mit nicht-lateinischen Schriften beschäftigen. Die gesammelten Daten werden visualisiert und sollen Aussagen darüber treffen, was nötig ist, damit sich die Bedingungen für die Arbeit mit NLS im Bereich Digital Humanities bessern. Zusätzlich dient das Projekt als Knowledgebase für Forscher:innen, die sich einen Eindruck über den state of the field machen wollen. Das Projekt stellt alle Forschungsdaten, den Code und die Workflows im Open Access über GitHub zur Verfügung.
Wir verwenden Cookies und ähnliche Funktionen zur Verarbeitung von Daten. Die Zustimmung ist freiwillig und kann jederzeit widerrufen werden.