
Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) wird seit 2008 am Leibniz-Institut für Deutsche Sprache aufgebaut. Das Korpus enthält Audio-
Kurzbeschreibung des Projekts
ELAN wird am Max-Planck-Institut für Psycholinguistik im Sprach-Archiv (TLA – The Language Archive) entwickelt. Es wird in der Programmiersprache Java geschrieben, die Quellen sind erhältlich für non-kommerzielle und kommerzielle Zwecken. Mit ELAN kann ein Benutzer eine unbegrenzte Anzahl von Annotationen zu primären Audio- und Video-Daten erstellen. Eine Annotation kann z.B. ein Satz, Wort oder Morphem sein, oder eine Glosse, ein Kommentar, eine Übersetzung, oder ein Tag oder Beschreibung irgendeine Feature, die in den Medien beobachtet wurde.
Projektinhalt
Annotationen können mit sogenannten Tiers vielschichtig erstellt werden. Diese Tiers können dabei hierarchisch miteinander verbunden sein. Auf einem separaten Tier sind Annotationen zeitlich synchron zu den Medien angeordnet – der Benutzer bestimmt oder verändert Start- und Endpunkt jeder Annotation. Auf abhängigen Tiers, weiter unten in der Hierarchie, beziehen Annotationen sich auf andere existierende Annotationen, hierbei können sie entweder dieselben Start- und Endzeiten nutzen (eins-zu-eins-Beziehung), oder den Zeitabschnitt einer Annotation auf einem Tier, der höher in der Hierarchie steht, weiter unterteilen (1:n-Beziehung). Ein Tier kann zum Beispiel Annotationen mit Satz-bezogenen Transkriptionen beinhalten, und abhängige eins-zu-eins-Tiers können Übersetzungen in andere Sprachen beinhalten. Oder eine abhängiger 1:n- Tier beinhaltet eine Annotation für jedes Wort oder jedes Morphem des Tiers auf der höheren Ebene, und ein weiterer beinhaltet gleichzeitig ein Glossierung für jedes Wort oder Morphem. Zahlreiche 1:n-Beziehungen sind möglich, z.B. davon abhängend ob innere Start- und Endzeiten auf den abhängigen Tiers bestimmt werden können. Diese Flexibilität innerhalb der Tier-Relationen erlaubt es, die komplexen ontologischen Verhältnisse von Features zu modellieren, die auf verschiedenen Tiers annotiert werden. Die hierarchischen Konfigurationen können wieder für verschiedene Sprecher verwandt werden und sogar als Vorlage für die Erstellung von neuen Annotations-Dokumenten dienen. Annotationen können durch die Benutzung einer Einzel- oder Multi-Tier-Suche mit regulären Ausdrücken durchsucht werden, innerhalb eines einzelnen Dokuments oder über eine Auswahl von Annotations-Dokumenten. Die Annotationen werden immer in separaten Dateien, unabhängig von den zugehörigen Multimedia-Dateien, erstellt und gespeichert; Letztere bleiben unverändert. Der textuelle Inhalt von Annotationen ist immer in Unicode gehalten und die Annotations-Dateien sind in einem speziellen XML-Format gespeichert, dem “EAF” (ELAN Annotation Format). Wenn die Dateien in The Language Archive archiviert sind, können ELAN-Daten zusammen mit den zugehörigen Mediendateien online in einem Web-Browser angezeigt werden.
Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.
Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) wird seit 2008 am Leibniz-Institut für Deutsche Sprache aufgebaut. Das Korpus enthält Audio-
Das von der Deutschen Forschungsgemeinschaft geförderte Projekt Diccionario del Español Medieval electrónico (DEMel) hat zum Ziel, der Öffentlichkeit ein lemmatisiertes
Das Heinrich-Heine-Portal schöpft aus den Arbeitsergebnissen mehrerer Forschergenerationen, indem es die beiden historisch-kritischen Heine-Gesamtausgaben, die unabhängig voneinander in der Bundesrepublik
ZenMEM ist ein dezidiert offener Verbund von Wissenschaftler*innen und darum bemüht, gemeinsam neue, digital gestützte Forschungsmöglichkeiten im Bereich der Kulturwissenschaften
Das MultiHTR-Team setzt die Ergebnisse der ersten erfolgreichen Projektphase (01. Juni 2020 bis 31. Mai 2022) fort, um in der
Das Ziel der Bibliotheca legum ist es, einen Überblick über die handschriftliche Produktion weltlichen Rechts in der Karolingerzeit zu geben.
Im Zentrum steht die Erforschung digitaler, datenintensiver Medien, die sich auf breiter Front als kooperative Werkzeuge, Plattformen und Infrastrukturen herausgestellt haben und im Kontext ubiquitärer Verdatung durch Sensortechnologien und semi-autonom operierender künstlicher Intelligenz auf neue Weise virulent werden. In diesem Spannungsfeld leistet der SFB digitale Grundlagenforschung, die zwischen Geschichte und Gegenwart vermittelt und zukünftige digitale Medien gestaltet.
In einem langfristigen Kooperationsprojekt von Österreichischer Nationalbibliothek und Deutschem Literaturarchiv Marbach werden alle bis 1990 entstandenen 75 Notizbücher in einer kommentierten digitalen Edition erstmals veröffentlicht und frei zugänglich gemacht.
Wir verwenden Cookies und ähnliche Funktionen zur Verarbeitung von Daten. Die Zustimmung ist freiwillig und kann jederzeit widerrufen werden.