
Das DTA ist ein Archiv für deutschsprachige, historische Textsammlungen an der Berlin-Brandenburgischen Akademie der Wissenschaften. Es umfasst annotierte Volltexttranskriptionen von
Kurzbeschreibung des Projekts
Annotieren, Analysieren, Interpretieren und Visualisieren: In CATMA können Textwissenschaftler:innen so arbeiten, wie es ihren Fragestellungen am besten entspricht: qualitativ oder quantitativ, bottom-up und explorativ oder deskriptiv und taxonomiebasiert, einzeln oder im Team. Das webbasierte Open Source Tool ist kostenfrei und bietet außerdem die Möglichkeit, eigene Daten zu exportieren, um sie zum Beispiel mit anderen Tools weiter zu verarbeiten.
Das Tool wird seit 2008 kontinuierlich weiterentwickelt. CATMA 7 wurde innerhalb des von der Stiftung Innovation in der Hochschullehre (StIL) geförderten Projektes forTEXT Portal (https://fortext.net) entwickelt und im Mai 2023 veröffentlicht.
Projektinhalt
CATMA kennt kein Dogma, ist Open Source, kostenlos verfügbar und webbasiert. Das Annotationstool ist projektzentriert und erlaubt das Arbeiten mit Texten in allen gängigen Dateiformaten und in den meisten Sprachen, inkl. Sprachen, die von rechts nach links geschrieben werden. Nutzer:innen können ihr eigenes Korpus hochladen, es mit einem Team teilen und kollaborativ an ihm arbeiten. Es können beliebig viele Projekte erstellt werden.
Es gibt in CATMA neben dem Projektmodul drei wesentliche Arbeitsbereiche: „Annotate“, „Tags“ und „Analyze“:
Texte, Annotationen, Abfrage-Ergebnisse und Visualisierungen können in unterschiedlichen Formaten exportiert werden. Außerdem ist der Zugriff auf die “rohen” Daten jederzeit gewährleistet.
Das erstmals 2021 veröffentlichte Python-Package GitMA, welches als Erweiterung von CATMA angesehen werden kann, nutzt den oben genannten Zugriff auf die rohen Daten, um — mithilfe von gängigen Python Data-Science-Tools — die weitere Prozessierung, Analyse und Manipulation dieser Daten zu ermöglichen. Dazu gehören vor allem Funktionen, die den (visuellen) Vergleich von Annotationen verschiedener Annotator:innen, die Berechnung von Inter-Annotator-Agreement-Werten und die Erstellung von Gold-Annotationen ermöglichen.
Auf der zugehörigen CATMA-Webseite finden sich FAQs, Tutorials, ein Manual, ein Glossar sowie umfassende Informationen zur technischen Dokumentation und Kontaktinformationen für den Nutzer:innen-Support.
Malte Meister
Technische Universität Darmstadt
Institut für Sprach- und Literaturwissenschaft
Residenzschloss 1
64283 Darmstadt
E-Mail: team@catma.de
Erfahren Sie mehr unter
Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.
Das DTA ist ein Archiv für deutschsprachige, historische Textsammlungen an der Berlin-Brandenburgischen Akademie der Wissenschaften. Es umfasst annotierte Volltexttranskriptionen von
Von 1958 bis 1973 lebte und arbeitete der anglo-amerikanische Dichter Wystan Hugh Auden (1907-1973) viele Monate im Jahr im niederösterreichischen
Die Website schafft einen schnellen und unkomplizierten Zugang zu den Werkmaterialien des österreichischen Literaturnobelpreisträgers Peter Handke.
Das Hamburger Zentrum für Sprachkorpora berät und unterstützt bei der Erstellung und Nutzung digitaler Sprachkorpora in Forschung und Lehre: Es
Das Trierer Wörterbuchnetz bietet Zugriff auf mehr als 40 Wörterbücher und Nachschlagewerke, die entweder einzeln aufgerufen oder mittels einer übergreifenden
Das von der Deutschen Forschungsgemeinschaft geförderte Projekt Diccionario del Español Medieval electrónico (DEMel) hat zum Ziel, der Öffentlichkeit ein lemmatisiertes
In Kooperation zwischen der Universität Hamburg und der Staats- und Universitätsbibliothek Hamburg werden die ca. 35.000 handschriftlichen Originalbriefe des Dehmel-Archivs
Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) wird seit 2008 am Leibniz-Institut für Deutsche Sprache aufgebaut. Das Korpus enthält Audio- und Videoaufnahmen von natürlichen Interaktionen aus unterschiedlichsten Bereichen des gesellschaftlichen Lebens (Arbeit, Freizeit, Bildung, öffentliches Leben, Dienstleistungen usw.) im deutschen Sprachraum.