
Das DTA ist ein Archiv für deutschsprachige, historische Textsammlungen an der Berlin-Brandenburgischen Akademie der Wissenschaften. Es umfasst annotierte Volltexttranskriptionen von
Kurzbeschreibung des Projekts
Annotieren, Analysieren, Interpretieren und Visualisieren: In CATMA können Textwissenschaftler:innen so arbeiten, wie es ihren Fragestellungen am besten entspricht: qualitativ oder quantitativ, bottom-up und explorativ oder deskriptiv und taxonomiebasiert, einzeln oder im Team. Das webbasierte Open Source Tool ist kostenfrei und bietet außerdem die Möglichkeit, eigene Daten zu exportieren, um sie zum Beispiel mit anderen Tools weiter zu verarbeiten.
Das Tool wird seit 2008 kontinuierlich weiterentwickelt. CATMA 7 wurde innerhalb des von der Stiftung Innovation in der Hochschullehre (StIL) geförderten Projektes forTEXT Portal (https://fortext.net) entwickelt und im Mai 2023 veröffentlicht.
Projektinhalt
CATMA kennt kein Dogma, ist Open Source, kostenlos verfügbar und webbasiert. Das Annotationstool ist projektzentriert und erlaubt das Arbeiten mit Texten in allen gängigen Dateiformaten und in den meisten Sprachen, inkl. Sprachen, die von rechts nach links geschrieben werden. Nutzer:innen können ihr eigenes Korpus hochladen, es mit einem Team teilen und kollaborativ an ihm arbeiten. Es können beliebig viele Projekte erstellt werden.
Es gibt in CATMA neben dem Projektmodul drei wesentliche Arbeitsbereiche: „Annotate“, „Tags“ und „Analyze“:
Texte, Annotationen, Abfrage-Ergebnisse und Visualisierungen können in unterschiedlichen Formaten exportiert werden. Außerdem ist der Zugriff auf die “rohen” Daten jederzeit gewährleistet.
Das erstmals 2021 veröffentlichte Python-Package GitMA, welches als Erweiterung von CATMA angesehen werden kann, nutzt den oben genannten Zugriff auf die rohen Daten, um — mithilfe von gängigen Python Data-Science-Tools — die weitere Prozessierung, Analyse und Manipulation dieser Daten zu ermöglichen. Dazu gehören vor allem Funktionen, die den (visuellen) Vergleich von Annotationen verschiedener Annotator:innen, die Berechnung von Inter-Annotator-Agreement-Werten und die Erstellung von Gold-Annotationen ermöglichen.
Auf der zugehörigen CATMA-Webseite finden sich FAQs, Tutorials, ein Manual, ein Glossar sowie umfassende Informationen zur technischen Dokumentation und Kontaktinformationen für den Nutzer:innen-Support.
Malte Meister
Technische Universität Darmstadt
Institut für Sprach- und Literaturwissenschaft
Residenzschloss 1
64283 Darmstadt
E-Mail: team@catma.de
Erfahren Sie mehr unter
Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.
Das DTA ist ein Archiv für deutschsprachige, historische Textsammlungen an der Berlin-Brandenburgischen Akademie der Wissenschaften. Es umfasst annotierte Volltexttranskriptionen von
Publikation der Daten zu Textzeugen des altägyptischen Totenbuchs aus dem Akademievorhaben „Altägyptisches Totenbuch“ (1994/2004–2012). Das 2012 veröffentlichte Portal bietet Beschreibungen,
Das DARIAH-DE Repository ist eine zentrale Komponente der DARIAH-DE Forschungsdaten-Föderationsarchitektur, die verschiedene Dienste und Anwendungen aggregiert und so komfortabel nutzbar
is in die 1990er Jahre war es in der Filmwissenschaft ein Gemeinplatz, dass Frauen in den Anfangsjahren der Filmproduktion nur
Der DARIAH-DE Geo-Browser ermöglicht eine vergleichende Visualisierung mehrerer Anfragen und unterstützt die Darstellung von Daten und deren Visualisierung in einer
Nachhaltiges Forschungsdatenmanagement ist zentral für künftige Forschungen! Dies zeigt etwa die Geschichte der Bonner Längsschnittstudie des Alterns. Fast zwanzig Jahre
GAMS ist ein OAIS-konformes Repositorium zur Verwaltung, Publikation und Langzeitarchivierung digitaler Ressourcen aus allen geisteswissenschaftlichen Fächern.
Das Portal Revistas culturales 2.0 dient als virtuelle Forschungsumgebung für alle Interessenten, die sich mit historischen Zeitschriften aus dem spanischsprachigen Kulturkreis beschäftigen.
Wir verwenden Cookies und ähnliche Funktionen zur Verarbeitung von Daten. Die Zustimmung ist freiwillig und kann jederzeit widerrufen werden.