CATMA

Fachliche Zuordnung

Literaturwissenschaft

Projektkategorie

Projektzeitraum

11/2008 – 03/2026

Projektstart: 11/2008 – Projektende: 03/2026

Kurzbeschreibung des Projekts

Annotieren, Analysieren, Interpretieren und Visualisieren: In CATMA können Textwissenschaftler:innen so arbeiten, wie es ihren Fragestellungen am besten entspricht: qualitativ oder quantitativ, bottom-up und explorativ oder deskriptiv und taxonomiebasiert, einzeln oder im Team. Das webbasierte Open Source Tool ist kostenfrei und bietet außerdem die Möglichkeit, eigene Daten zu exportieren, um sie zum Beispiel mit anderen Tools weiter zu verarbeiten.
Das Tool wird seit 2008 kontinuierlich weiterentwickelt. CATMA 7 wurde innerhalb des von der Stiftung Innovation in der Hochschullehre (StIL) geförderten Projektes forTEXT Portal (https://fortext.net) entwickelt und im Mai 2023 veröffentlicht.

Projektinhalt

CATMA kennt kein Dogma, ist Open Source, kostenlos verfügbar und webbasiert. Das Annotationstool ist projektzentriert und erlaubt das Arbeiten mit Texten in allen gängigen Dateiformaten und in den meisten Sprachen, inkl. Sprachen, die von rechts nach links geschrieben werden. Nutzer:innen können ihr eigenes Korpus hochladen, es mit einem Team teilen und kollaborativ an ihm arbeiten. Es können beliebig viele Projekte erstellt werden.

Es gibt in CATMA neben dem Projektmodul drei wesentliche Arbeitsbereiche: „Annotate“, „Tags“ und „Analyze“:

„Annotate“: Annotationen sind für die gesamte geisteswissenschaftliche Forschung von grundlegender Bedeutung. Ein Teil davon ist deklarativ und taxonomiegetrieben, aber oft auch interpretativer oder explorativer Natur. CATMA schreibt in dieser Hinsicht nichts vor und ermöglicht es, Texte bei Bedarf undogmatisch zu annotieren: mehrfach, überlappend, kurz, umfangreich, diskontinuierlich oder sogar in widersprüchlichen Varianten – CATMA-Annotationen können viele Formen annehmen. Mithilfe eines Kommentar-Features können Textstellen oder Annotationen beschrieben oder Anmerkungen dokumentiert werden. Auch der direkte Austausch mit dem Team ist hierüber möglich.
„Tags“: CATMA ermöglicht es, eigene Tagsets zu entwickeln oder ein bestehendes zu importieren. Egal, ob taxonomiebasiert gearbeitet wird oder Kategorien spontan erstellt werden sollen: CATMA unterstützt beide Ansätze. Die eigene Textinterpretation kann bottom-up oder top-down vor dem Hintergrund einer vordefinierten Theorie und Taxonomie entwickelt werden.
Im quantifizierenden „Analyze“-Modul bietet CATMA eine normalsprachliche Unterstützung bei der Erstellung von Textanalyse-Queries sowie eine Auswahl an verschiedenen interaktiven Visualisierungen (KeyWord in Context (KWIC), Word- oder Tagcloud, Distribution Graph und Double Tree). Jede Visualisierung bietet den direkten Weg zurück zum Ausgangstext.

Texte, Annotationen, Abfrage-Ergebnisse und Visualisierungen können in unterschiedlichen Formaten exportiert werden. Außerdem ist der Zugriff auf die “rohen” Daten jederzeit gewährleistet.

Das erstmals 2021 veröffentlichte Python-Package GitMA, welches als Erweiterung von CATMA angesehen werden kann, nutzt den oben genannten Zugriff auf die rohen Daten, um — mithilfe von gängigen Python Data-Science-Tools — die weitere Prozessierung, Analyse und Manipulation dieser Daten zu ermöglichen. Dazu gehören vor allem Funktionen, die den (visuellen) Vergleich von Annotationen verschiedener Annotator:innen, die Berechnung von Inter-Annotator-Agreement-Werten und die Erstellung von Gold-Annotationen ermöglichen.

Auf der zugehörigen CATMA-Webseite finden sich FAQs, Tutorials, ein Manual, ein Glossar sowie umfassende Informationen zur technischen Dokumentation und Kontaktinformationen für den Nutzer:innen-Support.

Förderung

Stiftung Innovation in der Hochschullehre, Deutsche Forschungsgemeinschaft (DFG)

Fachliche Zuordnung

Literaturwissenschaft

Projektkategorie

Kontakt

Malte Meister
Technische Universität Darmstadt
Institut für Sprach- und Literaturwissenschaft
Residenzschloss 1
64283 Darmstadt
E-Mail: team@catma.de

Erfahren Sie mehr unter

https://catma.de

Projektmitarbeitende

Evelyn Gius, Malte Meister, Mari Akazawa und Dominik Gerstorfer

Neues Projekt anmelden

Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.

Weitere Projekte

Dietrich online

Mit Dietrich online werden bibliographische Angaben zu ca. 5. Mio im deutschen Sprachraum von 1897- 1944 erschienenen Zeitschriftenaufsätzen und Zeitungsartikeln

Weiterlesen →

Das Akademienvorhaben hat die philologische Erschließung und kritische Edition antiker und byzantinischer Kommentare, Paraphrasen, Kompendien und Scholien zu den Schriften

Weiterlesen →

ELAN wird am Max-Planck-Institut für Psycholinguistik im Sprach-Archiv (TLA – The Language Archive) entwickelt. Es wird in der Programmiersprache Java

Weiterlesen →

Der Webservice correspSearch wurde entwickelt um ein lange bestehendes Desiderat von Briefeditionen zu beheben: Die edierten Briefe editionsübergreifend durchsuchen zu

Weiterlesen →

CLARIAH-DE ist ein Beitrag zur digitalen Forschungsinfrastruktur für die Geisteswissenschaften und benachbarte Disziplinen. Durch die Zusammenführung der Verbünde CLARIN-D und

Weiterlesen →

Zentrum Musik – Edition – Medien (ZenMEM)

ZenMEM ist ein dezidiert offener Verbund von Wissenschaftler*innen und darum bemüht, gemeinsam neue, digital gestützte Forschungsmöglichkeiten im Bereich der Kulturwissenschaften

Weiterlesen →

Bibliotheca legum

Das Ziel der Bibliotheca legum ist es, einen Überblick über die handschriftliche Produktion weltlichen Rechts in der Karolingerzeit zu geben. Die Bibliotheca präsentiert Beschreibungen (nach TEI P5) aller Handschriften, die weltliche Rechtstexte (leges) enthalten sowie weitere kontextualisierende Materialien.

Weiterlesen →

CLARIAH-DE

CLARIAH-DE ist ein Beitrag zur digitalen Forschungsinfrastruktur für die Geisteswissenschaften und benachbarte Disziplinen. Durch die Zusammenführung der Verbünde CLARIN-D und

Weiterlesen →