
Die drei von Text+ adressierten Datendomänen Sammlungen, lexikalische Ressourcen und Editionen gehören zu den klassischen Feldern geisteswissenschaftlicher Forschung. Das Plus-Zeichen
Kurzbeschreibung des Projekts
Annotieren, Analysieren, Interpretieren und Visualisieren: In CATMA können Textwissenschaftler:innen so arbeiten, wie es ihren Fragestellungen am besten entspricht: qualitativ oder quantitativ, bottom-up und explorativ oder deskriptiv und taxonomiebasiert, einzeln oder im Team. Das webbasierte Open Source Tool ist kostenfrei und bietet außerdem die Möglichkeit, eigene Daten zu exportieren, um sie zum Beispiel mit anderen Tools weiter zu verarbeiten.
Das Tool wird seit 2008 kontinuierlich weiterentwickelt. CATMA 7 wurde innerhalb des von der Stiftung Innovation in der Hochschullehre (StIL) geförderten Projektes forTEXT Portal (https://fortext.net) entwickelt und im Mai 2023 veröffentlicht.
Projektinhalt
CATMA kennt kein Dogma, ist Open Source, kostenlos verfügbar und webbasiert. Das Annotationstool ist projektzentriert und erlaubt das Arbeiten mit Texten in allen gängigen Dateiformaten und in den meisten Sprachen, inkl. Sprachen, die von rechts nach links geschrieben werden. Nutzer:innen können ihr eigenes Korpus hochladen, es mit einem Team teilen und kollaborativ an ihm arbeiten. Es können beliebig viele Projekte erstellt werden.
Es gibt in CATMA neben dem Projektmodul drei wesentliche Arbeitsbereiche: „Annotate“, „Tags“ und „Analyze“:
Texte, Annotationen, Abfrage-Ergebnisse und Visualisierungen können in unterschiedlichen Formaten exportiert werden. Außerdem ist der Zugriff auf die “rohen” Daten jederzeit gewährleistet.
Das erstmals 2021 veröffentlichte Python-Package GitMA, welches als Erweiterung von CATMA angesehen werden kann, nutzt den oben genannten Zugriff auf die rohen Daten, um — mithilfe von gängigen Python Data-Science-Tools — die weitere Prozessierung, Analyse und Manipulation dieser Daten zu ermöglichen. Dazu gehören vor allem Funktionen, die den (visuellen) Vergleich von Annotationen verschiedener Annotator:innen, die Berechnung von Inter-Annotator-Agreement-Werten und die Erstellung von Gold-Annotationen ermöglichen.
Auf der zugehörigen CATMA-Webseite finden sich FAQs, Tutorials, ein Manual, ein Glossar sowie umfassende Informationen zur technischen Dokumentation und Kontaktinformationen für den Nutzer:innen-Support.
Malte Meister
Technische Universität Darmstadt
Institut für Sprach- und Literaturwissenschaft
Residenzschloss 1
64283 Darmstadt
E-Mail: team@catma.de
Erfahren Sie mehr unter
Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.
Die drei von Text+ adressierten Datendomänen Sammlungen, lexikalische Ressourcen und Editionen gehören zu den klassischen Feldern geisteswissenschaftlicher Forschung. Das Plus-Zeichen
ELAN wird am Max-Planck-Institut für Psycholinguistik im Sprach-Archiv (TLA – The Language Archive) entwickelt. Es wird in der Programmiersprache Java
Das MultiHTR-Team setzt die Ergebnisse der ersten erfolgreichen Projektphase (01. Juni 2020 bis 31. Mai 2022) fort, um in der
Das Hidden Kosmos – Reconstructing Alexander von Humboldt’s »Kosmos-Lectures« widmete sich von 2014–16 der Ermittlung und Verzeichnung, Bild- und Volltext-Digitalisierung
Das Projekt aggregiert Informationen zu digitalen Projekten und Konsortien, die sich im weitesten Sinne mit nicht-lateinischen Schriften beschäftigen. Die gesammelten
Das von der NRW Akademie der Wissenschaften und der Künste sowie der Union der Deutschen Akademien finanzierte Langzeitprojekt an der
Die im aschkenasischen Europa und Norditalien verbreiteten Pinkasim – Protokollbücher jüdischer Gemeinden – sind zentrale Quellen zur Erforschung der jüdischen Geschichte und Kultur der Frühen Neuzeit. Bisher weit verstreut über Archive und Sammlungen in Israel, Europa und den Vereinigten Staaten, wurden die Gemeindepinkasim im Rahmen des Projekts digitalisiert und in einem Onlinearchiv zugänglich gemacht.
Der Webservice correspSearch wurde entwickelt um ein lange bestehendes Desiderat von Briefeditionen zu beheben: Die edierten Briefe editionsübergreifend durchsuchen zu
Wir verwenden Cookies und ähnliche Funktionen zur Verarbeitung von Daten. Die Zustimmung ist freiwillig und kann jederzeit widerrufen werden.