
Im Zentrum steht die Erforschung digitaler, datenintensiver Medien, die sich auf breiter Front als kooperative Werkzeuge, Plattformen und Infrastrukturen herausgestellt
Short description of the project
We are building a diversity corpus (DisKo) as the basis for the algorithmic text analysis. DisKo comprises narrative texts written in the last 100 years in which not only male, female and neutral roles occur, but also descriptions of non-binary characters. The corpus serves as training material for a classifier for the automated analysis of gender roles in German-language literary texts.
Project content
DisKo stands for Diversity Corpus (German: Diversitätskorpus) and is a project in the field of Computational Literary Studies. We use machine learning to train an algorithm that not only recognises female, male and neutral roles in literary texts, but also less binary gender attributions. For this training process, we first need a training corpus that is as diverse as possible and consists of texts in which non-binary gender attributions occur. As part of a public humanities concept, as many different groups of readers as possible are involved in the acquisition of the corpus. The more diverse the people involved in the creation of the corpus, the more diverse the texts in our training corpus will ultimately be. This diversity is important in order to make gender diversity visible with our digital humanities approach. The central component of the project is a survey in which you can submit your text references. Do you know of literary works in which characters are not described stereotypically, but in a diverse way? Then take part in our survey via the link, enter text suggestions and help us to build up a diversity corpus: https://public.zenkit.com/f/klZHAjPGg/disko?v=xQoeCRIop
Add your DH research project to the project showcase by submitting a short project description via the web form. Enter project data, a brief description, a graphic or visualization as well as a detailed description of the project content with technical assignment, addressees, added value, project managers, funding information and duration.
Im Zentrum steht die Erforschung digitaler, datenintensiver Medien, die sich auf breiter Front als kooperative Werkzeuge, Plattformen und Infrastrukturen herausgestellt
ELAN wird am Max-Planck-Institut für Psycholinguistik im Sprach-Archiv (TLA – The Language Archive) entwickelt. Es wird in der Programmiersprache Java
HGIS de las Indias ist eine historisch-geographische Datenbank zum Spanisch-Amerika der ausgehenden Kolonialzeit.
ZenMEM ist ein dezidiert offener Verbund von Wissenschaftler*innen und darum bemüht, gemeinsam neue, digital gestützte Forschungsmöglichkeiten im Bereich der Kulturwissenschaften
Nachhaltiges Forschungsdatenmanagement ist zentral für künftige Forschungen! Dies zeigt etwa die Geschichte der Bonner Längsschnittstudie des Alterns. Fast zwanzig Jahre
Das Hidden Kosmos – Reconstructing Alexander von Humboldt’s »Kosmos-Lectures« widmete sich von 2014–16 der Ermittlung und Verzeichnung, Bild- und Volltext-Digitalisierung
Das forTEXT Portal bietet einsteigerfreundlich aufbereitete, zitierfähige Methodenbeschreibungen und Reviews von Textsammlungen und Tools – von Digitalisierung über Annotation zu Interpretation und Visualisierung von Literatur.
The Heinrich Heine Portal is based on the work of several generations of researchers by combining the two historical-critical complete editions of Heine, which were produced independently of each other in the Federal Republic of Germany and the German Democratic Republic, in one digital edition.
Wir verwenden Cookies und ähnliche Funktionen zur Verarbeitung von Daten. Die Zustimmung ist freiwillig und kann jederzeit widerrufen werden.