
Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) wird seit 2008 am Leibniz-Institut für Deutsche Sprache aufgebaut. Das Korpus enthält Audio-
Short description of the project
We are building a diversity corpus (DisKo) as the basis for the algorithmic text analysis. DisKo comprises narrative texts written in the last 100 years in which not only male, female and neutral roles occur, but also descriptions of non-binary characters. The corpus serves as training material for a classifier for the automated analysis of gender roles in German-language literary texts.
Project content
DisKo stands for Diversity Corpus (German: Diversitätskorpus) and is a project in the field of Computational Literary Studies. We use machine learning to train an algorithm that not only recognises female, male and neutral roles in literary texts, but also less binary gender attributions. For this training process, we first need a training corpus that is as diverse as possible and consists of texts in which non-binary gender attributions occur. As part of a public humanities concept, as many different groups of readers as possible are involved in the acquisition of the corpus. The more diverse the people involved in the creation of the corpus, the more diverse the texts in our training corpus will ultimately be. This diversity is important in order to make gender diversity visible with our digital humanities approach. The central component of the project is a survey in which you can submit your text references. Do you know of literary works in which characters are not described stereotypically, but in a diverse way? Then take part in our survey via the link, enter text suggestions and help us to build up a diversity corpus: https://public.zenkit.com/f/klZHAjPGg/disko?v=xQoeCRIop
Add your DH research project to the project showcase by submitting a short project description via the web form. Enter project data, a brief description, a graphic or visualization as well as a detailed description of the project content with technical assignment, addressees, added value, project managers, funding information and duration.
Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) wird seit 2008 am Leibniz-Institut für Deutsche Sprache aufgebaut. Das Korpus enthält Audio-
is in die 1990er Jahre war es in der Filmwissenschaft ein Gemeinplatz, dass Frauen in den Anfangsjahren der Filmproduktion nur
HGIS de las Indias ist eine historisch-geographische Datenbank zum Spanisch-Amerika der ausgehenden Kolonialzeit.
Das Institut für Dokumentologie und Editorik e.V. (IDE) ist ein internationaler Zusammenschluss von Wissenschaftlerinnen und Wissenschaftlern aus verschiedenen Disziplinen der
Nachhaltiges Forschungsdatenmanagement ist zentral für künftige Forschungen! Dies zeigt etwa die Geschichte der Bonner Längsschnittstudie des Alterns. Fast zwanzig Jahre
Das Portal Revistas culturales 2.0 dient als virtuelle Forschungsumgebung für alle Interessenten, die sich mit historischen Zeitschriften aus dem spanischsprachigen
HGIS de las Indias ist eine historisch-geographische Datenbank zum Spanisch-Amerika der ausgehenden Kolonialzeit.
Annotate, analyze, interpret and visualize: In CATMA, text researchers can work in the way that best suits them: qualitatively or quantitatively, bottom-up and exploratory or descriptive and taxonomy-based, individually or in a team. The web-based open source tool is free of charge and also offers the possibility of exporting your own data, for example to process it further with other tools.
Wir verwenden Cookies und ähnliche Funktionen zur Verarbeitung von Daten. Die Zustimmung ist freiwillig und kann jederzeit widerrufen werden.