
Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) wird seit 2008 am Leibniz-Institut für Deutsche Sprache aufgebaut. Das Korpus enthält Audio-
Kurzbeschreibung des Projekts
Als Grundlage für die algorithmische Textanalyse bauen wir ein Diversitäts-Korpus auf. Gesucht werden Romane, die im Zeitraum zwischen 1922 und heute entstanden sind und in dem nicht nur Männer-, Frauen- und neutrale Rollen vorkommen, sondern auch Beschreibungen nicht-binärer Charaktere. Das Korpus dient als Trainingsmaterial für einen Classifier zur automatisierten Analyse von Genderrollen in deutschsprachigen literarischen Texten.
Projektinhalt
DisKo steht für Diversitäts-Korpus und ist ein literaturwissenschaftliches Projekt mit Digital-Humanities-Komponente. Mit Methoden des maschinellen Lernens wollen wir einen Algorithmus trainieren, der nicht nur weibliche, männliche und neutrale Rollen in literarischen Texten erkennt, sondern auch weniger binäre Genderzuschreibungen. Für diesen Trainingsprozess benötigen wir erst einmal ein möglichst diverses Trainingskorpus, das aus Texten besteht, in denen nicht-binäre Genderzuschreibungen vorkommen. Im Rahmen eines Public-Humanities-Konzepts sollen an der Korpusakquise möglichst unterschiedliche Leser:innengruppen beteiligt werden. Denn: Je diverser die Personen, die an der Gestaltung des Korpus beteiligt sind, desto diverser sind am Ende auch die Texte in unserem Trainingskorpus. Diese Vielfalt ist wichtig, um Genderdiversität mit unserem Digital-Humanities-Ansatz sichtbar machen zu können. Zentrale Komponente des Projekts ist eine Umfrage, bei der Sie Ihre Texthinweise einreichen können. Kennen Sie literarische Werke, in denen Figuren nicht stereotyp, sondern divers beschrieben werden? Dann nehmen Sie über den Link an unserer Umfrage teil, tragen Textvorschläge ein und helfen uns dabei, ein Diversitäts-Korpus aufzubauen: https://public.zenkit.com/f/klZHAjPGg/disko?v=xQoeCRIop
Mareike.schumacher@ilw.uni-stuttgart.de
Erfahren Sie mehr unter
msternchenw.de/
Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.
Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) wird seit 2008 am Leibniz-Institut für Deutsche Sprache aufgebaut. Das Korpus enthält Audio-
ELAN wird am Max-Planck-Institut für Psycholinguistik im Sprach-Archiv (TLA – The Language Archive) entwickelt. Es wird in der Programmiersprache Java
Das forTEXT Portal bietet einsteigerfreundlich aufbereitete, zitierfähige Methodenbeschreibungen und Reviews von Textsammlungen und Tools – von Digitalisierung über Annotation zu
Das von der Deutschen Forschungsgemeinschaft geförderte Projekt Diccionario del Español Medieval electrónico (DEMel) hat zum Ziel, der Öffentlichkeit ein lemmatisiertes
In Kooperation zwischen der Universität Hamburg und der Staats- und Universitätsbibliothek Hamburg werden die ca. 35.000 handschriftlichen Originalbriefe des Dehmel-Archivs
Mit Dietrich online werden bibliographische Angaben zu ca. 5. Mio im deutschen Sprachraum von 1897- 1944 erschienenen Zeitschriftenaufsätzen und Zeitungsartikeln
Nachhaltiges Forschungsdatenmanagement ist zentral für künftige Forschungen! Dies zeigt etwa die Geschichte der Bonner Längsschnittstudie des Alterns. Fast zwanzig Jahre
Digitale Ausgabe der 1773 bis 1858 in 242 Bänden erschienenen Oekonomisch-technologischen Enzyklopädie von J. G. Krünitz.
Wir verwenden Cookies und ähnliche Funktionen zur Verarbeitung von Daten. Die Zustimmung ist freiwillig und kann jederzeit widerrufen werden.