FOLK

Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK)

Fachliche Zuordnung

Projektkategorie

Korpus

Projektzeitraum

01/01/2008 – laufend

Projektstart: 01/01/2008 – Projektende: laufend

Kurzbeschreibung des Projekts

Das Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) wird seit 2008 am Leibniz-Institut für Deutsche Sprache aufgebaut. Das Korpus enthält Audio- und Videoaufnahmen von natürlichen Interaktionen aus unterschiedlichsten Bereichen des gesellschaftlichen Lebens (Arbeit, Freizeit, Bildung, öffentliches Leben, Dienstleistungen usw.) im deutschen Sprachraum. Das Ziel von FOLK ist die wissenschaftsöffentliche Bereitstellung einer großen, nach aktuellen Standards erschlossenen, breit diversifizierten Datenbasis für die Untersuchung gesprochener Sprache in natürlicher Interaktion. Die Daten werden nach zeitgemäßen Standards erschlossen (transkribiert, annotiert und dokumentiert) und der wissenschaftlichen Gemeinschaft über die Datenbank für Gesprochenes Deutsch (DGD) zur Verfügung gestellt.

Projektinhalt

Während inzwischen verschiedene gut stratifizierte Korpora des geschriebenen Deutsch wissenschaftsöffentlich zugänglich sind, gibt es noch keine vergleichbare Sammlung des gesprochenen Deutsch. Mit FOLK baut das IDS daher seit 2008 ein kontinuierlich wachsendes Korpus auf, das Gesprächsdaten aus unterschiedlichsten Bereichen des gesellschaftlichen Lebens (Arbeit, Freizeit, Bildung, öffentliches Leben, Dienstleistungen usw.) im deutschen Sprachraum beinhaltet. Die Daten werden nach zeitgemäßen Standards erschlossen (transkribiert, annotiert und dokumentiert) und der wissenschaftlichen Gemeinschaft über die Datenbank für Gesprochenes Deutsch (DGD) zur Verfügung gestellt.

Das Korpus bietet Forschenden die Möglichkeit, eine Vielzahl von wissenschaftlichen Fragestellungen an einem für alle in gleicher Weise zur Verfügung stehenden Datenmaterial nachvollziehbar zu untersuchen. So nutzen bereits viele Untersuchungen aus Interaktionaler Linguistik, Gesprächsanalyse und Korpuslinguistik das Korpus als alleinige Analysegrundlage oder als Vergleichsdatum. Kultur- und medienwissenschaftliche Untersuchungen gewinnen durch FOLK vielfältige Einblicke in die Realität der gesellschaftlichen Kommunikation in Deutschland. Der germanistischen Hochschullehre und der DaF/DaZ-Hochschullehre bietet FOLK mannigfaltiges Anschauungsmaterial.

Die Datenbasis von FOLK bilden Audio- und/oder Videoaufzeichnungen authentischer Gespräche. Diese werden mit dem Transkriptionseditor FOLKER gemäß den cGAT-Transkriptionskonventionen (Konventionen für das computergestützte Transkribieren in Anlehnung an das Gesprächsanalytische Transkriptionssystem 2 (GAT2)) als Minimaltranskripte in literarischer Umschrift transkribiert und mit dem Ton aligniert, sodass in der DGD zu jeder Transkriptstelle der zugehörige Audioausschnitt unmittelbar zur Verfügung steht. Für eine bessere Recherchierbarkeit werden eine orthographische Normalisierung, eine Lemmatisierung und ein Part-Of-Speech-Tagging als weitere Annotationsebenen hinzugefügt. Zu jedem Gespräch werden umfassende Kontextdaten zu den Gesprächsumständen sowie soziodemographische Daten zu den beteiligten Sprechenden als Metadaten dokumentiert. Aufnahmen, Transkripte und Metadaten können über die DGD eingesehen und systematisch durchsucht werden. Neben einer Volltextrecherche gibt es eine struktursensitive Tokensuche auf Transkriptdaten mit der Möglichkeit, die Suchergebnisse anhand von Metadaten zu filtern.

Das Korpus wird kontinuierlich ausgebaut, Erweiterungen des Korpus werden regelmäßig in der DGD veröffentlicht. Der Aufbau wird von Kooperationspartnern durch ‚Datenspenden‘ unterstützt. FOLK nimmt gerne Gesprächsdaten aus weiteren Projekten auf.

FOLK ist im Archiv für Gesprochenes Deutsch (AGD) im Programmbereich „Mündliche Korpora“ der Abteilung Pragmatik des Leibniz-Instituts für Deutsche Sprache (IDS), Mannheim, angesiedelt. Das IDS ist die zentrale außeruniversitäre Einrichtung zur Erforschung und Dokumentation der deutschen Sprache. Als Mitglied der Leibniz-Gemeinschaft wird das IDS gemeinsam vom Bund und von den Ländern unter besonderer Beteiligung Baden-Württembergs finanziert.

Förderung

Finanzierung von Bund und Ländern (unter besonderer Beteiligung des Landes Baden-Württemberg) / Leibniz-Gemeinschaft

Fachliche Zuordnung

Projektkategorie

Korpus

Kontakt

Dr. Silke Reineke
folk@ids-mannheim.de

Erfahren Sie mehr unter
agd.ids-mannheim.de/folk.shtml

Projektmitarbeitende

Dr. Silke Reineke, Dr. Mia Schürmann, Evi Schedl, M.A., Jürgen Immerz, Prof. Dr. Arnulf Deppermann

Neues Projekt anmelden

Fügen Sie Ihr DH-Forschungsprojekt dem Projektschaufenster hinzu, indem Sie eine kurze Projektbeschreibung über das Webformular einreichen. Geben Sie Projektdaten, eine Kurzbeschreibung, eine Grafik oder Visualisierung sowie eine detaillierte Beschreibung des Projektinhalts mit fachlicher Zuordnung, Adressaten, Mehrwert, Projektverantwortlichen, Finanzierungsinformationen und Laufzeit an.

Weitere Projekte

Closing the Gap

Das Projekt aggregiert Informationen zu digitalen Projekten und Konsortien, die sich im weitesten Sinne mit nicht-lateinischen Schriften beschäftigen. Die gesammelten

Weiterlesen →

VerbaAlpina widmete sich der Dokumentation der dialektalen lexikalischen Variation im Alpenraum innerhalb regionstypischer Konzeptdomänen.

Weiterlesen →

Das forTEXT Portal bietet einsteigerfreundlich aufbereitete, zitierfähige Methodenbeschreibungen und Reviews von Textsammlungen und Tools – von Digitalisierung über Annotation zu

Weiterlesen →

Non-Latin Script Data

Das Fach ist BUA-finanziert und am Seminar für Semitistik und Arabistik angelegt. Es fokussiert sich auf die Analyse des status

Weiterlesen →

Restaging Fashion (ReFa)

Das vom Bundesministerium für Bildung und Forschung (BMBF) geförderte und am UCLAB der FH Potsdam angesiedelte Projekt Restaging Fashion (11.2020

Weiterlesen →

Hamburger Schlüsseldokumente zur deutsch-jüdischen Geschichte

Die Edition „Hamburger Schlüsseldokumente zur deutsch-jüdischen Geschichte“ soll sowohl einem akademischen Publikum als auch der interessierten Öffentlichkeit einen niedrigschwelligen Zugang

Weiterlesen →

Œuvres de Frédéric le Grand

Die digitale Ausgabe der Werke Friedrichs des Großen der Universitätsbibliothek Trier bietet eine XML-konforme und recherchierbare elektronische Volltextversion der von Johann David Erdmann Preuß zwischen 1846 und 1856 herausgegeben Werkausgabe sowie der von Reinhold Koser begründeten Ausgabe der Politischen Correspondenz Friedrichs des Großen der Jahre 1740-1782.

Weiterlesen →

Closing the Gap

Das Projekt aggregiert Informationen zu digitalen Projekten und Konsortien, die sich im weitesten Sinne mit nicht-lateinischen Schriften beschäftigen. Die gesammelten Daten werden visualisiert und sollen Aussagen darüber treffen, was nötig ist, damit sich die Bedingungen für die Arbeit mit NLS im Bereich Digital Humanities bessern. Zusätzlich dient das Projekt als Knowledgebase für Forscher:innen, die sich einen Eindruck über den state of the field machen wollen. Das Projekt stellt alle Forschungsdaten, den Code und die Workflows im Open Access über GitHub zur Verfügung.

Weiterlesen →