Beschreibung

Die Datenbank für Gesprochenes Deutsch (DGD) ist ein Korpusmanagementsystem im Programmbereich Mündliche Korpora des Instituts für Deutsche Sprache (IDS). Sie ist seit Anfang 2012 online und ersetzt seit Mitte 2014 die Datenbank Gesprochenes Deutsch, die im Deutschen Spracharchiv (DSAv) des IDS entwickelt worden war.

Im Mittelpunkt der Systemarchitektur der DGD steht eine objektrelationale XML-Datenbank (Oracle 11g), die eine schemabasierte, native Speicherung von Metadaten und Transkriptionen ermöglicht. Das Datenbanksystem unterstützt Volltextsuche und kontextsensitives Informationsretrieval sowie standardisierte, dynamisch generierte Präsentationen von XML-Dokumenten.

Externen Nutzern bietet die DGD nach einmaliger Registrierung einen webbasierten Zugriff auf ausgewählte Teile der Sammlung des Archivs für Gesprochenes Deutsch (AGD) für die Verwendung in Forschung und Lehre. Die Auswahl der Daten für die externe Nutzung ist abhängig von der Zustimmung des jeweiligen Datengebers, der seinerseits über die entsprechenden Nutzungs- und Verwertungsrechte verfügen muss. Außerdem maßgeblich für die Auswahl sind bestimmte Schutzbedürfnisse des Archivs.

Die Datenbasis wird kontinuierlich erweitert. Sie umfasst gegenwärtig Materialien aus 34 Korpora, u.a. die jeweils aktuelle Version von FOLK, dem Forschungs- und Lehrkorpus Gesprochenes Deutsch. Mit FOLK baut das IDS ein Korpus auf, das Gesprächsdaten aus unterschiedlichsten Bereichen des gesellschaftlichen Lebens (Arbeit, Freizeit, Bildung, öffentliches Leben, Dienstleistungen usw.) im deutschen Sprachraum beinhaltet. Die Daten werden nach zeitgemäßen Standards erschlossen (transkribiert, annotiert und dokumentiert). Die DGD fungiert als primäre Plattform sowohl für die Publikation von künftigen Erweiterungen dieses Korpus als auch für die (Weiter-)Entwicklung der Funktionalität für die korpuslinguistische Analyse solcher Gesprächsdaten.

Die DGD ermöglicht das Browsen in Metadaten (zu Korpora, Sprechereignissen und Sprechern), Tonaufnahmen, Transkripten, Videoaufnahmen und Zusatzmaterialien. Die einzelnen Datentypen sind dabei vielfach untereinander verknüpft, so dass zum Beispiel beim Lesen eines Transkripts auch die zugehörigen Stellen in der Aufnahme angehört und Informationen zu den Sprechern abgerufen werden können.

Für die Recherche in Metadaten und Transkripten stellt die DGD eine Volltextsuche sowie verschiedene Formen struktursensitiver Suchen zur Verfügung. Dabei lassen sich Abfragen über Metadaten mit Abfragen über das sprachliche Material in vielfältiger Weise verbinden, Suchergebnisse schrittweise automatisch oder manuell verfeinern und nutzerdefinierte virtuelle Korpora, Beleg- oder Beispielsammlungen dauerhaft speichern.

Für eine weiterführende Analyse am lokalen Rechner erlaubt die DGD den Download einzelner Belege (Audio- und Transkriptausschnitt). Aus den Korpora Deutsche Mundarten: Zwirner-Korpus, Deutsche Umgangssprachen: Pfeffer-Korpus sowie dem Forschungs- und Lehrkorpus Gesprochenes Deutsch werden zudem ausgewählte komplette Datensätze zum Herunterladen angeboten.

Im Menüpunkt Meine DGD sind DGD-Funktionen für die personalisierte Verwendung von Ressourcen zusammengefasst. Mit Hilfe des Dateimanagers lassen sich zuvor erstellte persönliche virtuelle Korpora, Kollektionen bzw. KWIC-Suchergebnisse anzeigen, umbenennen oder löschen. Auch können hier virtuelle Korpora kostenpflichtig bestellt werden. Der Menüpunkt Kollektionen ermöglicht das Browsen zuvor angelegter Kollektionen. Eine eingeblendete URL ermöglicht den direkten externen Zugriff auf die jeweilige Kollektion. Unter Einstellungen können individuelle Korpusauswahllisten für die struktursensitive Recherche voreingestellt werden.

Wir sind bestrebt, mit der DGD ein adäquates Instrument für die wissenschaftliche Analyse gesprochener Sprache zu entwickeln. Für Verbesserungsvorschläge und andere Rückmeldungen an die Adresse dgd@ids-mannheim.de wären wir daher sehr dankbar.

Zu Kollektion hinzufügen
Ausschnitt anzeigen
Annotationen anzeigen
Fehler melden