Textsammlungen und Datenbanken zur Verwendung des Deutschen – Materialien für Korpuslinguistik, Sprachwisenschaft und Sprachunterricht (DaF & DaZ)

Ngram Viewer Graphik zur Häufigkeit der Wörter "Korpus", "Korpora", "Textsammlung" und "Textsammlungen" im deutschsprachigen Teil des Google Books KorpusNgram Viewer Graphik zur Häufigkeit der Wörter "Korpus", "Korpora", "Textsammlung" und "Textsammlungen" im deutschsprachigen Teil des Google Books Korpus

Wenn man den tatsächlichen Sprachgebrauch für wissenschaftliche Zwecke untersucht oder Materialien für den Sprachunterricht entwickelt, benötigt man Korpora. Solche strukturierten Sammlungen von Texten enthalten meist schriftliche Texten aus Büchern, Zeitschriften, Zeitungen oder online-Medien enthalten. Manche Korpora beruhen aber auch auf Aufnahmen mündlicher Äußerungen, die transkribiert, d.h. verschriftlicht, wurden. Für das Deutsche liegen eine ganze Reihe von Korpora vor, die entweder völlig frei oder mit kostenloser Registrierung  für akademische Zwecke zugänglich sind. Viele dieser Korpora lassen sich online nach bestimmten Texttypen, Wörtern oder Wortformen durchsuchen. Bei manchen kann man auch Datensätze für weitere Analysen auf den eigenen Rechner herunterladen. Auf der Basis von Korpora entstehen oft auch Wortschatzdatenbanken, in denen man Informationen über die Verwendungshäufigkeit von Wörtern findet oder Wörter mit bestimmtne Eigenschaften für sprachwissenschafltiche Experimente oder Unterrichtsmaterialien suchen kann.

Weitere Informationen zu Korpora und Wortschatzdatenbanken bietet die “Experimental Field Lingusitics”-Seite, wo man auch andere Ressourcen, Softwareinformationen und Tutorials für sprachwissenschaftliche Untersuchungen findet: https://experimentalfieldlinguistics.wordpress.com/experimental-materials/lexical_databases/

Mein persönlicher Sprachspinattipp

Für meine wissenschaftliche Arbeit verwende ich neben den Daten aus den Projekten, in denen ich arbeite, meistens das Deutsche Referenzkorpus und Spracherwerbsdaten aus CHILDES. Beide sind frei zugänglich und lassen sich online durchsuchen (beim DeReKo mit kostenloser Registrierung). Für die Sprachspinatseite habe ich gelegentlich schon den Google Ngram Viewer verwendet, um die historische Entwicklung von Begriffen zu untersuchen, so z.B. in einem Artikel über Sprachentwicklung, Spracherwerb und Sprachlernen und in einem Artikel über Sprachbildung, Sprachförderung und Sprachtherapie. Die vom Ngram-Viewer erzeugten Graphiken kann man als Screenshot speichern, aber auch als interaktive Graphik in Webseiten einbauen.

Interaktive Ngram Viewer Graphik zur Häufigkeit der Wörter “Korpus”, “Korpora”, “Textsammlung” und “Textsammlungen” im deutschsprachigen Teil des Google Books Korpus