(Ruth Albert & Patricia Boos)
Corpus
Ein Korpus ist eine Sammlung schriftlicher oder gesprochener (meist transkribierter) Sprachdaten als Grundlage für sprachwissenschaftliche Analysen. Für das Deutsche gibt es eine große Anzahl an Korpora. Häufig dienen folgende Korpustypen als Untersuchungsgrundlage: Korpora geschriebener/gesprochener Sprache, Referenzkorpora (zum Beispiel das deutsche Referenzkorpus), spezialisierte Korpora (zum Beispiel zur Wissenschaftssprache), synchrone/diachrone Korpora (Sprachgebrauch zu einem bestimmten Zeitpunkt/Sprachwandel im Laufe der Zeit; zum Beispiel das Digitale Wörterbuch der Deutschen Sprache), multimediale Korpora, Korpora zu Lernersprachen (zum Beispiel das FALKO-Korpus) etc.
Viele Korpora liegen digitalisiert (meist auch über das Internet frei zugänglich) vor, so dass ein computerbasiertes automatisches Durchsuchen der Korpora möglich wird. Meist können einzelne Wörter oder Wortkombinationen eingegeben werden und man bekommt Belegstellen, die diese Wörter in ihrem Kontext zeigen (Kollokationen). Noch mehr Hilfestellung bieten so genannte ‚annotierte Korpora‘. Diese sind bereits nach bestimmten Kriterien vor-ausgewertet. Sind zum Beispiel die syntaktischen Rollen der einzelnen Teile im Satz angegeben, so kann man das Korpus unter anderem nach Akkusativobjekten durchsuchen.
Literatur
- Albert, Ruth & Marx, Nicole (2014), Empirisches Arbeiten in Linguistik und Sprachlehrforschung. Anleitung zu quantitativen Studien von der Planungsphase bis zum Forschungsbericht (2. überarbeitete Auflage). Tübingen: Narr.
- Lemnitzer, Lothar & Zinsmeister, Heike (2006), Korpuslinguistik. Tübingen: Narr.
- Scherer, Carmen (2006), Korpuslinguistik. Heidelberg: Winter.
(Mehr zu diesem Thema im Modul 3 Propädeutikum wissenschaftliches Arbeiten der Multilingua Akademie)