This is an old revision of the document!
Table of Contents
Korpustechnologie für Linguisten
Ausgewählte Literatur
Einführende Texte & Lehrbücher
Diese Liste ist noch unvollständig und wird derzeit ergänzt
- Bubenhofer, Noah Online-Einführung in die Korpuslinguistik
- Carstensen, Kai-Uwe; Ebert, Christian; Ebert, Cornelia; Jekat, Susanne; Klabunde, Ralf; Langer, Hagen (Hrsg., 2009). Computerlinguistik und Sprachtechnologie: Eine Einführung. 3. Auflage, Heidelberg: Spektrum Akademischer Verlag.
- Cramer, Irene und Schulte im Walde, Sabine (2006). Studienbibliographie Computerlinguistik und Sprachtechnologie. Heft 36 der Studienbibliografien Sprachwissenschaft. Tübingen: Julius Groos Verlag.
- Developing Linguistic Corpora – A guide to good practice für die Erstellung eigener Korpora
- Hoffmann, Sebastian; Evert, Stefan; Smith, Nicholas; Lee, David; Berglund Prytz, Ylva (2008). Corpus Linguistics with BNCweb – a Practical Guide. Band 6 der Reihe English Corpus Linguistics. Frankfurt am Main: Peter Lang.
- Lemnitzer, Lothar und Zinsmeister, Heike (2006). Korpuslinguistik. Eine Einführung. Reihe narr studienbücher, Gunter Narr Verlag.
Korpus-Ressourcen
Webinterfaces auf CQP-Basis
- Official CQP Demos (Uni Osnabrück)
- Online-Interfaces am IMS Stutgart: CQP Demos (alte Version), PennTreebank, VerbMobil-Dialoge, IMSearch zur Suche auf IMS-Webseiten
- Korpus 2000 – Dänisches Korpus
- Oslo Korpus Bosnischer Texte
- PAROLE – Schwedisches Korpus
- Corpuseye – Interface zu den VISL-Korpora
- FALKO – Fehlerannotiertes Lernerkorpus
- Linguateca – Zentrum für portugiesische Sprachressourcen
- OPUS – Interface zu parallelen Korpora des OPUS-Projekts
- CucWeb – katalanisches Webkorpus (UPF Barcelona)
- Korpussammlung von Serge Sharoff in Leeds: Englisch, Russisch, Chinesisch, Web-Korpus mit 12 Sprachen
- Bwananet gibt Zugriff auf das Corpus Tècnic mit spanischen, katalanischen und englischen Texten (IULA, UPF Barcelona)
- BancTrad – Paralleltexte in mehreren Sprachen (UPF Barcelona)
Manatee/Bonito (selbe Anfragesprache wie CQP)
- CNC – Tschechisches Nationalkorpus CNC
- Sketch Engine – kommerziell, kostenlose 30-Tage-Demoversion
Andere Webinterfaces
- DWDS-Webinterface und neue Beta-Version
- COSMAS – Zugriff auf die Korpora am Institut für deutsche Sprache
- Mark Davies – umfangreiche, halblegale Korpussammlung von Mark Davies
- ANNIS – Korpussuchtool
Weitere Ressourcen
- David Lee's umfangreiche Sammlung von Links zu Korpora und Tools
- NLTK – Python Natural Language Toolkit (NLTK)
- Informationen zur Kollokationsextraktion bei www.collocations.de und multiword.sf.net
- BAS – Bayerische Archiv für Sprachsignale
- WaCKy – Fertige Web-Korpora und Software zur Erstellung eigener Korpora
- Google N-Grams – Web 1T 5-Grams extrahiert aus 1 Billion Wörtern Text (Online-Abfrage)
- XML-Dumps der Wikipedia
- Corpora List – die Mailingliste für alle, die mit Korpora arbeiten
- CL-Online Tools – Link-Sammlung an der Universität Zürich
- Studienbibliographie Computerlinguistik