Both sides previous revision
Previous revision
Next revision
|
Previous revision
Last revision
Both sides next revision
|
corpus_tutorial:dgfs2010 [2010/11/01 14:07] 127.0.0.1 external edit |
corpus_tutorial:dgfs2010 [2011/01/13 13:19] schtepf [Dozenten] |
//Humboldt-Universität zu Berlin, 23.02.2010, 14:00--18:00// | //Humboldt-Universität zu Berlin, 23.02.2010, 14:00--18:00// |
| |
| <sup>[[:corpus_tutorial|(back to overview page)]]</sup> |
| |
===== Beschreibung ===== | ===== Beschreibung ===== |
| |
* [[http://purl.org/stefan.evert/|Stefan Evert]] (Juniorprofessor für Computerlinguistik, Universität Osnabrück) | * [[http://purl.org/stefan.evert/|Stefan Evert]] (Juniorprofessor für Computerlinguistik, Universität Osnabrück) |
* [[http://www.linguistics.ruhr-uni-bochum.de/~dipper/|Stefanie Dipper]] (Juniorprofessorin für Computerlinguistik, Ruhr-Universität Bochum) | |
* [[http://ling.uni-konstanz.de/pages/home/zinsmeister/|Heike Zinsmeister]] (Margarete von Wrangell-Habilitandin, Universität Konstanz) | * [[http://ling.uni-konstanz.de/pages/home/zinsmeister/|Heike Zinsmeister]] (Margarete von Wrangell-Habilitandin, Universität Konstanz) |
| |
| |
===== Korpus-Ressourcen ===== | ===== Weitere Informationen ===== |
| |
=== Webinterfaces auf CQP-Basis === | |
| |
* Official [[http://www.cogsci.uni-osnabrueck.de/~korpora/ws/CQPdemo/|CQP Demos]] (Uni Osnabrück) | |
* Online-Interfaces am IMS Stutgart: [[http://www.ims.uni-stuttgart.de/projekte/CQPDemos/cqpdemo.html|CQP Demos]] (alte Version), [[http://www.ims.uni-stuttgart.de/projekte/CorpusWorkbench/CQP-HTMLDemo/CQP-HTMLDemo.html|PennTreebank]], [[http://www.ims.uni-stuttgart.de/projekte/verbmobil/Dialogs/|VerbMobil-Dialoge]], [[http://www.ims.uni-stuttgart.de/projekte/CQPDemos/IMSearch/webmode/|IMSearch]] zur Suche auf IMS-Webseiten | |
* [[http://www.korpus2000.dk/|Korpus 2000]] -- Dänisches Korpus | |
* [[http://www.tekstlab.uio.no/Bosnian/Corpus.html|Oslo Korpus]] Bosnischer Texte | |
* [[http://spraakbanken.gu.se/parole/|PAROLE]] -- Schwedisches Korpus | |
* [[http://corp.hum.sdu.dk/|Corpuseye]] -- Interface zu den VISL-Korpora | |
* [[http://www.linguistik.hu-berlin.de/institut/professuren/korpuslinguistik/forschung/falko/standardseite|FALKO]] -- Fehlerannotiertes Lernerkorpus | |
* [[http://www.linguateca.pt/|Linguateca]] -- Zentrum für portugiesische Sprachressourcen | |
* [[http://urd.let.rug.nl/tiedeman/OPUS/|OPUS]] -- Interface zu parallelen Korpora des OPUS-Projekts | |
* [[http://ramsesii.upf.es/cucweb/|CucWeb]] -- katalanisches Webkorpus (UPF Barcelona) | |
* [[http://bncweb.lancs.ac.uk/|BNCweb]] und [[http://cqpweb.lancs.ac.uk/|CQPweb]] in Lancaster -- nur mit Login (Gäste-Accounts auf Anfrage) | |
* Korpussammlung von Serge Sharoff in Leeds: [[http://corpus.leeds.ac.uk/protected/query.html|Englisch]], [[http://corpus.leeds.ac.uk/ruscorpora.html|Russisch]], [[http://corpus.leeds.ac.uk/query-zh.html|Chinesisch]], [[http://corpus.leeds.ac.uk/internet.html|Web-Korpus]] mit 12 Sprachen | |
* [[http://bwananet.iula.upf.edu/|Bwananet]] gibt Zugriff auf das [[http://www.iula.upf.edu/corpus/corpus.htm|Corpus Tècnic]] mit spanischen, katalanischen und englischen Texten (IULA, UPF Barcelona) | |
* [[http://mutis2.upf.edu/bt/english/|BancTrad]] -- Paralleltexte in mehreren Sprachen (UPF Barcelona) | |
| |
=== Manatee/Bonito (selbe Anfragesprache wie CQP) === | |
| |
* [[http://ucnk.ff.cuni.cz/english/|CNC]] -- Tschechisches Nationalkorpus CNC | |
* [[http://www.sketchengine.co.uk/|Sketch Engine]] -- kommerziell, kostenlose 30-Tage-Demoversion | |
| |
| |
=== Andere Webinterfaces === | |
| |
* [[http://www.dwds.de/|DWDS-Webinterface]] und neue [[http://beta.dwds.de/|Beta-Version]] | |
* [[http://www.ids-mannheim.de/cosmas2/|COSMAS]] -- Zugriff auf die Korpora am Institut für deutsche Sprache | |
* [[http://corpus.byu.edu/|Mark Davies]] -- umfangreiche, halblegale Korpussammlung von Mark Davies | |
* [[http://www.sfb632.uni-potsdam.de/d1/annis/|ANNIS]] -- Korpussuchtool | |
| |
=== Weitere Ressourcen === | |
| |
* [[http://tiny.cc/corpora|David Lee's]] umfangreiche Sammlung von Links zu Korpora und Tools | |
* [[http://www.nltk.org/Home|NLTK]] -- Python Natural Language Toolkit (NLTK) | |
* Informationen zur Kollokationsextraktion bei [[http://www.collocations.de/|www.collocations.de]] und [[http://multiword.sourceforge.net/|multiword.sf.net]] | |
* [[http://www.chatkorpus.tu-dortmund.de/index.html|Dortmunder Chatkorpus]] | |
* [[http://www.phonetik.uni-muenchen.de/Bas/BasHomedeu.html|BAS]] -- Bayerische Archiv für Sprachsignale | |
* [[http://wacky.sslmit.unibo.it/|WaCKy]] -- Fertige Web-Korpora und Software zur Erstellung eigener Korpora | |
* [[http://www.ldc.upenn.edu/Catalog/CatalogEntry.jsp?catalogId=LDC2006T13|Google N-Grams]] -- Web 1T 5-Grams extrahiert aus 1 Billion Wörtern Text ([[http://www.cogsci.uos.de/~korpora/ws/Web1T5/|Online-Abfrage]]) | |
* [[http://de.wikipedia.org/wiki/Wikipedia:Download|XML-Dumps]] der Wikipedia | |
* [[http://gandalf.aksis.uib.no/corpora/|Corpora List]] -- //die// Mailingliste für alle, die mit Korpora arbeiten | |
* [[http://kitt.cl.uzh.ch/kitt/cltools/index.php/Welcome|CL-Online Tools]] -- Link-Sammlung an der Universität Zürich | |
* [[http://www.coli.uni-saarland.de/projects/stud-bib/|Studienbibliographie]] Computerlinguistik | |
| |
=== Einführende Literatur === | |
| |
//Hierbei handelt es sich um eine unvollständige Aufstellung geeigneter Einführungsliteratur.// | |
| |
* [[http://www.bubenhofer.com/korpuslinguistik/kurs/|Bubenhofer, Noah]] Online-Einführung in die Korpuslinguistik | |
* Carstensen, Kai-Uwe; Ebert, Christian; Ebert, Cornelia; Jekat, Susanne; Klabunde, Ralf; Langer, Hagen (Hrsg., 2009). //Computerlinguistik und Sprachtechnologie: Eine Einführung.// 3. Auflage, Heidelberg: Spektrum Akademischer Verlag. | |
* Cramer, Irene und Schulte im Walde, Sabine (2006). //Studienbibliographie Computerlinguistik und Sprachtechnologie.// Heft 36 der Studienbibliografien Sprachwissenschaft. Tübingen: Julius Groos Verlag. | |
* [[http://www.ahds.ac.uk/creating/guides/linguistic-corpora/index.htm|Developing Linguistic Corpora]] -- //A guide to good practice// für die Erstellung eigener Korpora | |
* Hoffmann, Sebastian; Evert, Stefan; Smith, Nicholas; Lee, David; Berglund Prytz, Ylva (2008). //Corpus Linguistics with BNCweb -- a Practical Guide.// Band 6 der Reihe English Corpus Linguistics. Frankfurt am Main: Peter Lang. | |
* Lemnitzer, Lothar und Zinsmeister, Heike (2006). //Korpuslinguistik. Eine Einführung.// Reihe narr studienbücher, Gunter Narr Verlag. | |
| |
| * [[links|Korpus-Ressourcen und ausgewählte Literatur]] |