Both sides previous revision
Previous revision
Next revision
|
Previous revision
|
corpus_tutorial:lipp2011 [2011/01/13 13:11] schtepf |
corpus_tutorial:lipp2011 [2012/05/10 13:34] schtepf [Online-Zugriff] |
| |
<sup>[[:corpus_tutorial|(back to overview page)]]</sup> | <sup>[[:corpus_tutorial|(back to overview page)]]</sup> |
| |
| |
===== Beschreibung ===== | ===== Beschreibung ===== |
| |
Um den Mehrwert von Korpora gegenüber dem Internet vollständig auszuschöpfen, ist es allerdings nötig, sich in die Bedienung der Korpustools und ihrer Online-Schnittstellen einzuarbeiten. Ziel unseres Tutoriums ist, genau diesen Schritt zu unterstützen. Anhand linguistischer Fragestellungen werden die TeilnehmerInnen interaktiv in den Umgang mit drei konkreten Korpusschnittstellen eingeführt: CQPweb, die Websuche der DWDS-Korpora und ANNIS. Neben der eigenen Arbeit mit den Online-Ressourcen erhalten die TeilnehmerInnen Einblick in computerlinguistische Methoden und Werkzeuge, die bei der Aufbereitung der Korpora eingesetzt wurden (Segmentierung, Wortarten-Tagging, Parsing, manuelle Annotierungsumgebungen). | Um den Mehrwert von Korpora gegenüber dem Internet vollständig auszuschöpfen, ist es allerdings nötig, sich in die Bedienung der Korpustools und ihrer Online-Schnittstellen einzuarbeiten. Ziel unseres Tutoriums ist, genau diesen Schritt zu unterstützen. Anhand linguistischer Fragestellungen werden die TeilnehmerInnen interaktiv in den Umgang mit drei konkreten Korpusschnittstellen eingeführt: CQPweb, die Websuche der DWDS-Korpora und ANNIS. Neben der eigenen Arbeit mit den Online-Ressourcen erhalten die TeilnehmerInnen Einblick in computerlinguistische Methoden und Werkzeuge, die bei der Aufbereitung der Korpora eingesetzt wurden (Segmentierung, Wortarten-Tagging, Parsing, manuelle Annotierungsumgebungen). |
| |
| |
| |
===== Linguistische Fallbeispiele ===== | ===== Linguistische Fallbeispiele ===== |
* "gegenseitiges Vertrauen"\\ Welche Adjektive werden typischerweise mit dem Nomen //Vertrauen// verwendet? | * "gegenseitiges Vertrauen"\\ Welche Adjektive werden typischerweise mit dem Nomen //Vertrauen// verwendet? |
* "ohne Dirigent"\\ Stimmt die Dudenregel, dass Substantive ohne Artikel und Adjektiv tendenziell keine Kasusendung tragen? | * "ohne Dirigent"\\ Stimmt die Dudenregel, dass Substantive ohne Artikel und Adjektiv tendenziell keine Kasusendung tragen? |
| * "weil er macht das wider besseren Wissens"\\ Abfrage von Korpora mit morphologischen und partiellen syntaktischen Annotationen (//Chunks//) |
===== Online-Zugriff ===== | ===== Online-Zugriff ===== |
| |
* [[http://cogsci.uni-osnabrueck.de/~korpora/ws/CQPdemo/Europarl/|Europarl GUI]] (Osnabrück) | * [[http://cogsci.uni-osnabrueck.de/~korpora/CQPdemo/Europarl/|Europarl GUI]] (Osnabrück) |
* [[https://cogsci.uni-osnabrueck.de/~korpora/ws/cqpweb/|CQPweb]] (Osnabrück) | * [[https://cogsci.uni-osnabrueck.de/~korpora/cqpweb/|CQPweb]] (Osnabrück) |
* [[http://beta.dwds.de/|DWDS-Webinterface]] (Beta-Version) | * [[http://beta.dwds.de/|DWDS-Webinterface]] (Beta-Version) |
| * [[https://cogsci.uni-osnabrueck.de/~korpora/CQPdemo/HGC/frames-cqp.html|Deutsche Zeitungstexte]] mit morphologischer Annotation (Osnabrück) |
| |
===== Materialien ===== | ===== Materialien ===== |
| |
* werden noch ergänzt | * [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:handout_lipp_tutorial_2011.pdf|Handout]] mit Beispielanfragen und Übungsaufgaben (PDF) |
| * Folien: [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_a_intro.pdf|Einleitung]] - [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_b_aufbereitung.pdf|Linguistische Aufbereitung]] - [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_d_alignment.pdf|Alignment]] - [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_c_stts.pdf|STTS]] - [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_e_cqp_syntax.pdf|Reguläre Ausdrück und CQP]] - [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_neu_annotation.pdf|Manuelle Annotierung]] - [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_f_schluss.pdf|Schlussbemerkungen]] |
| ===== Ablaufplan ===== |
| |
| === Teil 1 (Vormittag) === |
| **09:00 - 12:00**: Ludwigstr. 25, **Raum 212** |
| |
| * Einleitung |
| * Korpusaufbereitung und automatische Annotierung |
| * **Ü1** (Europarl mit CQPDemo) |
| * Alignment und Übersetzungskandidaten |
| * //Kaffeepause// :-D |
| * Das STTS-Tagset |
| * Reguläre Ausdrücke und CQP-Syntax |
| * **Ü2** (Europarl mit CQPweb und CQP-Syntax) |
| |
| === Teil 2 (Nachmittag) === |
| **14:00 - 17:00**: Schellingstr. 3 VGB, **Raum S227** |
| |
| * **Ü3** (diachrone Suche mit dem DWDS-Webinterface) |
| * CQP für Fortgeschrittene: XML-Attribute und morphologische Features |
| * **Ü4** (Abfrage von Chunks und morphologischen Merkmalen) |
| * //Kaffeepause// 8-o |
| * **Demo** Verwendung von syntaktischen Parsern, Einlesen und Abfrage in TIGERSearch |
| * **Ü5** (Abfrage komplexer Datenstrukturen mit ANNIS) |
| * Manuelle Annotation (Guidelines, Agreement, Tools) |
| * **Demo** Manuelle Annotation in EXMARaLDA |
| |
===== Dozenten ===== | ===== Dozenten ===== |