Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
corpus_tutorial:lipp2011 [2011/01/13 12:49]
schtepf created
corpus_tutorial:lipp2011 [2012/05/10 13:34] (current)
schtepf [Online-Zugriff]
Line 5: Line 5:
  
 <sup>[[:corpus_tutorial|(back to overview page)]]</sup> <sup>[[:corpus_tutorial|(back to overview page)]]</sup>
 +
  
 ===== Beschreibung ===== ===== Beschreibung =====
  
-{{:corpus_tutorial:lipp_logo.jpg?150 |LIPP Logo}}+{{:corpus_tutorial:lipp_tutorium_logo.jpg?250 |LIPP Logo}}
  
 Dieser Workshop richtet sich speziell an Linguisten, die empirische Daten in ihre linguistische Analyse mit einbeziehen wollen, aber bisher keinen oder wenig Zugang zu linguistisch aufbereiteten Korpusdaten hatten. Sucht man  z. B. nach einem passenden Verwendungsbeleg für ein Wort, ist das Internet eine dankbare und oft genutzte Quelle -- allerdings mit unsicherer Datenbasis, sehr beschränkten Suchmöglichkeiten und ohne weiterführende linguistische Analyse. Linguistische Korpora hingegen sind inhaltlich dokumentiert und unterstützen die Suche nach linguistisch komplexen Anfragen und Generalisierungen. Online-Schnittstellen ermöglichen die komfortable Nutzung solcher Korpora auch ohne umfangreiche Informatikkenntnisse.  Dieser Workshop richtet sich speziell an Linguisten, die empirische Daten in ihre linguistische Analyse mit einbeziehen wollen, aber bisher keinen oder wenig Zugang zu linguistisch aufbereiteten Korpusdaten hatten. Sucht man  z. B. nach einem passenden Verwendungsbeleg für ein Wort, ist das Internet eine dankbare und oft genutzte Quelle -- allerdings mit unsicherer Datenbasis, sehr beschränkten Suchmöglichkeiten und ohne weiterführende linguistische Analyse. Linguistische Korpora hingegen sind inhaltlich dokumentiert und unterstützen die Suche nach linguistisch komplexen Anfragen und Generalisierungen. Online-Schnittstellen ermöglichen die komfortable Nutzung solcher Korpora auch ohne umfangreiche Informatikkenntnisse. 
  
 Um den Mehrwert von Korpora gegenüber dem Internet vollständig auszuschöpfen, ist es allerdings nötig, sich in die Bedienung der Korpustools und ihrer Online-Schnittstellen einzuarbeiten. Ziel unseres Tutoriums ist, genau diesen Schritt zu unterstützen. Anhand linguistischer Fragestellungen werden die TeilnehmerInnen interaktiv in den Umgang mit drei konkreten Korpusschnittstellen eingeführt: CQPweb, die Websuche der DWDS-Korpora und ANNIS. Neben der eigenen Arbeit mit den Online-Ressourcen erhalten die  TeilnehmerInnen Einblick in computerlinguistische Methoden und Werkzeuge, die bei der Aufbereitung der Korpora eingesetzt wurden (Segmentierung, Wortarten-Tagging, Parsing, manuelle Annotierungsumgebungen). Um den Mehrwert von Korpora gegenüber dem Internet vollständig auszuschöpfen, ist es allerdings nötig, sich in die Bedienung der Korpustools und ihrer Online-Schnittstellen einzuarbeiten. Ziel unseres Tutoriums ist, genau diesen Schritt zu unterstützen. Anhand linguistischer Fragestellungen werden die TeilnehmerInnen interaktiv in den Umgang mit drei konkreten Korpusschnittstellen eingeführt: CQPweb, die Websuche der DWDS-Korpora und ANNIS. Neben der eigenen Arbeit mit den Online-Ressourcen erhalten die  TeilnehmerInnen Einblick in computerlinguistische Methoden und Werkzeuge, die bei der Aufbereitung der Korpora eingesetzt wurden (Segmentierung, Wortarten-Tagging, Parsing, manuelle Annotierungsumgebungen).
 +
 +
  
 ===== Linguistische Fallbeispiele ===== ===== Linguistische Fallbeispiele =====
Line 21: Line 24:
   * "gegenseitiges Vertrauen"\\ Welche Adjektive werden typischerweise mit dem Nomen //Vertrauen// verwendet?   * "gegenseitiges Vertrauen"\\ Welche Adjektive werden typischerweise mit dem Nomen //Vertrauen// verwendet?
   * "ohne Dirigent"\\ Stimmt die Dudenregel, dass Substantive ohne Artikel und Adjektiv tendenziell keine Kasusendung tragen?   * "ohne Dirigent"\\ Stimmt die Dudenregel, dass Substantive ohne Artikel und Adjektiv tendenziell keine Kasusendung tragen?
 +  * "weil er macht das wider besseren Wissens"\\ Abfrage von Korpora mit morphologischen und partiellen syntaktischen Annotationen (//Chunks//)
 ===== Online-Zugriff ===== ===== Online-Zugriff =====
  
-  * [[http://cogsci.uni-osnabrueck.de/~korpora/ws/CQPdemo/Europarl/|Europarl GUI]] (Osnabrück) +  * [[http://cogsci.uni-osnabrueck.de/~korpora/CQPdemo/Europarl/|Europarl GUI]] (Osnabrück) 
-  * [[https://cogsci.uni-osnabrueck.de/~korpora/ws/cqpweb/|CQPweb]] (Osnabrück)+  * [[https://cogsci.uni-osnabrueck.de/~korpora/cqpweb/|CQPweb]] (Osnabrück)
   * [[http://beta.dwds.de/|DWDS-Webinterface]] (Beta-Version)   * [[http://beta.dwds.de/|DWDS-Webinterface]] (Beta-Version)
 +  * [[https://cogsci.uni-osnabrueck.de/~korpora/CQPdemo/HGC/frames-cqp.html|Deutsche Zeitungstexte]] mit morphologischer Annotation (Osnabrück)
  
 ===== Materialien ===== ===== Materialien =====
  
-  * werden noch ergänzt+  * [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:handout_lipp_tutorial_2011.pdf|Handout]] mit Beispielanfragen und Übungsaufgaben (PDF) 
 +  * Folien:  [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_a_intro.pdf|Einleitung]] - [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_b_aufbereitung.pdf|Linguistische Aufbereitung]] - [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_d_alignment.pdf|Alignment]] - [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_c_stts.pdf|STTS]] - [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_e_cqp_syntax.pdf|Reguläre Ausdrück und CQP]] - [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_neu_annotation.pdf|Manuelle Annotierung]] - [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:lipp_tutorial_2011_f_schluss.pdf|Schlussbemerkungen]] 
 +===== Ablaufplan ===== 
 + 
 +=== Teil 1 (Vormittag) === 
 +**09:00 - 12:00**: Ludwigstr. 25, **Raum 212** 
 + 
 +  * Einleitung 
 +  * Korpusaufbereitung und automatische Annotierung 
 +  * **Ü1** (Europarl mit CQPDemo) 
 +  * Alignment und Übersetzungskandidaten 
 +  * //Kaffeepause// :-D 
 +  * Das STTS-Tagset 
 +  * Reguläre Ausdrücke und CQP-Syntax 
 +  * **Ü2** (Europarl mit CQPweb und CQP-Syntax) 
 + 
 +=== Teil 2 (Nachmittag) === 
 +**14:00 - 17:00**: Schellingstr. 3 VGB, **Raum S227** 
 + 
 +  * **Ü3** (diachrone Suche mit dem DWDS-Webinterface) 
 +  * CQP für Fortgeschrittene: XML-Attribute und morphologische Features 
 +  * **Ü4** (Abfrage von Chunks und morphologischen Merkmalen) 
 +  * //Kaffeepause// 8-o 
 +  * **Demo** Verwendung von syntaktischen Parsern, Einlesen und Abfrage in TIGERSearch 
 +  * **Ü5** (Abfrage komplexer Datenstrukturen mit ANNIS) 
 +  * Manuelle Annotation (Guidelines, Agreement, Tools) 
 +  * **Demo** Manuelle Annotation in EXMARaLDA
  
 ===== Dozenten ===== ===== Dozenten =====