Tutorium der Sektion Computerlinguistik (DGfS 2011, Göttingen)

Korpuslinguistik mit Online-Ressourcen — eine interaktive Einführung für Linguisten
Georg-August-Universität Göttingen, 22.02.2011, 14:00–18:00, VG 1.103 (Verfügungsgebäude)

(back to overview page)

Beschreibung

Die Sektion Computerlinguistik der DGfS wird im Rahmen der Jahrestagung 2011 in Göttingen zum zweiten Mal ein Tutorium ausrichten, das eine Einführung in ein computerlinguistisches Thema bietet, ohne irgendwelche Grundkenntnisse zu erfordern. Ziel ist, ausgewählte computerlinguistische Methoden und Ressourcen bekannt zu machen und ihre Einsatzmöglichkeiten für die linguistische Forschung anhand geeigneter Beispiele zu illustrieren.

Wegen der guten Resonanz wiederholen wir die erste Auflage des Tutoriums in Berlin. Das Tutorium richtet sich speziell an alle Linguisten, die empirische Daten in ihre linguistische Analyse mit einbeziehen wollen, aber bisher keinen oder wenig Zugang zu linguistisch aufbereiteten Korpusdaten hatten. Sucht man z. B. nach einem passenden Verwendungsbeleg für ein Wort, ist das Internet eine dankbare und oft genutzte Quelle – allerdings mit unsicherer Datenbasis, sehr beschränkten Suchmöglichkeiten und ohne weiterführende linguistische Analyse. Linguistische Korpora hingegen sind inhaltlich dokumentiert und unterstützen die Suche nach linguistisch komplexen Anfragen und Generalisierungen. Online-Schnittstellen ermöglichen die komfortable Nutzung solcher Korpora auch ohne umfangreiche Informatikkenntnisse.

Um den Mehrwert von Korpora gegenüber dem Internet vollständig auszuschöpfen, ist es allerdings nötig, sich in die Bedienung der Korpustools und ihrer Online-Schnittstellen einzuarbeiten. Ziel unseres Tutoriums ist, genau diesen Schritt zu unterstützen. Anhand linguistischer Fragestellungen werden die TeilnehmerInnen interaktiv in den Umgang mit zwei konkreten Korpusschnittstellen eingeführt: CQPweb und die Websuche des Projekts Digitales Wörterbuch der Deutschen Sprache DWDS. Neben der eigenen Arbeit mit den Online-Ressourcen erhalten die TeilnehmerInnen Einblick in computerlinguistische Methoden, die bei der Aufbereitung der Korpora eingesetzt wurden (Segmentierung, Wortarten-Tagging).

Wir würden uns freuen, wenn Sie sich für das Tutorium interessieren. Die Teilnahme ist für TeilnehmerInnen der Jahrestagung kostenfrei. Aus organisatorischen Gründen können wir nur eine begrenzte Zahl an Arbeitsplätzen anbieten und bitten daher um eine Registrierung im Vorfeld über das Formular der allgemeinen Tagungsanmeldung. Für das Tutorium werden eine Reihe Netbooks zur Verfügung gestellt. Es wird jedoch empfohlen, den eigenen Laptop (mit einem installierten Web-Browser) mitzubringen.

Linguistische Fallbeispiele

Im Rahmen des Tutoriums werden wir uns u.a. mit folgenden linguistischen Fragestellungen beschäftigen:

  • “Wie es im Buche steht.”
    Wird das Dativ -e im Jahr 2011 noch realisiert? Lässt sich eine zeitliche Veränderung durch die letzten Jahrzehnte beobachten?
  • “gegenseitiges Vertrauen”
    Welche Adjektive werden typischerweise mit dem Nomen Vertrauen verwendet?
  • “ohne Dirigent”
    Stimmt die Dudenregel, dass Substantive ohne Artikel und Adjektiv tendenziell keine Kasusendung tragen?

Online-Zugriff

Materialien

  • Handout mit Beispielanfragen und Übungsaufgaben (PDF)

Dozenten

  • Stefanie Dipper (Juniorprofessorin für Computerlinguistik, Ruhr-Universität Bochum)
  • Heike Zinsmeister (Margarete von Wrangell-Habilitandin, Universität Konstanz)

Weitere Informationen