Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
corpus_tutorial:dgfs2013 [2012/11/09 10:21]
schtepf
corpus_tutorial:dgfs2013 [2013/03/12 19:17] (current)
schtepf [Materialien]
Line 2: Line 2:
  
 **Einführung in die Statistik für Linguisten mit dem Softwarepaket "R"**\\ **Einführung in die Statistik für Linguisten mit dem Softwarepaket "R"**\\
-//[[http://www.sfb632.uni-potsdam.de/~dgfs-2013|35. Jahrestagung der DGfS]], Universität Potsdsam, 12 März 2013, 10:00--18:00//+//[[http://www.sfb632.uni-potsdam.de/~dgfs-2013|35. Jahrestagung der DGfS]], Universität Potsdam, 12März 2013, 10:00--18:00 (Haus 4, Raum 0.03-0.04)// 
 + 
 +{{:icon_warn.png?nolink&28 |}} **Raumänderung:** Aufgrund der großen Teilnehmerzahl findet das Statistik-Tutorium in **Haus 4, Raum 0.03-0.04** (//SunRay-Pool//) statt.
  
 <sup>[[:corpus_tutorial|(back to overview page)]]</sup> <sup>[[:corpus_tutorial|(back to overview page)]]</sup>
Line 10: Line 12:
 Dieses Tutorium richtet sich an interessierte Linguisten ohne Vorkenntnisse. Die Teilnehmer lernen, konkrete Aufgabenstellungen mit dem frei verfügbaren Softwarepaket "R" zu bearbeiten. Statistische Ansätze spielen in allen linguistischen Disziplinen eine zunehmend wichtige Rolle bei der Auswertung empirischer Daten. Dabei fällt der Einstieg in die Anwendung sowie in das Verständnis solcher Verfahren oft schwer. Ziel des Tutoriums ist es daher, grundlegende statistische Verfahren mit einfachen linguistischen Beispielen auf Einstiegsniveau zu erklären und umzusetzen. Dieses Tutorium richtet sich an interessierte Linguisten ohne Vorkenntnisse. Die Teilnehmer lernen, konkrete Aufgabenstellungen mit dem frei verfügbaren Softwarepaket "R" zu bearbeiten. Statistische Ansätze spielen in allen linguistischen Disziplinen eine zunehmend wichtige Rolle bei der Auswertung empirischer Daten. Dabei fällt der Einstieg in die Anwendung sowie in das Verständnis solcher Verfahren oft schwer. Ziel des Tutoriums ist es daher, grundlegende statistische Verfahren mit einfachen linguistischen Beispielen auf Einstiegsniveau zu erklären und umzusetzen.
  
-Im Rahmen des Tutoriums wird u.a. gezeigt, wie Unterschiede zwischen Häufigkeitsdaten aus Korpusressourcen unterschiedlicher Größe auf Signifikanz getestet werden können (Fallbeispiele: Benutzen Deutschlerner Reflexivverben genauso oft wie Muttersprachler? Verhalten sich Lerner mit unterschiedlichen Muttersprachen gleich?) und wie ein Zusammenhang zwischen kategorialen Merkmalen wie Informationsstruktur und Wortstellung in experimentellen Daten nachgewiesen werden kann (Fallbeispiel: Stellung im topologischen Feldermodell und Informationsstatus). Die Verwendung des kostenlosen und quelloffenen Programms "R" stellt sicher, dass Teilnehmer die vorgeführten Studien anhand der zur Verfügung gestellten Daten und Skripte auf dem eigenen Rechner reproduzieren und ihr Wissen mit weiterführender Literatur über das Tutorium hinaus erweitern können. +Im Rahmen des Tutoriums wird u.a. gezeigt, wie Unterschiede zwischen Häufigkeitsdaten aus Korpusressourcen unterschiedlicher Größe auf Signifikanz getestet werden können (Fallbeispiele: //Benutzen Deutschlerner Reflexivverben genauso oft wie Muttersprachler? Verhalten sich Lerner mit unterschiedlichen Muttersprachen gleich?//) und wie ein Zusammenhang zwischen kategorialen Merkmalen wie Informationsstruktur und Wortstellung in experimentellen Daten nachgewiesen werden kann (Fallbeispiel: //Stellung im topologischen Feldermodell und Informationsstatus//). Die Verwendung des kostenlosen und quelloffenen Programms "R" stellt sicher, dass Teilnehmer die vorgeführten Studien anhand der zur Verfügung gestellten Daten und Skripte auf dem eigenen Rechner reproduzieren und ihr Wissen mit weiterführender Literatur über das Tutorium hinaus erweitern können. 
  
-//Auf Anregung der Teilnehmer des ersten Statistik-Tutoriums 2012 findet dieses Tutorium als **ganztägige** Veranstaltung statt, um der Komplexität des zu behandelnden Stoffes gerecht zu werden.//+Auf Anregung der Teilnehmer des ersten Statistik-Tutoriums 2012 findet dieses Tutorium als **ganztägige** Veranstaltung statt, um der Komplexität des zu behandelnden Stoffes gerecht zu werden.  Das Tutorium ist für TeilnehmerInnen der Jahrestagung kostenfrei.  Aus organisatorischen Gründen können wir nur eine begrenzte Zahl an Arbeitsplätzen anbieten und bitten daher um eine Registrierung im Vorfeld über das Formular der allgemeinen Tagungsanmeldung.
  
-===== Materialien =====+===== Zeitplan =====
  
-{{:under_construction.png?32}}+  * 10:00-12:00        Einleitung, Häufigkeitsvergleich 
 +    * Mittagspause 
 +  * 13:00-14:30        erste Schritte mit R + Übung 1 
 +    * Kaffee-Pause 
 +  * 15:00-16:10        Konfidenzintervalle + Übung 2 
 +    * Kurze Pause 
 +  * 16:25-18:00        Kreuztafeln und Assoziation + Übung 3 
 + 
 +===== Materialien =====
  
 +  * Folien: {{:corpus_tutorial:DGfS_CL_stat2013_v2.pdf|PDF}}, {{:corpus_tutorial:DGfS_CL_stat2013_v2.ppt|PPT}} -- //aktualisiert am 12.03.2013//
 +  * [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:DGfS_CL13_data_v2.zip|Daten]] -- //aktualisiert am 11.03.2013//
 +  * Übungsaufgaben Häufigkeitsvergleich: [[http://wordspace.collocations.de/lib/exe/fetch.php/corpus_tutorial:loesung.pdf|Lösung]]
 ===== Dozenten ===== ===== Dozenten =====
  
Line 26: Line 39:
  
   * [[http://www.r-project.org/|R Homepage]] (u.a. Installationspakete für Windows, Mac OS X und Linux)   * [[http://www.r-project.org/|R Homepage]] (u.a. Installationspakete für Windows, Mac OS X und Linux)
 +  * [[http://www.rstudio.com/|RStudio]] (anwenderfreundliche GUI für Windows, Mac OS X und Linux)
   * [[http://www.linguistics.ruhr-uni-bochum.de/dgfs-cl/|Homepage der Sektion Computerlinguistik]]   * [[http://www.linguistics.ruhr-uni-bochum.de/dgfs-cl/|Homepage der Sektion Computerlinguistik]]