LABORATORIO DI ANALISI DI DATI LINGUISTICI (C. P.)
Stampa
Anno immatricolazione
2016/2017
Anno offerta
2016/2017
Normativa
DM270
SSD
L-LIN/01 (GLOTTOLOGIA E LINGUISTICA)
Dipartimento
DIPARTIMENTO DI STUDI UMANISTICI
Corso di studio
LINGUISTICA TEORICA, APPLICATA E DELLE LINGUE MODERNE
Curriculum
PERCORSO COMUNE
Anno di corso
Periodo didattico
Secondo Semestre (27/02/2017 - 01/06/2017)
Crediti
6
Ore
36 ore di attività frontale
Lingua insegnamento
Italiano
Tipo esame
ORALE
Docente
JEZEK ELISABETTA (titolare) - 6 CFU
Prerequisiti
Nozioni di base di linguistica generale.
Obiettivi formativi
Il corso ha come obiettivo quello di rendere gli studenti capaci di riconoscere, descrivere e analizzare dati linguistici da una molteplicità di prospettive, attraverso l'uso delle principali risorse linguistiche digitali a disposizione (corpora, lessici, concordance tools, banche dati, basi di conoscenza, ecc.).
Programma e contenuti
Il corso focalizza l'attenzione su due tipi di corpora:

- corpora interattivi (social media networks, forums, blogs)
- corpora di notizie giornalistiche, editoriali.

Attraverso letture dedicate, sono indagate la creazione, annotazione, struttura di tali corpora e il loro utilizzo per l'analisi linguistica e le applicazioni computazionali.
Metodi didattici
Lezioni frontali
Slides
Laboratorio
Tutorato
Testi di riferimento
Baldwin T., Cook P., Lui M., MacKinlay A. and L. Wang. 2013. "How Noisy Social Media Text, How Diffrnt Social Media Sources?" In Proceedings of the International Joint Conference on Natural Language Processing, pages 356–364, Nagoya, Japan, 14-18 October 2013.

Bender, E.M., Morgan, J.T., Oxley, M., Zachry, M., Hutchinson, B., Marin, A., Zhang, B. and M. Ostendorf. 2011. "Annotating social acts: Authority claims and alignment moves in wikipedia talk pages." In Proceedings of the Workshop on Languages in Social Media, pp. 48-57. Association for Computational Linguistics.

Celli F., Riccardi G. and F. Alam. 2016. "Multilevel annotation of agreement and disagreement in italian news blogs". In Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), Portoroz, Slovenia.

Herdağdelen, A. and M. Marelli 2016. "Social Media and Language Processing: How Facebook and Twitter Provide the Best Frequency Estimates for Studying Word Recognition". In Cognitive Science, pp. 1-20. http://onlinelibrary.wiley.com/doi/10.1111/cogs.12392/full

Mohammad, S. M., Kiritchenko S., Sobhani P., Zhu X., and C. Cherry. 2016 "A dataset for detecting stance in tweets." In Proceedings of 10th edition of the the Language Resources and Evaluation Conference (LREC 2016), Portoroz, Slovenia.

Oraby, S., Reed L., Compton R., Riloff E., Walker M. and S. Whittaker. 2015 "And That’s A Fact: Distinguishing Factual and Emotional Argumentation in Online Dialogue." In Proceedings of the 2nd Workshop on Argumentation Mining, pp. 116-126.

Zubiaga, A., Liakata, M., Procter, R., Hoi, G.W.S. and P. Tolmie. 2016. "Analysing how people orient to and spread rumours in social media by looking at conversational threads". In PloS one, 11(3), pp. 1-29.

Ulteriori letture per gli incontri seminariali saranno fornite dalla docente all’inizio delle lezioni e rese disponibile sul portale della didattica Kiro.
Modalità verifica apprendimento
Prova orale di verifica dell’apprendimento dei contenuti del corso.
Indagine empirica di un fenomeno linguistico a scelta dello studente, concordato con la docente, utilizzando uno dei corpora analizzati o creando un corpus ad hoc della stessa tipologia.
Elaborato scritto di 8 cartelle riportante i risultati dell'analisi empirica, da inviare a jezek@unipv.it 7 gg prima della data dell'appello d'esame.
Altre informazioni
-
Obiettivi Agenda 2030 per lo sviluppo sostenibile