LABORATORIO DI ANALISI DI DATI LINGUISTICI (C. P.)
Stampa
Anno immatricolazione
2018/2019
Anno offerta
2018/2019
Normativa
DM270
SSD
L-LIN/01 (GLOTTOLOGIA E LINGUISTICA)
Dipartimento
DIPARTIMENTO DI STUDI UMANISTICI
Corso di studio
LINGUISTICA TEORICA, APPLICATA E DELLE LINGUE MODERNE
Curriculum
PERCORSO COMUNE
Anno di corso
Periodo didattico
Secondo Semestre (25/02/2019 - 05/06/2019)
Crediti
6
Ore
36 ore di attività frontale
Lingua insegnamento
ITALIANO
Tipo esame
ORALE
Docente
JEZEK ELISABETTA (titolare) - 6 CFU
Prerequisiti
Nozioni di base di linguistica generale, in particolare morfologia, sintassi, semantica e pragmatica, come vengono fornite negli insegnamenti di laurea triennale di area umanistica.
Obiettivi formativi
Il corso ha l'obiettivo di rendere gli studenti capaci di raccogliere e analizzare dati linguistici da una molteplicità di prospettive, e conoscere le principali risorse linguistiche digitali a disposizione (corpora, lessici, concordance tools, banche dati, basi di conoscenza, datasets, ontologie, ecc.). Al termine del corso lo studente possiederà gli strumenti per progettare e condurre autonomamente un'analisi linguistica utilizzando metodologie basate prevalentemente sull'annotazione manuale o semiautomatica dei dati, allo scopo di estrarre o verificare generalizzazioni linguistiche per scopi teorici o applicativi.
Programma e contenuti
DATI E MODELLI PER RISORSE MULTILINGUE

Il corso di quest'anno introduce gli studenti alla varietà di dati disponibili per l'analisi linguistica (corpora, giudizi di accettabilità, dati elicitati, sperimentali, ecc.), concentrando l'attenzione sulle risorse multilingui.

Con l'ausilio di letture selezionate, sono esaminate la creazione, l'annotazione e la struttura di tali risorse e è sperimentato in laboratorio il loro utilizzo per l'analisi linguistica e le applicazioni nel trattamento automatico del linguaggio.
Metodi didattici
Lezioni frontali interattive
Slides
Incontri seminariali con presentazioni di gruppo delle letture e discussione
Laboratorio
Testi di riferimento
Testo di riferimento

Jezek, Elisabetta 2016. The Lexicon: An Introduction, Oxford: Oxford University Press.

Letture

Abzianidze Lasha, Bjerva Johannes, Evang Kilian, Haagsma Hessel, van Noord Rik, Ludmann Pierre, Nguyen Duc-Duy, Bos Johan. 2017. "The Parallel Meaning Bank: Towards a Multilingual Corpus of Translations Annotated with Compositional Meaning Representations". In: Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics (EACL), pp 242–247, Valencia, Spain.

Baisa Vít, Može Sara and Irene Renau. 2016. "Multilingual CPA: Linking Verb Patterns across Languages." In: Margalitadze, Tinatin and George Meladze (eds) Proceedings of the XVII Euralex International Congress: Lexicography and Linguistic Diversity, pp. 410-417.

Bender, Emily M. 2016. "Linguistic Typology in Natural Language Processing". Linguistic Typology 20(3), pp. 645-660.

Boas, Hans C. 2005. "Semantic frames as interlingual representations for multilingual lexical databases." International Journal of Lexicography 18, no. 4, pp. 445-478.

Fellbaum Christiane, and Piek Vossen. 2012. "Challenges for a multilingual wordnet." Language Resources and Evaluation 46, no. 2, pp. 313-326.

Havasi Catherine, Speer Robert, and Jason Alonso. 2007. "ConceptNet 3: a flexible, multilingual semantic network for common sense knowledge." In Recent advances in natural language processing, pp. 27-29. Philadelphia, PA: John Benjamins.

Navigli, Roberto, and Simone Paolo Ponzetto. 2012. "BabelNet: The automatic construction, evaluation and application of a wide-coverage multilingual semantic network." Artificial Intelligence 193, pp. 217-250.

Pianta Emanuele, Bentivogli Luisa and Christian Girardi. 2002. MultiWordNet: Developing an aligned multilingual database, in: Proceedings of the 1st International Global WordNet Conference, pp. 21–25.
Modalità verifica apprendimento
Prova orale di verifica dell’apprendimento dei contenuti del corso.
Discussione dell'indagine empirica di un fenomeno linguistico a scelta dello studente, concordato con la docente, utilizzando una delle risorse analizzare o creando ex novo una risorsa della stessa tipologia.
Elaborato scritto di 5 cartelle riportante ipotesi, scopo, metodologia e risultati dell'analisi empirica, da inviare a jezek@unipv.it al più tardi 7 gg prima della data dell'appello d'esame.
Altre informazioni
Tutto il materiale didattico - elenco aggiornato delle letture, slides delle lezioni, link a risorse linguistiche, istruzioni per l'elaborato finale - è disponibile sul portale della didattica KIRO (accesso con credenziali di Ateneo).
Obiettivi Agenda 2030 per lo sviluppo sostenibile