FONDAMENTI DI ANALISI DEI DATI
Stampa
Anno immatricolazione
2020/2021
Anno offerta
2020/2021
Normativa
DM270
SSD
MAT/05 (ANALISI MATEMATICA)
Dipartimento
DIPARTIMENTO DI MATEMATICA 'FELICE CASORATI'
Corso di studio
MATEMATICA
Curriculum
PERCORSO COMUNE
Anno di corso
Periodo didattico
Secondo Semestre (01/03/2021 - 11/06/2021)
Crediti
3
Ore
24 ore di attività frontale
Lingua insegnamento
ITALIANO
Tipo esame
ORALE
Docente
DUMA DAVIDE - 3 CFU
Prerequisiti
Corsi di base di Analisi ed Analisi Numerica
Obiettivi formativi
Il corso intende offrire agli studenti una panoramica degli aspetti teorici e applicativi dell’analisi dei dati, mostrando i principali risultati e offrendo la possibilità di applicare la teoria a problemi concreti.
Programma e contenuti
- Ripasso di elementi di geometria, algebra lineare, e probabilità in spazi di dimensione alta.
- Il lemma di Johnson-Lindenstrauss.
- Gaussiane in dimensione alta. Fitting di dati su una Gaussiana sferica.
- Decomposizione in Valori Singolari (SVD)
- Best rank k-approximations
- Applicazioni di SVD: Principal Component Analysis (PCA), Clustering a mistura di Gaussiane sferiche, Max-Cut Problem
- Overfitting a Convergenza Uniforme. Il rasoio di Occam. Apprendimento di alberi decisionali.
- Support Vector Machine (SVM) e dimensione VC.
- Clustering: k-means, k-center, Spectral clustering, Recursive clustering e tagli sparsi, partizionamento di grafi e ricerca di “communites”.
Metodi didattici
Lezioni e laboratorio
Testi di riferimento
Avrim Blum, John Hopcroft, Ravindran Kannan. “Foundations of Data Science”. Cambridge University Press, Jan 23, 2020
Modalità verifica apprendimento
Progetto finale, presentazione ed esame orale
Altre informazioni