ADVANCED BIOMEDICAL MACHINE LEARNING
Stampa
Anno immatricolazione
2020/2021
Anno offerta
2021/2022
Normativa
DM270
SSD
ING-INF/06 (BIOINGEGNERIA ELETTRONICA E INFORMATICA)
Dipartimento
DIPARTIMENTO DI INGEGNERIA INDUSTRIALE E DELL'INFORMAZIONE
Corso di studio
COMPUTER ENGINEERING
Curriculum
Embedded and Control Systems
Anno di corso
Periodo didattico
Secondo Semestre (07/03/2022 - 17/06/2022)
Crediti
6
Ore
46 ore di attività frontale
Lingua insegnamento
Inglese
Tipo esame
SCRITTO
Docente
DAGLIATI ARIANNA (titolare) - 3 CFU
ABU-HANNA AMEEN - 3 CFU
Prerequisiti
E' consigliabile avere competenze di base di apprendimento automatico
Obiettivi formativi
In questo corso vengono presentate diverse metodologie avanzate di apprendimento automatico, con un focus specifico sull'analisi di dati biomedici. Particolare rilevanza sarà data agli aspetti pratici, con numerosi laboratori in cui verrà illustrata l'applicazione delle metodologie su dataset biomedici reali.
Durante il corso verranno utilizzati due software: R e KNIME. R è un ambiente all'avanguardia per il calcolo statistico, che include una varietà di pacchetti per l'apprendimento automatico. KNIME è una suite di software per l'analisi dei dati che contiene al suo interno molti dei metodi che utilizzeremo nel corso. Useremo questi strumenti per esplorare , inclusi approcci computazionali ispirati alla natura, elaborazione del linguaggio naturale e data mining temporale, nonché metodi di valutazione e considerazioni etiche.

Obiettivi di apprendimento del corso:
1. Dimostrare familiarità con la letteratura sui metodi avanzati di data mining
2. Presentare e discutere l'applicazione di metodi avanzati per l'analisi di dati biomedici
3. Eseguire analisi di dati biomedici utilizzando metodi e strumenti avanzati di data mining
Programma e contenuti
Dati biomedici: caratteristiche specifiche
Metodologie per la gestione dei missing values
Tecniche per la riduzione della dimensionalità
Ensemble classifiers: Random Forests, AdaBoost, Gradient Boosting
Natural Language Processing
Naturally Inspired algorithms: algoritmi genetici, reti neurali e deep learning, evolution-based machine learning
Electronic Phenotyping
Validazione dei metodi di machine learning
Metodi didattici
Il corso è strutturato con una serie di lezioni frontali e diversi laboratori, in cui i docenti mostrano l'applicazione delle metodologie presentate a lezione su casi di studio reali, utilizzando i software R e KNIME.
Testi di riferimento
Slides, lezioni registrate e riferimenti bibliografici sono tutti disponibili sulla pagina del corso sulla piattaforma Kiro.
Modalità verifica apprendimento
La valutazione del corso si articola in due parti:
1) Journal Club (25% del voto finale). I Journal Club (JC) si svolgono all'inizio di ogni lezione "pratica" del corso, e vertono sull'argomento specifico del laboratorio stesso. Per ogni JC i docenti scelgono un articolo scientifico particolarmente rilevante per stimolare la discussione sull'argomento in esame. Il JC è strutturato come segue: 1 o 2 studenti sono incaricati di leggere l'articolo e presentarlo in classe durante il JC. Altri due studenti leggono l'articolo e propongono 1-2 domande a testa. Dopo di che la discussione è aperta a tutta la classe, inclusi i docenti.
2) Progetto finale (75% del voto finale)
Il progetto finale comprende due deliverable: un paper e una presentazione in classe. L'obiettivo del progetto è dimostrare la capacità di identificare un set di dati biomedici tra i dati disponibile nei numerosi repository di dati biomedici e di salute pubblica, la capacità di formulare una "research question" generale, e la capacità di impostare una pipeline di machine learning completa in grado di rispondere alla research question formulata.
Il progetto può essere svolto individualmente o in gruppo. Ogni studente (o gruppo) presenterà il progetto durante le lezioni finali del corso. Gli elaborati verranno consegnati ai docenti al termine del corso.
Altre informazioni
NA
Obiettivi Agenda 2030 per lo sviluppo sostenibile