APPRENDIMENTO AUTOMATICO IN MEDICINA
2014/2015
2014/2015
DM270
ING-INF/06 (BIOINGEGNERIA ELETTRONICA E INFORMATICA)
DIPARTIMENTO DI INGEGNERIA INDUSTRIALE E DELL'INFORMAZIONE
BIOINGEGNERIA
PERCORSO COMUNE
SECONDO SEMESTRE (02/03/2015 - 12/06/2015)
6
45 ore di attività frontale
ITALIANO
SCRITTO E ORALE CONGIUNTI
BELLAZZI RICCARDO - 6 CFU
Vengono richieste conoscenze di base sulla teoria delle probabilità e di statistica. Per la parte pratica, viene richiesta una certa dimestichezza con l’uso degli strumenti informatici.
Il corso si propone di fornire allo studente competenze metodologiche e tecniche per: - impiegare in ambito biomedico una vasta classe di algoritmi che sono in grado di apprendere regole decisionali da dati e di migliorare automaticamente le loro prestazioni sulla base dell’esperienza. Lo studente, alla fine del corso, deve essere in grado di: - impiegare un percorso metodologicamente adeguato per apprendere modelli decisionali dai dati - utilizzare strumenti software e pacchetti statistici di apprendimento automatico. Il corso conterrà sia lezioni teoriche che esercitazioni pratiche al calcolatore
Apprendimento di regole decisionali
Introduzione al corso: Apprendimento automatico e Data mining nelle scienze biomediche.
Ambiti di applicazione dei metodi automatici per la classificazione: diagnosi, prognosi, ricerca
I concetti di base: esempi, istanze, attributi e rappresentazione delle regole decisionali
Apprendimento supervisionato
Alberi decisionali: apprendimento, tecniche di pruning
Metodi bayesiani: Naive Bayes, analisi discriminante
Modelli di regressione: modello lineare, regressione logistica, reti neurali, support-vector machines
Metodo k-nearest e misure di distanza
Apprendimento di regole: metodi di covering, metodi beam-search
Tecniche di feature selection. Information gain e Relief
Valutazione degli algoritmi di apprendimento e problemi di valutazione in ambito biomedico
Training e Testing. Accuratezza, calibrazione, specificità e sensitività, precisione e recall, misura F
Metodi per la valutazione delle prestazioni. Cross validazione, Bootstrap e Curve ROC.
Apprendimento non supervisionato
Regole di associazione
Metodi di clustering: K-means, K-medoids, clustering gerarchico, Self-organizing maps
Valutazione dei risultati dei metodi di clustering
Metodologie per il data mining in bio-medicina
Applicazioni del data mining in bio-medicina: diagnosi, prognosi, classificazione, genomica funzionale
La metodologia CRISP per il data mining in bio-medicina.
Esercitazioni e laboratori
Uso dei software Orange, Weka e Matlab per la soluzione di problemi di classificazione.
Soluzione di problemi su data set forniti durante il corso.
Lezioni (ore/anno in aula): 40
Esercitazioni (ore/anno in aula): 100
Attività pratiche (ore/anno in aula): 0
T. Mitchell. Machine Learning. Mc Graw Hill..
P. Tan, M. Steinbach, V. Kumar. Introduction to data mining. Addison Wesley..
I. Witten, E. Frank. Data mining. Morgan Kaufmann.
Riccardo Bellazzi. Slides delle lezioni.
L'esame comprende una prova scritta e la consegna di una relazione.