Mattino:
Validazione
- Stima dell’errore out-of-sample
- Metodo della validazione e della cross-validazione
- Cross-validazione per la stima degli iper-parametri incogniti di un modello di machine learning
Metriche di performance
- Valutazione delle performance del modello tramite metriche e indicatori quantitativi
- Curva ROC e AUC
- Quantità: False positive, Falsi negative, True positive, True negative
- Metriche per problemi di classificazione in cui le classi sono sbilanciate
Laboratorio pratico esempio regolarizzazione/validazione
- Esempi pratici dell’utilizzo di regolarizzazione e validazione per la stima e la valutazione delle performance di un modello di machine learning
Pomeriggio:
Alberi decisionali e random forest
- Descrizione delle tecniche ad albero per la classificazione e regressione
- Selezione automatica dai delle variabili più importanti
- La tecnica del bagging per la riduzione della varianza del modello
Introduzione alle Neural Networks, Reti neurali percettrone multistrato
- Struttura di una rete neurale a percettrone multistrato (MLP)
- Funzioni di attivazione
- Teorema di approssimazione universale
- Funzione di costo per il training delle reti neurali MLP
- Metodo della backpropagation per la stima del gradiente della funzione di costo
- Reti neurali per regressione e classificazione
Laboratorio pratico alberti decisionali/random forest
- Esempi pratici dell’utilizzo di tecniche ad albero per la classificazione e selezione delle features