Sei in: Home > Corsi di insegnamento > Data Mining: Modellazione Statistica e Apprendimento Automatico dei Dati
 
 

Data Mining: Modellazione Statistica e Apprendimento Automatico dei Dati

 

Data Mining, Statistical Modeling and Machine Learning

 

Anno accademico 2017/2018

Codice attività didattica
INT0911
Docente
Dott. Ciro Cattuto (Titolare del corso)
Corso di studio
Laurea Magistrale Interateneo in Fisica dei sistemi complessi
Anno
1° anno, 2° anno
Periodo didattico
Secondo periodo didattico
Tipologia
C=Affine o integrativo
Crediti/Valenza
6
SSD attività didattica
FIS/02 - fisica teorica, modelli e metodi matematici
Erogazione
Tradizionale
Lingua
Italiano
Frequenza
Obbligatoria
Tipologia esame
Orale
Prerequisiti
  • Italiano
  • English
Analisi matematica, algebra lineare, elementi di statistica e probabilità.
Propedeutico a
  • Italiano
  • English



 
 

Obiettivi formativi

  • Italiano
  • English

Il corso si pone l'obiettivo di fornire competenze di base per l'analisi e la modellazione statistica dei dati, con speciale attenzione alle tecniche di apprendimento automatico (machine learning) in contesti sia descrittivi che predittivi. Il corso ha un forte carattere interdisciplinare e copre argomenti tradizionalmente trattati in corsi di laurea di computer science e statistica. Un importante obiettivo del corso è la conoscenza operativa delle tecniche e degli algoritmi trattati. Le lezioni teoriche si alterneranno perciò ad esercitazioni al computer.

 

Risultati dell'apprendimento attesi

  • Italiano
  • English

- compresione teorica dei fondamenti dell'apprendimento automatico (machine learning) dai dati

- capacità di usare alcune librerie Python per il machine learning nel contesto di semplici applicazioni

 

Programma

- The major paradigms of learning from data, the learning problem, the feasibility of learning

- The architecture of machine learning algorithms: model structure, scoring, and search

- The theory of generalization, the Vapnik-Chervonenkis generalization bound, model complexity penalization, the approximation-generalization tradeoff, bias and variance, the learning curve

- Models and Patterns: parametric and non-parametric models, regression models

- Score functions and optimization techniques. Gradient descent and stochastic gradient descent.

- Linear Models: linear classification, linear regression, ordinary least squares, logistic regression, non-linear transformations

- Overfitting and Regularization: model complexity and overfitting, commonly used regularizers, weight decay and lasso.

- Validation and Cross-Validation: validation set, leave-one-out cross validation, K-fold cross-validation

- Descriptive Modeling: density models, mixture models, the Expectation-Maximization algorithm, cluster analysis, the K-means algorithm, hierarchical clustering

- Predictive Modeling for Classification: linear discriminants, tree models, nearest-neighbor methods, Naive Bayes, feature selection

- Predictive Modeling for Regression: linear regression, generalized linear models

- Singular Value Decomposition, Matrix Factorization, and applications

- Content-based retrieval: text representation and classification, term weighting, latent semantic indexing

 

Modalità di insegnamento

  • Italiano
  • English

Lezioni alla lavagna e con diapositive, ed esercizi al computer.

 

Modalità di verifica dell'apprendimento

  • Italiano
  • English

Discussione alla lavagna ed esercitazioni interattive al computer.

 

Attività di supporto

  • Italiano
  • English



 

Testi consigliati e bibliografia

  • Italiano
  • English

- Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin, "Learning from Data"AMLBook 2012

 

Note

  • Italiano
  • English

Le esercitazioni del corso richiedono la capacità di scrivere ed eseguire semplici programmi in Python. La conoscenza del linguaggio di programmazione Python non è richiesta ma ci si aspetta che gli studenti si impegnino per acquisire una sufficiente competenza nell'uso di Python in parallelo alle lezioni del corso.

 

Orario lezioniV

GiorniOreAula
Lunedì14:00 - 17:00Aula Avogadro Dipartimento di Fisica
Venerdì9:00 - 13:00

Lezioni: dal 23/01/2017 al 15/03/2017

Nota: IL CORSO INIZIERA' IL 23 GENNAIO 2017

La aule del venerdì sono le seguenti:

27 gennaio aula G + info B

3 febbraio aula D + info B

10 febbraio aula info TO Expo

17 febbraio aula info TO Expo

24 febbraio aula info TO Expo

3 marzo aula info TO Expo

10 marzo aula info TO Expo

Registrazione
  • Aperta
     
    Ultimo aggiornamento: 08/07/2017 15:54
    Campusnet Unito
    Non cliccare qui!