Data Mining: Modellazione Statistica e Apprendimento Automatico dei Dati

 

Data Mining, Statistical Modeling and Machine Learning

 

Anno accademico 2017/2018

Codice attività didattica
INT0911
Docenti
Dott. Ciro Cattuto (Titolare del corso)
Laetitia Emilie Gauvin (Titolare del corso)
Dott. Andre' Panisson (Titolare del corso)
Corso di studio
Laurea Magistrale Interateneo in Fisica dei sistemi complessi
Anno
1° anno, 2° anno
Periodo didattico
Secondo periodo didattico
Tipologia
C=Affine o integrativo
Crediti/Valenza
6
SSD attività didattica
FIS/02 - fisica teorica, modelli e metodi matematici
Erogazione
Tradizionale
Lingua
Italiano
Frequenza
Obbligatoria
Tipologia esame
Orale
Prerequisiti
  • Italiano
  • English
Analisi matematica, algebra lineare, elementi di statistica e probabilità.
Propedeutico a
  • Italiano
  • English



 
 

Obiettivi formativi

  • Italiano
  • English

Il corso si pone l'obiettivo di fornire competenze di base per l'analisi e la modellazione statistica dei dati, con speciale attenzione alle tecniche di apprendimento automatico (machine learning) in contesti sia descrittivi che predittivi. Il corso ha un forte carattere interdisciplinare e copre argomenti tradizionalmente trattati in corsi di laurea di computer science e statistica. Un importante obiettivo del corso è la conoscenza operativa delle tecniche e degli algoritmi trattati. Le lezioni teoriche si alterneranno perciò ad esercitazioni al computer.

 

Risultati dell'apprendimento attesi

  • Italiano
  • English

- compresione teorica dei fondamenti dell'apprendimento automatico (machine learning) dai dati

- capacità di usare alcune librerie Python per il machine learning nel contesto di semplici applicazioni

 

Programma

- The major paradigms of learning from data, the learning problem, the feasibility of learning

- The architecture of machine learning algorithms: model structure, scoring, and search

- The theory of generalization, the Vapnik-Chervonenkis generalization bound, model complexity penalization, the approximation-generalization tradeoff, bias and variance, the learning curve

- Models and Patterns: parametric and non-parametric models, regression models

- Score functions and optimization techniques. Gradient descent and stochastic gradient descent.

- Linear Models: linear classification, linear regression, ordinary least squares, logistic regression, non-linear transformations

- Overfitting and Regularization: model complexity and overfitting, commonly used regularizers, weight decay and lasso.

- Validation and Cross-Validation: validation set, leave-one-out cross validation, K-fold cross-validation

- Descriptive Modeling: density models, mixture models, the Expectation-Maximization algorithm, cluster analysis, the K-means algorithm, hierarchical clustering

- Predictive Modeling for Classification: linear discriminants, tree models, nearest-neighbor methods, Naive Bayes, feature selection

- Predictive Modeling for Regression: linear regression, generalized linear models

- Singular Value Decomposition, Matrix Factorization, and applications

- Content-based retrieval: text representation and classification, term weighting, latent semantic indexing

 

Modalità di insegnamento

  • Italiano
  • English

Lezioni alla lavagna e con diapositive, ed esercizi al computer.

 

Modalità di verifica dell'apprendimento

  • Italiano
  • English

Discussione alla lavagna ed esercitazioni interattive al computer.

 

Attività di supporto

  • Italiano
  • English



 

Testi consigliati e bibliografia

  • Italiano
  • English

- Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin, "Learning from Data"AMLBook 2012

 

Note

  • Italiano
  • English

Le esercitazioni del corso richiedono la capacità di scrivere ed eseguire semplici programmi in Python. La conoscenza del linguaggio di programmazione Python non è richiesta ma ci si aspetta che gli studenti si impegnino per acquisire una sufficiente competenza nell'uso di Python in parallelo alle lezioni del corso.

 

Orario lezioniV

Lezioni: dal 11/01/2018 al 12/03/2018

Nota: ven. 12.1 aula informatica F (Fisica)

lun. 15.1 aula informatica F (Fisica)

ven. 19.1 aula informatica F (Fisica)

lun. 22.1 aula A (Fisica)

ven. 26.1 aula informatica F (Fisica)

ven. 2.2 aula Informatica 3 ToExpo

lun 5.2 aula Informatica 3 ToExpo

ven 9.2 aula Informatica 3 ToExpo

lun 12.2 aula informatica F (Fisica)

ven. 16.2 aula Informatica 3 ToExpo

lun 19.2 aula Informatica 3 ToExpo

ven 23.2 aula Informatica 3 ToExpo

lun. 26.2 aula Informatica 3 ToExpo

ven 2.3 aula informatica F (Fisica)

lun. 5.3 aula Informatica 3 ToExpo

ven. 9.3 aula Informatica 3 ToExpo

lun 12.3 aula Informatica 3 ToExpo

Registrazione
  • Aperta
     
    Ultimo aggiornamento: 10/01/2018 11:20
    Campusnet Unito
    Non cliccare qui!