Vai al contenuto principale
Oggetto:
Oggetto:

Data Mining: Modellazione Statistica e Apprendimento Automatico dei Dati

Oggetto:

Anno accademico 2011/2012

Codice dell'attività didattica
INT0833
Docente
Dott. Ciro Cattuto (Titolare del corso)
Corso di studi
Laurea Magistrale Interateneo in Fisica dei sistemi complessi
Anno
1° anno 2° anno
Tipologia
C=Affine o integrativo
Crediti/Valenza
6
SSD dell'attività didattica
FIS/02 - fisica teorica, modelli e metodi matematici
Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

Il corso si pone l'obiettivo di fornire competenze di base per l'analisi e la modellazione statistica dei dati, con speciale attenzione alle tecniche di apprendimento automatico (machine learning) in contesti sia descrittivi che predittivi. Il corso ha un forte carattere interdisciplinare e copre argomenti tradizionalmente trattati in corsi di laurea di computer science e statistica. Un importante obiettivo del corso è la conoscenza operativa delle tecniche e degli algoritmi trattati. Le lezioni teoriche si alterneranno perciò ad esercitazioni al computer.

Oggetto:

Programma

- Measurement, Uncertainty, and Data Analysis: statistical inference, maximum likelihood estimation and Bayesian estimation, bias and variance, hypothesis testing

- The architecture of data mining algorithms: model structure, scoring, and search

- Models and Patterns: parametric and non-parametric models, regression models

- Score functions and optimization techniques

- Descriptive Modeling: density models, mixture models, the Expectation-Maximization algorithm, cluster analysis, the K-means algorithm, hierarchical clustering 

- Predictive Modeling for Classification: linear discriminants, tree models, nearest-neighbor methods, Naive Bayes, evaluation and feature selection 

- Predictive Modeling for Regression: linear regression, generalized linear models

- Mining Patterns and Rules: association rule learning, frequent itemset mining

- Content-based retrieval (text representation and classification, term weighting, latent semantic indexing)

Testi consigliati e bibliografia

Oggetto:

- David J. Hand, Heikki Mannila, Padhraic Smyth, "Principles of Data Mining", MIT Press 2011



Oggetto:

Note

Le esercitazioni del corso richiedono la capacità di scrivere ed eseguire semplici programmi in Python. La conoscenza del linguaggio di programmazione Python non è richiesta ma ci si aspetta che gli studenti si impegnino per acquisire una sufficiente competenza nell'uso di Python in parallelo alle lezioni del corso.

Oggetto:
Ultimo aggiornamento: 07/12/2012 11:31
Location: https://fisica-sc.campusnet.unito.it/robots.html
Non cliccare qui!