- Oggetto:
- Oggetto:
Data Mining: Modellazione Statistica e Apprendimento Automatico dei Dati
- Oggetto:
Data Mining, Statistical Modeling and Machine Learning
- Oggetto:
Anno accademico 2018/2019
- Codice dell'attività didattica
- INT0911
- Docenti
- Dott. Ciro Cattuto (Titolare del corso)
Laetitia Emilie Gauvin (Titolare del corso)
Dott. Andre' Panisson (Titolare del corso) - Corso di studi
- Laurea Magistrale Interateneo in Fisica dei sistemi complessi
- Anno
- 1° anno 2° anno
- Periodo didattico
- Secondo periodo didattico
- Tipologia
- C=Affine o integrativo
- Crediti/Valenza
- 6
- SSD dell'attività didattica
- FIS/02 - fisica teorica, modelli e metodi matematici
- Modalità di erogazione
- Tradizionale
- Lingua di insegnamento
- Italiano
- Modalità di frequenza
- Obbligatoria
- Tipologia d'esame
- Orale
- Prerequisiti
-
Analisi matematica, algebra lineare, elementi di statistica e probabilità.Analysis, linear algebra, elements of statistics and probability.
- Propedeutico a
-
- Oggetto:
Sommario insegnamento
- Oggetto:
Obiettivi formativi
Il corso si pone l'obiettivo di fornire competenze di base per l'analisi e la modellazione statistica dei dati, con speciale attenzione alle tecniche di apprendimento automatico (machine learning) in contesti sia descrittivi che predittivi. Il corso ha un forte carattere interdisciplinare e copre argomenti tradizionalmente trattati in corsi di laurea di computer science e statistica. Un importante obiettivo del corso è la conoscenza operativa delle tecniche e degli algoritmi trattati. Le lezioni teoriche si alterneranno perciò ad esercitazioni al computer.
The objective of the course is to achieve base competences for training and testing standard machine learning algorithms. The course will be highly interdisciplinary, covering topics traditionally taught in computer science or statistics courses. An important goal of the course is to achieve the capability of using the studies algorithms in practical settings. The course will therefore alternate theory lesson and exercise sessions using personal computers.
- Oggetto:
Risultati dell'apprendimento attesi
- compresione teorica dei fondamenti dell'apprendimento automatico (machine learning) dai dati
- capacità di usare alcune librerie Python per il machine learning nel contesto di semplici applicazioni
- theoretical understanding of the fundamentals of machine learning
- ability to use a few Python libraries for machine learning for simple applications
- Oggetto:
Modalità di insegnamento
Lezioni alla lavagna e con diapositive, ed esercizi al computer.
Lessons using the blackboard and/or slides, and practical exercises using personal computers.
- Oggetto:
Modalità di verifica dell'apprendimento
Discussione alla lavagna ed esercitazioni interattive al computer.
Discussion at the blackboard and interactive practical exercises at the computer
- Oggetto:
Attività di supporto
- Oggetto:
Programma
- The major paradigms of learning from data, the learning problem, the feasibility of learning
- The architecture of machine learning algorithms: model structure, scoring, and search
- The theory of generalization, the Vapnik-Chervonenkis generalization bound, model complexity penalization, the approximation-generalization tradeoff, bias and variance, the learning curve
- Models and Patterns: parametric and non-parametric models, regression models
- Score functions and optimization techniques. Gradient descent and stochastic gradient descent.
- Linear Models: linear classification, linear regression, ordinary least squares, logistic regression, non-linear transformations
- Overfitting and Regularization: model complexity and overfitting, commonly used regularizers, weight decay and lasso.
- Validation and Cross-Validation: validation set, leave-one-out cross validation, K-fold cross-validation
- Descriptive Modeling: density models, mixture models, the Expectation-Maximization algorithm, cluster analysis, the K-means algorithm, hierarchical clustering
- Predictive Modeling for Classification: linear discriminants, tree models, nearest-neighbor methods, Naive Bayes, feature selection
- Predictive Modeling for Regression: linear regression, generalized linear models
- Singular Value Decomposition, Matrix Factorization, and applications
- Content-based retrieval: text representation and classification, term weighting, latent semantic indexing
Testi consigliati e bibliografia
- Oggetto:
- Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin, "Learning from Data", AMLBook 2012
- Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin, "Learning from Data", AMLBook 2012
- Oggetto:
Orario lezioni
Giorni Ore Aula Lunedì 14:00 - 17:00 Venerdì 9:00 - 13:00 Lezioni: dal 14/01/2019 al 12/03/2019
Nota: lun. 14.1 aula informatica 4 (ToExpo)
ven. 18.1 aula informatica F (Fisica)
lun. 21.1 aula informatica 4 (ToExpo)
ven. 25.1 aula A4 Via Michelangelo 32 II piano
lun. 28.1 aula informatica 4 (ToExpo)
ven. 1.2 aula informatica 3 (ToExpo)
lun 4.2 aula informatica 3 (ToExpo)
ven 8.2 aula informatica 4 (ToExpo)
lun 11.2 aula informatica G (Fisica)
ven. 15.2 aula informatica G (Fisica)
lun 18.2 aula informatica 3 (ToExpo)
ven 22.2 aula TE9 (ToExpo II piano no ascensore)
lun. 25.2 aula informatica G (Fisica)
ven 1.3 aula informatica G (Fisica)
lun. 4.3 aula informatica 3 (ToExpo)
ven. 8.3 aula informatica 3 (ToExpo)
lun 11.3 aula informatica 3 (ToExpo)
- Oggetto:
Note
Le esercitazioni del corso richiedono la capacità di scrivere ed eseguire semplici programmi in Python. La conoscenza del linguaggio di programmazione Python non è richiesta ma ci si aspetta che gli studenti si impegnino per acquisire una sufficiente competenza nell'uso di Python in parallelo alle lezioni del corso.
The exercises require the ability to write and execute simple Python programs. Experience with the Python programming language is not required, but it is expected that students will commit to achieve a working knowledge of the Python language through self-study.
- Oggetto: