Vai al contenuto principale
Oggetto:
Oggetto:

Data Mining: Modellazione Statistica e Apprendimento Automatico dei Dati

Oggetto:

Data Mining, Statistical Modeling and Machine Learning

Oggetto:

Anno accademico 2023/2024

Codice dell'attività didattica
FIS0180
Docenti
Laetitia Emilie Gauvin (Titolare del corso)
Andre' Panisson (Titolare del corso)
Tiziana Sanavia (Titolare del corso)
Corso di studi
Laurea Magistrale Interateneo in Fisica dei sistemi complessi
Anno
1° anno 2° anno
Periodo didattico
Secondo Semestre
Tipologia
C=Affine o integrativo
Crediti/Valenza
6
SSD dell'attività didattica
FIS/07 - fisica applicata (a beni culturali, ambientali, biologia e medicina)
Modalità di erogazione
Tradizionale
Lingua di insegnamento
Italiano
Modalità di frequenza
Obbligatoria
Tipologia d'esame
Orale
Prerequisiti
Analisi matematica, algebra lineare, elementi di statistica e probabilità.
Analysis, linear algebra, elements of statistics and probability.



Propedeutico a
Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

L'insegnamento si pone l'obiettivo di fornire competenze di base per l'analisi e la modellazione statistica dei dati, con speciale attenzione alle tecniche di apprendimento automatico (machine learning) in contesti sia descrittivi che predittivi. Le lezioni hanno un forte carattere interdisciplinare e coprono argomenti tradizionalmente trattati in corsi di laurea di computer science e statistica. Un importante obiettivo dell'insegnamento è la conoscenza operativa delle tecniche e degli algoritmi trattati. Le lezioni teoriche si alterneranno perciò ad esercitazioni al computer.

The objective of the course is to achieve base competences for training and testing standard machine learning algorithms. The course will be highly interdisciplinary, covering topics traditionally taught in computer science or statistics courses. An important goal of the course is to achieve the capability of using the studies algorithms in practical settings. The course will therefore alternate theory lesson and exercise sessions using personal computers.

Oggetto:

Risultati dell'apprendimento attesi

- compresione teorica dei fondamenti dell'apprendimento automatico (machine learning) dai dati

- capacità di usare alcune librerie Python per il machine learning nel contesto di semplici applicazioni

- theoretical understanding of the fundamentals of machine learning

- ability to use a few Python libraries for machine learning for simple applications

Oggetto:

Modalità di insegnamento

La parte teorica si svolge in aula alla lavagna con diapositive, oppure con lezioni registrate.

La parte pratica si svolge nei laboratori didattici oppure in collegamento webex.

 

The lessons will be done using the blackboard and/or slides, or with registered lectures

The practical exercises will necessitate the use of computers  (it will be done in-person or online).

 

 

Oggetto:

Modalità di verifica dell'apprendimento

L’esame include sia una prova  sulla teoria che una prova sulla pratica. 

La prova sulla teoria, se in presenza, potrà essere scritta su carta e/o svolta con quiz aperti o orale in base al numero di studenti, nel caso si svolgano esami a distanza, tramite Moodle e collegamento Webex/Zoom.  

 

La prova sulla pratica include un mini-progetto finale e un exercizio. Gli detagli saranno dati durante il corso.

 

  • Il mini-progetto finale dovrà essere consegnato in formatto notebook, in una piattaforma online scelta dagli insegnanti. Potrà essere realizzato in gruppi di 2, massimo 3 studenti.

 

  • La consegna dell'esercizio è obbligatòria e dovrà essere fatta usando la piattaforma scelta dagli insegnanti per condivisione di notebooks.

The exam includes both a theory test and a practical test.

The test on theory, if it can be done in-person , will be written or oral  based on the number of students registered to the course, in case of remote examinations, it will be done via Moodle and Webex / Zoom connection.

The practical test includes a final mini-project and an exercise. Details will be given during the course.

The final mini-project must be delivered as a notebook in an online platform chosen by the teachers. It can be done in groups of 2, maximum 3 students.

The delivery of the exercise is mandatory and must be done using the platform chosen by the teachers for sharing notebooks.

 

 

Oggetto:

Attività di supporto

Oggetto:

Programma

- The major paradigms of learning from data, the learning problem, the feasibility of learning

- The architecture of machine learning algorithms: model structure, scoring, and search

- The theory of generalization, the Vapnik-Chervonenkis generalization bound, model complexity penalization, the approximation-generalization tradeoff, bias and variance, the learning curve

- Models and Patterns: parametric and non-parametric models, regression models

- Score functions and optimization techniques. Gradient descent and stochastic gradient descent.

- Linear Models: linear classification, linear regression, ordinary least squares, logistic regression, non-linear transformations

- Overfitting and Regularization: model complexity and overfitting, commonly used regularizers, weight decay and lasso.

- Validation and Cross-Validation: validation set, leave-one-out cross validation, K-fold cross-validation

- Descriptive Modeling: density models, mixture models, the Expectation-Maximization algorithm, cluster analysis, the K-means algorithm, hierarchical clustering

- Predictive Modeling for Classification: linear discriminants, tree models, nearest-neighbor methods, Naive Bayes, feature selection

- Predictive Modeling for Regression: linear regression, generalized linear models

- Singular Value Decomposition, Matrix Factorization, and applications

- Content-based retrieval: text representation and classification, term weighting, latent semantic indexing

Testi consigliati e bibliografia

Oggetto:

- Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin, "Learning from Data", AMLBook 2012

- Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin, "Learning from Data", AMLBook 2012



Oggetto:

Orario lezioni

GiorniOreAula
Lunedì14:00 - 17:00
Venerdì9:00 - 13:00

Lezioni: dal 26/02/2024 al 07/06/2024

Oggetto:

Note

Le esercitazioni richiedono la capacità di scrivere ed eseguire semplici programmi in Python. La conoscenza del linguaggio di programmazione Python non è richiesta ma ci si aspetta che gli studenti si impegnino per acquisire una sufficiente competenza nell'uso di Python in parallelo alle lezioni.

The exercises require the ability to write and execute simple Python programs. Experience with the Python programming language is not required, but it is expected that students will commit to achieve a working knowledge of the Python language through self-study.

Oggetto:
Ultimo aggiornamento: 26/02/2024 15:35
Location: https://fisica-sc.campusnet.unito.it/robots.html
Non cliccare qui!