Vai al contenuto principale
Oggetto:
Oggetto:

INTRODUCTION TO DATA ANALYSIS FOR NATURAL AND SOCIAL SCIENCES

Oggetto:

INTRODUCTION TO DATA ANALYSIS FOR NATURAL AND SOCIAL SCIENCES

Oggetto:

Anno accademico 2017/2018

Codice dell'attività didattica
FIS0087
Docente
Prof. Michele Caselle (Titolare del corso)
Periodo didattico
Terzo periodo didattico
Tipologia
D=A scelta dello studente
Crediti/Valenza
3
SSD dell'attività didattica
FIS/02 - fisica teorica, modelli e metodi matematici
Lingua di insegnamento
Inglese
Modalità di frequenza
Facoltativa
Tipologia d'esame
Scritto ed orale
Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

Questo corso è progettato per studenti con background diversi con l'obiettivo di introdurli ai principi di base dell'analisi quantitativa dei dati. Gli studenti avranno la possibilità di esaminare e analizzare dati reali da diverse aree di applicazione, come la genomica, la medicina, la biotecnologia e le scienze sociali. Il corso porterà gli studenti ad accelerare le più recenti tecniche di analisi dei dati con l'esperienza pratica di eseguire questi metodi sui dati utilizzando diversi software (Microsoft Excel, software R disponibile pubblicamente). Il corso non si basa su software, statistiche o programmazione. La valutazione del corso è fortemente basata su un progetto, in cui gli studenti lavoreranno in un gruppo per criticare e presentare un documento di ricerca utilizzando strumenti di scienza dei dati nel contesto delle diverse aree di applicazione.

 

This course is designed for students with diverse backgrounds with the aim of introducing them to basic principles of quantitative data analysis. Students will get a chance to examine and analyze real data from different application areas, such as, genomics, medicine, biotechnology and social sciences. The course will bring the students to speed to the latest data analysis techniques with hands-on experience of executing these methods on data using different softwares (Microsoft excel, publicly available software R). The course assumes no background in software, Statistics or programming. Course evaluation is heavily based on a project, where students will work in a group to critique and present a research paper using data science tools in the context of different application areas.

Oggetto:

Modalità di insegnamento

Lezioni interattive con analisi hands-on in classe di set di dati mediante Excel e R

Interactive lessons with hands-on in-class analysis of data sets using excel and R

Oggetto:

Modalità di verifica dell'apprendimento

La valutazione del corso si baserà su compiti a casa (40%), un progetto finale (40%) e una partecipazione di classe basata su discussioni durante le lezioni (20%). I concetti introdotti nelle lezioni saranno rafforzati da compiti a casa basati su computer forniti su base bisettimanale, in cui gli studenti useranno il software per eseguire analisi di base dei dati. Verso la fine della lezione, studenti provenienti da contesti diversi si uniranno per formare un gruppo (2-3 studenti per gruppo) e ad ogni gruppo verrà assegnato un documento di ricerca che analizza i dati da specifiche aree di applicazione. La valutazione del progetto si baserà sulla presentazione del documento alla classe e sulla risposta alla domanda pertinente al progetto.

 

The course evaluation will be based on homework assignments (40%), one final project (40%), and class participation based on discussions during lectures (20%). Concepts introduced in lectures will be reinforced through computer-based homework assignments given on a biweekly basis, where students will use software to perform basic data analysis. Towards the end of class, student from different backgrounds will come together to form a group (2-3 students per group), and each group will be a assigned a research paper that analyses data from specific application areas. The project evaluation will be based on presenting the paper to the class, and answering question pertinent to the project.

 

Oggetto:

Programma

  • Introduction to Data Gathering and Analysis 

 

  • Graphical/Numerical methods for describing data

 

  • Basic Statistics; Central Tendency; Dispersion

 

  • Bivariate plots, covariance, correlation

 

  • Simple Regression; Least Square; Intercept and Slope

 

  • Multiple Regression

 

  • Significance and Hypothesis testing

 

  • Time series and autocorrelation

 

  • Basics of Learning; Supervised Learning and Unsupervised Learning

Testi consigliati e bibliografia

Oggetto:

Dispense e riferimenti forniti durante il corso.

 

 

Lecture notes and references provided therein.



Oggetto:

Orario lezioni

Lezioni: dal 24/04/2018 al 08/06/2018

Nota: mar 24/4 17,30-19,30 aula 1.13
ven 27/4 17,30-19,30 aula 1.13
ven 4/5 17,30-19,30 aula 1.13
mar 8/5 17,30-19,30 aula T 13
ven 18/5 17,30-19,30 aula 2.06
mar 22/5 17,30-19,30 aula 1.13
ven 25/5 17,30-19,30 aula 2.06
mar 29/5 17,30-19,30 aula 1.13
mar 5/6 17,30-19,30 aula T 22
ven 8/6 17,30-19,30 aula 1.13

Le aule si trovano in via S. Ottavio 54 Torino

Oggetto:

Note

Il corso sara' tenuto dal Prof. Abhyudai Singh

Oggetto:
Ultimo aggiornamento: 06/02/2018 15:20
Non cliccare qui!