- Oggetto:
- Oggetto:
INTRODUCTION TO DATA ANALYSIS FOR NATURAL AND SOCIAL SCIENCES
- Oggetto:
INTRODUCTION TO DATA ANALYSIS FOR NATURAL AND SOCIAL SCIENCES
- Oggetto:
Anno accademico 2017/2018
- Codice dell'attività didattica
- FIS0087
- Docente
- Prof. Michele Caselle (Titolare del corso)
- Periodo didattico
- Terzo periodo didattico
- Tipologia
- D=A scelta dello studente
- Crediti/Valenza
- 3
- SSD dell'attività didattica
- FIS/02 - fisica teorica, modelli e metodi matematici
- Lingua di insegnamento
- Inglese
- Modalità di frequenza
- Facoltativa
- Tipologia d'esame
- Scritto ed orale
- Oggetto:
Sommario insegnamento
- Oggetto:
Obiettivi formativi
Questo corso è progettato per studenti con background diversi con l'obiettivo di introdurli ai principi di base dell'analisi quantitativa dei dati. Gli studenti avranno la possibilità di esaminare e analizzare dati reali da diverse aree di applicazione, come la genomica, la medicina, la biotecnologia e le scienze sociali. Il corso porterà gli studenti ad accelerare le più recenti tecniche di analisi dei dati con l'esperienza pratica di eseguire questi metodi sui dati utilizzando diversi software (Microsoft Excel, software R disponibile pubblicamente). Il corso non si basa su software, statistiche o programmazione. La valutazione del corso è fortemente basata su un progetto, in cui gli studenti lavoreranno in un gruppo per criticare e presentare un documento di ricerca utilizzando strumenti di scienza dei dati nel contesto delle diverse aree di applicazione.
This course is designed for students with diverse backgrounds with the aim of introducing them to basic principles of quantitative data analysis. Students will get a chance to examine and analyze real data from different application areas, such as, genomics, medicine, biotechnology and social sciences. The course will bring the students to speed to the latest data analysis techniques with hands-on experience of executing these methods on data using different softwares (Microsoft excel, publicly available software R). The course assumes no background in software, Statistics or programming. Course evaluation is heavily based on a project, where students will work in a group to critique and present a research paper using data science tools in the context of different application areas.
- Oggetto:
Modalità di insegnamento
Lezioni interattive con analisi hands-on in classe di set di dati mediante Excel e R
Interactive lessons with hands-on in-class analysis of data sets using excel and R
- Oggetto:
Modalità di verifica dell'apprendimento
La valutazione del corso si baserà su compiti a casa (40%), un progetto finale (40%) e una partecipazione di classe basata su discussioni durante le lezioni (20%). I concetti introdotti nelle lezioni saranno rafforzati da compiti a casa basati su computer forniti su base bisettimanale, in cui gli studenti useranno il software per eseguire analisi di base dei dati. Verso la fine della lezione, studenti provenienti da contesti diversi si uniranno per formare un gruppo (2-3 studenti per gruppo) e ad ogni gruppo verrà assegnato un documento di ricerca che analizza i dati da specifiche aree di applicazione. La valutazione del progetto si baserà sulla presentazione del documento alla classe e sulla risposta alla domanda pertinente al progetto.
The course evaluation will be based on homework assignments (40%), one final project (40%), and class participation based on discussions during lectures (20%). Concepts introduced in lectures will be reinforced through computer-based homework assignments given on a biweekly basis, where students will use software to perform basic data analysis. Towards the end of class, student from different backgrounds will come together to form a group (2-3 students per group), and each group will be a assigned a research paper that analyses data from specific application areas. The project evaluation will be based on presenting the paper to the class, and answering question pertinent to the project.
- Oggetto:
Programma
-
Introduction to Data Gathering and Analysis
-
Graphical/Numerical methods for describing data
-
Basic Statistics; Central Tendency; Dispersion
-
Bivariate plots, covariance, correlation
-
Simple Regression; Least Square; Intercept and Slope
-
Multiple Regression
-
Significance and Hypothesis testing
-
Time series and autocorrelation
-
Basics of Learning; Supervised Learning and Unsupervised Learning
-
Testi consigliati e bibliografia
- Oggetto:
Dispense e riferimenti forniti durante il corso.
Lecture notes and references provided therein.
- Oggetto:
Orario lezioni
Lezioni: dal 24/04/2018 al 08/06/2018
Nota: mar 24/4 17,30-19,30 aula 1.13
ven 27/4 17,30-19,30 aula 1.13
ven 4/5 17,30-19,30 aula 1.13
mar 8/5 17,30-19,30 aula T 13
ven 18/5 17,30-19,30 aula 2.06
mar 22/5 17,30-19,30 aula 1.13
ven 25/5 17,30-19,30 aula 2.06
mar 29/5 17,30-19,30 aula 1.13
mar 5/6 17,30-19,30 aula T 22
ven 8/6 17,30-19,30 aula 1.13Le aule si trovano in via S. Ottavio 54 Torino
- Oggetto:
Note
Il corso sara' tenuto dal Prof. Abhyudai Singh
- Oggetto: