Dipartimento di Ingegneria e architettura Ingegneria informatica Analisi dei Dati con Rstudio ( CFU) – (Ingegneria Informatica) Pds 2024-2025 – III anno

Home Didattica Corsi di Laurea triennali e Magistrali Ingegneria informatica (Ingegneria informatica) Frequentare il corso (Ingegneria Informatica) Pds 2024-2025 Analisi dei Dati con Rstudio ( CFU) – (Ingegneria Informatica) Pds 2024-2025 – III anno
Insegnamento Analisi dei dati con RStudio
CFU 6
Settore Scientifico Disciplinare GLOT-01/A 09/IINF-05
Metodologia didattica

Lezioni Frontali

Nr. ore di aula 36
Nr. ore di studio autonomo 114
Mutuazione Nessuna
Annualità III
Periodo di svolgimento Secondo Semestre
Docente Ruolo SSD docente
Villata Sandra RTD-B GLOT-01/A
* PO (professore ordinario), PA (professore associato), RTD (ricercatore a tempo determinato), RU (Ricercatore a tempo indeterminato), DC (Docente a contratto).
Propedeuticità Statistica per l’Ingegneria, Fondamenti di Psicometria (o corsi affini che portino sull’analisi dei dati). Questo insegnamento è adatto anche a coloro che non abbiano mai seguito un corso di statistica.
Sede delle lezioni Dipartimento di Ingegneria e Architettura
N Nome del modulo Docente Durata in ore
1. Analisi dei dati con RStudio Sandra Villata 36
Orario delle lezioni

Riferirsi al calendario didattico per AA. 2024/2025 pubblicato nella pagina web del Dipartimento di Ingegneria e Architettura.

Obiettivi formativi

La statistica è una componente fondamentale in ogni campo che comporti la raccolta e l’analisi dei dati. Questo insegnamento è rivolto a tutti coloro che vogliano avvicinarsi per la prima volta all’analisi dei dati e la loro visualizzazione, o che intendano ampliare le loro conoscenze statistiche utilizzando RStudio.
RStudio è un ambiente di sviluppo user-friendly che interagisce con R, un linguaggio di programmazione sviluppato specificatamente per l’analisi dei dati, distinguendosi per questo da linguaggi come Python o Matlab. Sempre più adottato sia in ambito accademico che professionale, completamente gratuito ed open-source, RStudio è diventato uno strumento indispensabile per l’analisi dei dati.
Le lezioni saranno strutturate attorno ad una componente teorica in cui si affronteranno i fondamenti della statistica, inclusi i principi di base della statistica descrittiva, i fondamenti della statistica frequentista (e.g. i modelli lineari, le correlazioni, i t-test, l’analisi della varianza, i modelli misti lineari e generalizzati) e Bayesiana. L’insegnamento avrà anche un’importante componente pratica dove tali concetti verranno applicati in RStudio. L’insegnamento fornirà un’introduzione approfondita all’utilizzo di RStudio, con particolare riferimento al pacchetto tidyverse, che facilita la visualizzazione, la manipolazione e l’esplorazione dei dati. Sarà richiesto l’utilizzo del proprio computer durante le lezioni per la parte di RStudio.
L’insegnamento è indicato sia a chi si avvicina per la prima volta all’analisi statistica, sia a chi desidera estendere le proprie conoscenze utilizzando RStudio. Alla fine dell’insegnamento, gli studenti avranno acquisito una solida conoscenza dei fondamenti della statistica e saranno in grado di analizzare i propri dati su RStudio.

 

Contenuti del Programma
N. ARGOMENTO TIPOLOGIA DURATA
1 Introduzione Frontale 2h
2 Introduzione a RStudio: oggetti, funzioni, variabili, pacchetti, importare dati, l’operatore pipe Frontale/Pratica 3h
3 Il disegno sperimentale: tipi di variabili, il disegno fattoriale (factorial design), misure ripetute e misure indipendenti, randomizzazione, fillers e controlli, sample size Frontale 3h
4 Statistica descrittiva I: distribuzioni, frequenza, media, moda, mediana, quantili, varianza, deviazione standard, z-scores Frontale 3h
Applicazioni in RStudio Pratica 2h
5 L’approccio frequentista: il test dell’ipotesi nulla Frontale 2h
6 t-test, intervalli di confidenza, dimensione dell’effetto (Cohen’s d) e statistical power Frontale 3h
Applicazioni in RStudio Pratica 1h
7 Correlazione lineare, regressione lineare semplice, multipla e generalizzata, ANOVA Frontale 4h
Applicazioni in RStudio Frontale 2h
9 Modelli lineari misti (mixed-models) e contrast coding Frontale 2h
Applicazioni in RStudio Pratica 1h
10 Creare grafici con ggplot2 in RStudio Frontale/Pratica 2h
11 L’approccio Bayesiano: introduzione (inclusi i concetti di prior, likelihood e posterior e metodi di calcolo come il campionamento di Monte Carlo) Frontale 2h
12 Bayes Factor, intervalli di credibilità Frontale 2h
Applicazioni in RStudio Pratica 2h
Risultati di apprendimento (descrittori di Dublino)

Alla fine del corso, gli studenti dovranno aver conseguito le seguenti abilità, conoscenze e competenze:

Conoscenza e capacità di comprensione: Lo studente avrà acquisito una solida base teorica e pratica in statistica, coprendo sia l’approccio frequentista che Bayesiano. Saprà utilizzare le tecniche statistiche appropriate per l’analisi dei dati ed interpretare correttamente i risultati delle analisi statistiche. Acquisirà conoscenze sui disegni sperimentali comprendendo l’importanza di concetti come la differenza tra disegni a misure ripetute ed indipendenti, la randomizzazione ed il controllo delle variabili confondenti.

Conoscenza e capacità di comprensione applicate: Lo studente svilupperà competenze pratiche per l’implementazione di analisi statistiche utilizzando RStudio. Saprà installare e configurare RStudio ed i pacchetti necessari per le analisi, sarà familiarizzato all’interfaccia di RStudio, saprà caricare e manipolare dataset, applicare tecniche di statistica descrittiva e inferenziale, visualizzare i dati e i risultati delle analisi utilizzando pacchetti di visualizzazione come ggplot2.

Autonomia di giudizio: Lo studente sarà in grado di applicare in modo critico ed autonomo le conoscenze acquisite al fine di scegliere ed utilizzare i metodi statistici più appropriate per l’analisi dei dati. Saprà inoltre interpretare correttamente i risultati delle analisi statistiche e conoscerà la differenza tra l’approccio frequentista e Bayesiano. Alla fine del corso, gli studenti saranno preparati non solo ad eseguire analisi statistiche sofisticate, ma anche a valutare criticamente le metodologie utilizzate.

Capacità di apprendere: Lo studente svilupperà una capacità autonoma di apprendimento continuo, potendo approfondire ulteriormente le conoscenze statistiche e le competenze in RStudio in autonomia. Saprà identificare le domande di ricerca pertinenti e progettare un’analisi statistica adeguata per rispondere a tali domande. Saprà inoltre utilizzare risorse aggiuntive (libri, articoli, tutorial online) per ampliare le conoscenze acquisite.

Testi per lo studio della disciplina

Testi principali:
– Massimiliano Pastore (2015). Analisi dei dati in psicologia. Con applicazioni in R. Il Mulino.

Materiale didattico a disposizione degli studenti:
– Le diapositive presentate durante il corso (caricate settimanalmente online)
– Esercizi svolti in classe

Testi di approfondimento:
– Andy Field, Jeremy Miles, Zoë Field (2012). Discovering Statistics Using R. SAGE Publication, London.
– Michael Franke (2023). An Introduction to Data Analysis. https://michael-franke.github.io/intro-data-analysis/index.html
– Maarten Speekenbrink (2023). Statistics: Data analysis and modelling. https://mspeekenbrink.github.io/sdam-book/index.html
– Maarten Speekenbrink (2023). An R companion to Statistics: data analysis and modelling. https://mspeekenbrink.github.io/sdam-r-companion/index.html

Metodi e strumenti per la didattica

Il corso alterna lezioni frontali ed esercizi svolti in classe. Utilizzo di supporti visivi. Le slides delle lezioni saranno caricate settimanalmente sulla piattaforma Unikorefad. Si richiede l’utilizzo del proprio computer durante le lezioni per la parte di RStudio.

Modalità di accertamento delle competenze

L’esame consisterà in una prova scritta che verte sui contenuti dell’insegnamento. La prova si compone di domande a risposta chiusa, domande che richiedono sintetiche risposte aperte, ed esercizi da svolgere su RStudio. I punti associati ad ogni domanda saranno indicati nella prova d’esame accanto ad ogni domanda. La somma dei punti sarà uguale a 64. L’esame si considera superato con una votazione minima di 18. La tabella di conversione dei punti in 30esimi è la seguente:

Punti 64 63 62 61 60 59 58 57 56 55 54 53 52 51 50 49
Voto 30 e lode 30 e lode 30 e lode 30 e lode 30 30 29 29 28 28 27 27 26 26 25 25
Punti 48 47 46 45 44 43 42 41 40 39 38 37 36 35 <35             
Voto 24 24 23 23 22 22 21 21 20 20 19 19 18 18 esame non superato

 

Date di esame

Le date degli esami saranno pubblicati sulla pagina web del corso di laurea almeno due mesi prima dell’inizio della sessione d’esami.

Modalità e orario di ricevimento

Il ricevimento è in presenza. Il ricevimento avverrà dopo la fine dell’orario delle lezioni. Si prega di contattare il docente con sufficiente anticipo per fissare il ricevimento.

Indietro