Laurea in Informatica (Università degli Studi di Milano)


L'insegnamento ha lo scopo di introdurre i concetti fondamentali della statistica descrittiva, del calcolo delle probabilità e della statistica inferenziale parametrica.

Risultati attesi

Gli studenti saranno in grado di effettuare analisi esplorative e inferenze di base su dataset, conosceranno le principali distribuzioni di probabilità e sapranno comprendere le analisi statistiche condotte da altri; avranno inoltre acquisito semplici metodi per la classificazione binaria e sapranno valutarne le performance. Avranno inoltre acquisito le conoscenze di base per poter affrontare lo studio di tecniche più avanzate di analisi e modellazione dei dati.

Avvisi

Data Informazione
28/02/2024 Modifica orario delle lezioni di «Statistica e analisi dei dati»
A partire dal 7 marzo, le lezioni del giovedì di «Statistica e analisi dei dati» saranno tenute nell'aula G21.

Lingua

Le lezioni sono in italiano.

Orari del corso

Le lezioni si svolgono durante il secondo semestre e in presenza presso le strutture di Città Studi. L'orario è il seguente:

Giorno Ora Luogo
martedì 10:30 - 12:30 208 (Settore didattico)
giovedì 13:30 - 16:30 G21 (via Golgi) Aula magna (Dip. di Informatica)

Eventuali variazioni rispetto al calendario pianificato verranno comunicate in aula e pubblicizzate nel paragrafo Avvisi di questa pagina.

Ricevimento studenti

Su appuntamento, stanza 5015 del Dipartimento di Informatica. È possibile contattare il docente tramite posta elettronica, avendo cura di leggere preventivamente la guida predisposta dal Prof. Sebastiano Vigna e di specificare chiaramente nell'oggetto del messaggio il nome dell'insegnamento e l'anno accademico. In particolare, si invitano gli studenti a usare sempre come mittente l'indirizzo fornito loro dall'Ateneo (basato cioè sul dominio studenti.unimi.it) firmando con nome, cognome e matricola e ricordando che i tempi di risposta possono variare in funzione degli impegni del docente.

Materiale didattico

La parte di statistica descrittiva è basata sui primi tre capitoli del libro S. Ross, Introduzione alla statistica, Apogeo education, 2014, ISBN 9788838786020 (indicato come RS nel calendario delle lezioni). Questi capitoli sono messi gentilmente a disposizione dall'editore, autenticandosi con la modalità descritta precedentemente.

La parte di calcolo delle probabilità e di statistica inferenziale è prevalentemente basata sul libro S. Ross, Probabilità e statistica per l'ingegneria e le scienze, terza edizione, Apogeo education, 2015, ISBN 8891609946 (indicato come RP nel calendario delle lezioni). Siccome non è mai troppo presto per cominciare a leggere la documentazione tecnica in lingua inglese, si consiglia di studiare sull'edizione originale: Ross, S., Introduction to Probability and Statistics for Engineers and Scientists, Academic press, 2020, ISBN 9780128243466.

Sono disponibili delle dispense su argomenti non trattati dai libri di testo, organizzate in un repository github e disponibili anche in una forma direttamente eseguibile in un Web browser.

Il libro Wess McKinney, Python for Data Analysis, third edition, O'Reilly 2022, di cui è disponibile una versione online, permette di approfondire l'utilizzo di Python.

Programma

Il programma riguarda gli argomenti dettagliati nel calendario delle lezioni.

Propedeuticità

Oltre alla propedeuticità obbligatoria dell'insegnamento di «Matematica del continuo» è richiesta la conoscenza degli argomenti principali di programmazione degli elaboratori, e fortemente consigliato il superamento dell'esame di «Matematica del discreto».

Calendario delle lezioni

Loading...

Modalità d'esame

Gli studenti devono iscriversi all'appello scritto per poter sostenere l'esame.

L'esame consiste di una prova scritta e di una prova orale, entrambe relative agli argomenti trattati nell'insegnamento.

La prova scritta, della durata di due ore e mezzo, si svolge in laboratorio informatizzato. Viene richiesto di risolvere alcuni esercizi basati su domande a risposta aperta e di analizzare un dataset applicando in modo adeguato le tecniche statistiche viste a lezione. Gli studenti immatricolati dall'a.a. 2016/17 devono effettuare questa analisi utilizzando python, mentre gli immatricolati negli a.a. precedenti possono utilizzare python oppure R. La valutazione, espressa in termini di approvato/respinto, tiene conto del livello di padronanza degli argomenti e del corretto uso dei formalismi matematici.

La prova orale, a cui si accede previa superamento di quella scritta, è basata sulla discussione dello svolgimento della prova scritta e su alcune domande relative ad argomenti trattati nell'insegnamento. La sua valutazione, espressa in trentesimi, tiene conto del livello di padronanza degli argomenti, della chiarezza espositiva, della proprietà di linguaggio e del corretto uso del gergo tecnico.

Gli studenti immatricolati fino dell'anno accademico 2013/14 (compreso) hanno nel loro piano di studi l'insegnamento di «Calcolo della probabilità e statistica matematica», che dall'anno accademico 2015/16 risulta disattivato. Gli studenti che non hanno ancora sostenuto l'esame per tale insegnamento dovranno sostenere l'esame di «Statistica e analisi dei dati», facendo riferimento al programma e alle modalità d'esame descritte su questa pagina. In particolare, si consiglia di fare riferimento al materiale didattico pubblicato ed eventualmente ai siti dei laboratori integrativi per studiare i rudimenti di python o di R. Si segnala infine che per questioni formali gli studenti degli anni accademici precedenti dovranno iscriversi al SIFA facendo riferimento agli appelli di «Calcolo della probabilità e statistica matematica» che verranno attivati specificamente per loro.

Appelli d'esame

Sessione Data
giugno 12/06/2024
luglio 01/07/2024
settembre 13/09/2024
gennaio N/A
febbraio N/A
febbraio N/A