Laurea magistrale in Informatica (Università degli Studi di Milano)


Questo insegnamento introduce le principali tecniche legate all'analisi di grosse moli di dati.

Avvisi

Data Informazione
03/02/2020 Luogo e ora della prova di Analisi dei dati su larga scala di febbraio 2020
Le prove orali di Analisi dei dati su larga scala dell'appello di febbraio avranno luogo nella sala riunioni al quinto piano del Dipartimento di Informatica alle ore 10:30 del 5/2.
13/01/2020 Luogo e ora della prova di Analisi dei dati su larga scala di gennaio 2020
Le prove orali di Analisi dei dati su larga scala dell'appello di gennaio avranno luogo nella sala riunioni al quinto piano del Dipartimento di Informatica alle ore 14:30 del 16/1.
11/09/2019 Luogo e ora della prova di Analisi dei dati su larga scala di settembre 2019
Le prove orali di Analisi dei dati su larga scala dell'appello di luglio avranno luogo nel Lab. Magistrale al quinto piano del Dipartimento di Informatica alle ore 9:30 del 18/9.
28/06/2019 Luogo e ora della prova di Analisi dei dati su larga scala di luglio 2019
Le prove orali di Analisi dei dati su larga scala dell'appello di luglio avranno luogo nella sala riunioni al quinto piano del Dipartimento di Informatica alle ore 9:30 dell'2/7 (cognomi con iniziale da A a L) e alle ore 14:30 del 3/7 (cognomi con iniziale da M a Z).
05/06/2019 Luogo e ora della prova di Analisi dei dati su larga scala di giugno 2019
Le prove orali di Analisi dei dati su larga scala dell'appello di giugno avranno luogo nella sala riunioni al quinto piano del Dipartimento di Informatica alle ore 9:30 dell'11/6 (cognomi con iniziale da A a M) e alle ore 9:30 del 13/6 (cognomi con iniziale da N a Z).
07/04/2019 Luogo e ora della prova di Analisi dei dati su larga scala di aprile 2019
Le prove orali di Analisi dei dati su larga scala dell'appello di aprile avranno luogo nello studio del prof. Malchiodi alle ore 14:30 del 9/4.
07/02/2019 Luogo e ora della prova di Analisi dei dati su larga scala di febbraio 2019
Le prove orali di Analisi dei dati su larga scala dell'appello di febbraio avranno luogo nella sala riunioni al quinto piano del Dipartimento di Informatica alle ore 14:30 del 12/2 (cognomi con iniziale da A a M) e alle ore 9:30 del 13/2 (cognomi con iniziale da N a Z).
24/01/2019 Modifica ricevimento studenti
A partire dal 28 gennaio il ricevimento studenti sarà organizzato tramite e-mail.
10/01/2019 Luogo e ora della prova di Analisi dei dati su larga scala di gennaio 2019
Le prove orali di Analisi dei dati su larga scala dell'appello di gennaio avranno luogo nella sala riunioni al quinto piano del Dipartimento di Informatica alle ore 15:00 del 16/1 (cognomi con iniziale da A a H) e alle ore 15:00 del 17/1 (cognomi con iniziale da L a Z).
13/12/2018 Ricevimento del 18 dicembre
Il ricevimento studenti del 18 dicembre è sospeso.
29/11/2018 Modifica alle aule delle lezioni di Analisi dei dati su larga scala
Le lezioni di Analisi dei dati su larga scala del 4/12, 11/12 e 8/1 avranno luogo in aula Tau. La lezione del 18/12 avrà luogo in aula 207.
30/10/2018 Modifica all'orario delle lezioni di Analisi dei dati su larga scala
Promemoria: la lezione di Analisi dei dati su larga scala del 28/11 avrà luogo in aula V5.
13/11/2018 Modifica dell'orario delle lezioni di Analisi dei dati su larga scala
A partire dal 20/11, le lezioni del martedì avranno luogo in aula 207.
05/11/2018 Sospensione lezioni e ricevimento il 6 e 7 novembre
Le lezioni del 6 e del 7 novembre e il ricevimento del 6 novembre sono sospesi.
08/10/2018 Modifica all'orario delle lezioni di Analisi dei dati su larga scala
La lezione di Analisi dei dati su larga scala del 17/10 avrà luogo in aula 305.
05/10/2018 Orario di ricevimento per il primo semestre
L'orario di ricevimento studenti per il primo semestre si svolgerà il martedì alle 16:30 nello studio del docente, a partire dal 09/10.
05/10/2018 Modifica dell'orario delle lezioni di Analisi dei dati su larga scala
A partire dal 09/10, le lezioni avranno luogo il martedì dalle 14:30 alle 16:30 in aula Alfa e il mercoledì dalle 13:30 alle 15:30 in aula Magna.

Lingua

Le lezioni sono in italiano.

Orari del corso

Le lezioni si svolgeranno presso il dipartimento di Informatica, secondo il seguente orario:

Giorno Ora Luogo
martedì 16:30 - 18:30 14:30 - 16:30 aula V8 aula Alfa Aula 207
mercoledì 13:30 - 15:30 aula 402 aula Magna

Eventuali variazioni rispetto al calendario pianificato verranno comunicate in aula e pubblicizzate nel paragrafo Avvisi di questa pagina.

Ricevimento studenti

Su appuntamento, stanza 5015 del Dipartimento di Informatica. È possibile contattare il docente tramite posta elettronica, avendo cura di leggere preventivamente la guida predisposta dal Prof. Sebastiano Vigna e di specificare chiaramente nell'oggetto del messaggio il nome dell'insegnamento e l'anno accademico. In particolare, si invitano gli studenti a usare sempre come mittente l'indirizzo fornito loro dall'Ateneo (basato cioè sul dominio studenti.unimi.it) firmando con nome, cognome e matricola e ricordando che i tempi di risposta possono variare in funzione degli impegni del docente.

Materiale didattico

La parte teorica del corso è basata sul seguente libro di testo (indicato come RU nel calendario delle lezioni): Anand Rajaraman and Jeff Ullman, Mining of Massive Datasets, disponibile sia come PDF gratuitamente scaricabile che pubblicato in versione cartacea da Cambridge University Press (ISBN:9781107015357). Per le parti pratiche si consiglia la lettura di Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia, Learning Spark. Lightning-Fast Big Data Analysis, O'Reilly, 2015 (ISBN:978-1-449-35862-4) e di Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills, Advanced Analytics with Spark. Patterns for Learning from Data at Scale, O'Reilly, 2015 (ISBN:978-1-491-91276-8)

Per la parte sui file system distribuiti e il paradigma MapReduce si consiglia, oltre al capitolo 2 del libro di testo, la lettura del tutorial su Hadoop predisposto da Yahoo!

Alcuni laboratori fanno riferimento al programma edX Data Science and Engineering with Spark.

Programma

Il programma riguarda gli argomenti dettagliati nel calendario delle lezioni, che corrisponde al materiale trattato sul libro di testo, oltre che sui restanti documenti elencati tra il materiale didattico.

Calendario delle lezioni

Loading...

Modalità d'esame

L'esame consiste in una prova orale.

Appelli d'esame

Sessione Data
gennaio 16/01/2019
febbraio 11/02/2019
giugno 11/06/2019
luglio 02/07/2019
settembre 17/09/2019
gennaio 16/01/2020