Big data: analisi e tecnologie 2015-16

Dottorato di ricerca in Informatica

Anni accademici precedenti

Questo insegnamento illustra alcune tecnice di analisi dei dati caratterizzate da proprietà di scalabilità, unitamente a una loro implementazione che sfrutta tecnologie concepite per essere utilizzate in ambienti distribuiti. L'insegnamento è tenuto assieme al prof. Santini.

Informazioni

Data Avviso
18/03/2016 Gli studenti del corso di dottorato Big data: analisi e tecnologie sono invitati a compilare un questionario di valutazione.

Orari del corso

Le lezioni si svolgeranno presso il Dipartimento di Informatica nella sala riunioni al primo piano.

Orario di ricevimento

Su appuntamento. È possibile contattare il docente tramite posta elettronica, avendo cura di leggere preventivamente la guida predisposta dal Prof. Sebastiano Vigna e di specificare chiaramente nell'oggetto del messaggio il nome dell'insegnamento e l'anno accademico. In particolare, si invitano gli studenti a usare sempre come mittente l'indirizzo fornito loro dall'Ateneo (basato cioè sul dominio studenti.unimi.it) firmando con nome, cognome e matricola e ricordando che i tempi di risposta possono variare in funzione degli impegni del docente.

Materiale didattico

Il corso è basata sul seguente libro di testo: Anand Rajaraman and Jeff Ullman, Mining of Massive Datasets, disponibile sia come PDF gratuitamente scaricabile che pubblicato in versione cartacea da Cambridge University Press (ISBN:9781107015357). Per le parti pratiche si consiglia la lettura di Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia, Learning Spark. Lightning-Fast Big Data Analysis, O'Reilly, 2015 (ISBN:978-1-449-35862-4) e di Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills, Advanced Analytics with Spark. Patterns for Learning from Data at Scale, O'Reilly, 2015 (ISBN:978-1-491-91276-8)

Programma

Il programma riguarda gli argomenti dettagliati nel calendario delle lezioni. Il software descritto è disponibile in due repository git, rispettiamente per la parte di teoria e di laboratorio.

Calendario delle lezioni

Loading...

Il calendario delle lezioni e degli appelli è basato su Google calendar ed è accessibile anche tramite feed, iCal e Web.

Modalità d'esame

L'esame consiste nella discussione di un progetto da concordare con i docenti.