Dottorato di ricerca in Informatica (Università degli Studi di Milano)

Questo insegnamento illustra alcune tecnice di analisi dei dati caratterizzate da proprietà di scalabilità, unitamente a una loro implementazione che sfrutta tecnologie concepite per essere utilizzate in ambienti distribuiti. L'insegnamento è tenuto assieme al prof. Santini.

Avvisi

Data Informazione
18/03/2016 Form di valutazione per il corso di dottorato Big data: analisi e tecnologie
Gli studenti del corso di dottorato Big data: analisi e tecnologie sono invitati a compilare un questionario di valutazione.

Lingua

Le lezioni sono in inglese.

Orari del corso

Le lezioni si svolgeranno presso il Dipartimento di Informatica nella sala riunioni al primo piano.

Ricevimento studenti

Su appuntamento, stanza 5015 del Dipartimento di Informatica. È possibile contattare il docente tramite posta elettronica, avendo cura di leggere preventivamente la guida predisposta dal Prof. Sebastiano Vigna e di specificare chiaramente nell'oggetto del messaggio il nome dell'insegnamento e l'anno accademico. In particolare, si invitano gli studenti a usare sempre come mittente l'indirizzo fornito loro dall'Ateneo (basato cioè sul dominio studenti.unimi.it) firmando con nome, cognome e matricola e ricordando che i tempi di risposta possono variare in funzione degli impegni del docente.

Materiale didattico

Il corso è basata sul seguente libro di testo: Anand Rajaraman and Jeff Ullman, Mining of Massive Datasets, disponibile sia come PDF gratuitamente scaricabile che pubblicato in versione cartacea da Cambridge University Press (ISBN:9781107015357). Per le parti pratiche si consiglia la lettura di Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia, Learning Spark. Lightning-Fast Big Data Analysis, O'Reilly, 2015 (ISBN:978-1-449-35862-4) e di Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills, Advanced Analytics with Spark. Patterns for Learning from Data at Scale, O'Reilly, 2015 (ISBN:978-1-491-91276-8)

Programma

Il programma riguarda gli argomenti dettagliati nel calendario delle lezioni. Il software descritto è disponibile in due repository git, rispettiamente per la parte di teoria e di laboratorio.

Calendario delle lezioni

Loading...

Modalità d'esame

L'esame consiste nella discussione di un progetto da concordare con i docenti.