Dottorato di ricerca in Informatica (Università degli Studi di Milano)
Questo insegnamento illustra alcune tecnice di analisi dei dati caratterizzate da proprietà di scalabilità, unitamente a una loro implementazione che sfrutta tecnologie concepite per essere utilizzate in ambienti distribuiti. L'insegnamento è tenuto assieme al prof. Santini.
Avvisi
Data | Informazione |
---|---|
18/03/2016 |
Form di valutazione per il corso di dottorato Big data: analisi e tecnologie Gli studenti del corso di dottorato Big data: analisi e tecnologie sono invitati a compilare un questionario di valutazione. |
Lingua
Le lezioni sono in inglese.
Orari del corso
Le lezioni si svolgeranno presso il Dipartimento di Informatica nella sala riunioni al primo piano.
Ricevimento studenti
Su appuntamento, stanza 5015 del Dipartimento di Informatica.
È possibile contattare il docente tramite posta elettronica, avendo cura di leggere preventivamente la guida predisposta dal Prof. Sebastiano Vigna e di specificare chiaramente nell'oggetto del messaggio il nome dell'insegnamento e l'anno accademico. In particolare, si invitano gli studenti a usare sempre come mittente l'indirizzo fornito loro dall'Ateneo (basato cioè sul dominio studenti.unimi.it
) firmando con nome, cognome e matricola e ricordando che i tempi di risposta possono variare in funzione degli impegni del docente.
Materiale didattico
Il corso è basata sul seguente libro di testo: Anand Rajaraman and Jeff Ullman, Mining of Massive Datasets, disponibile sia come PDF gratuitamente scaricabile che pubblicato in versione cartacea da Cambridge University Press (ISBN:9781107015357). Per le parti pratiche si consiglia la lettura di Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia, Learning Spark. Lightning-Fast Big Data Analysis, O'Reilly, 2015 (ISBN:978-1-449-35862-4) e di Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills, Advanced Analytics with Spark. Patterns for Learning from Data at Scale, O'Reilly, 2015 (ISBN:978-1-491-91276-8)
Programma
Il programma riguarda gli argomenti dettagliati nel calendario delle lezioni. Il software descritto è disponibile in due repository git, rispettiamente per la parte di teoria e di laboratorio.
Calendario delle lezioni
Modalità d'esame
L'esame consiste nella discussione di un progetto da concordare con i docenti.