Laurea magistrale in Informatica (Università degli Studi di Milano)


Questo insegnamento introduce le principali tecniche legate all'analisi di grosse moli di dati.

Avvisi

Data Informazione
21/05/2015 Sospensione del ricevimento studenti del 28 maggio
Il ricevimento studenti del 28 maggio è sospeso. Gli studenti possono contattare il docente per un ricevimento su appuntamento.
19/03/2015 Sospensione del ricevimento studenti del 2 aprile
Il ricevimento studenti del 2 aprile è sospeso. Gli studenti possono contattare il docente per un ricevimento su appuntamento.
12/03/2015 Modifica del ricevimento studenti del 12/3
Il ricevimento studenti odierno inizierà alle ore 16:00.
05/03/2015 Orario di ricevimento per il secondo semestre
L'orario di ricevimento studenti per il secondo semestre si svolgerà il giovedì alle 14:30 nello studio del docente, a partire dal 5/3.
09/01/2015 Sospensione del ricevimento studenti
Il ricevimento studenti su base regolare è sospeso fino al prossimo semestre. Gli studenti possono contattare il docente per un ricevimento su appuntamento.
25/11/2014 Modifica del ricevimento studenti del 25/11
Il ricevimento studenti odierno terminerà alle ore 15:00. Gli studenti possono contattare il docente per un ricevimento su appuntamento.
13/11/2014 Tutorial su MapReduce in AWS
Ho pubblicato un tutorial sull'esecuzione di job MapReduce in AWS.
15/10/2014 Finanziamento AWS in Education per l'insegnamento di Analisi dei dati su larga scala
Gli studenti del corso di Analisi dei dati su larga scala possono usare un credito di 100US$ per accedere agli strumenti di Amazon Web Services.
09/10/2014 Tutorial su installazione di Hadoop
Ho aggiornato il mio tutorial sull'installazione di Hadoop in una macchina virtuale.

Lingua

Le lezioni sono in italiano.

Orari del corso

Le lezioni si svolgeranno presso il dipartimento di Informatica, secondo il seguente orario:

Giorno Ora Luogo
martedì 16:30 - 18:30 aula 5
giovedì 15:30 - 17:30 aula 5

Eventuali variazioni rispetto al calendario pianificato verranno comunicate in aula e pubblicizzate nel paragrafo Avvisi di questa pagina.

Ricevimento studenti

Su appuntamento, stanza 5015 del Dipartimento di Informatica. È possibile contattare il docente tramite posta elettronica, avendo cura di leggere preventivamente la guida predisposta dal Prof. Sebastiano Vigna e di specificare chiaramente nell'oggetto del messaggio il nome dell'insegnamento e l'anno accademico. In particolare, si invitano gli studenti a usare sempre come mittente l'indirizzo fornito loro dall'Ateneo (basato cioè sul dominio studenti.unimi.it) firmando con nome, cognome e matricola e ricordando che i tempi di risposta possono variare in funzione degli impegni del docente.

Materiale didattico

Il corso è basato sul seguente libro di testo: Anand Rajaraman and Jeff Ullman, Mining of Massive Datasets, disponibile sia come PDF gratuitamente scaricabile che pubblicato in versione cartacea da Cambridge University Press (ISBN:9781107015357).

Per la parte sui file system distribuiti e il paradigma MapReduce si consiglia, oltre al capitolo 2 del libro di testo, la lettura del tutorial su Hadoop predisposto da Yahoo!

Gli studenti dell'insegnamento possono beneficiare di un credito di 100US$ per utilizzare gli strumenti di Amazon Web Services.

La parte sull'apprendimento automatico è descritta nel capitolo aggiuntivo del libro di testo disponibile online, nel capitolo 3 di S. Haykin, Neural Networks: A Comprehensive Foundation, Prentice Hall, 1999 (ISBN 0-13-908385-5) e in due tutorial online sulla classificazione e sulla regressione.

La parte sulla riduzione della dimensionalità è descritta in un capitolo aggiuntivo del libro di testo disponibile online.

Programma

Il programma riguarda gli argomenti dettagliati nel calendario delle lezioni, che corrisponde al materiale trattato sul libro di testo nei capitoli 1, 2 (fino al paragrafo 2.6.2 incluso), 3 (fino al paragrafo 3.7 incluso), 4 (fino al paragrafo 4.5 incluso), 5 (paragrafi 5.2.4 e 5.2.5 esclusi), 6 (fino al paragrafo 6.5.1 incluso), 7 (fino al paragrafo 7.5 incluso), 8 (fino al paragrafo 8.4.6 incluso), 9 (fino al paragrafo 9.4 incluso), 10 (paragrafi 10.1, 10.2, 10.4 e 10.5), 11 (fino al paragrafo 11.3 incluso) e 12 (fino al paragrafo 12.3 incluso), oltre che sui restanti documenti elencati tra il materiale didattico.

Calendario delle lezioni

Loading...

Modalità d'esame

L'esame consiste in una prova orale, da svolgersi su appuntamento.