Laurea magistrale in Informatica (Università degli Studi di Milano)
Questo insegnamento introduce le principali tecniche legate all'analisi di grosse moli di dati.
Avvisi
Data | Informazione |
---|---|
05/06/2013 |
Modifica al calendario dell'insegnamento di Analisi dei dati su larga scala Venerdì 7/6 si svolgeranno due lezioni dell'insegnamento di Analisi dei dati su larga scala: una dalle 11:30 alle 13:30 (aula 5) e una dalle 13:30 alle 15:30 (aula 5). |
23/05/2013 |
Annullamento lezione di Analisi dei dati su larga scala del 31/5 La lezione del 31/5 è annullata a causa di una conferenza. |
10/05/2013 |
Sospensione del ricevimento studenti Il ricevimento studenti su base regolare è sospeso fino al prossimo semestre. Gli studenti possono contattare il docente per un ricevimento su appuntamento. |
10/05/2013 |
Annullamento lezione di Analisi dei dati su larga scala del 17/5 e del 21/5 Le lezioni del 17/5 e del 21/5 sono annullate a causa di un meeting di progetto della CE. |
30/04/2013 |
Tutorial su installazione di Hadoop Ho pubblicato un tutorial sull'installazione di Hadoop in una macchina virtuale. |
29/04/2013 |
Sospensione del ricevimento studenti Il ricevimento studenti del 2/5 e del 9/5 è sospeso. Gli studenti possono contattare il docente per un ricevimento su appuntamento. |
19/04/2013 |
Annullamento lezione di Analisi dei dati su larga scala del 26/4 La lezione del 22/3 è annullata a causa delle vacanze del 25/4. |
26/03/2013 |
Ciclo di seminari sulla creazione di startup Si segnala una serie di seminari sulla creazione di startup organizzata nella nostra Università. |
19/03/2013 |
Annullamento lezione di Analisi dei dati su larga scala del 22/3 La lezione del 22/3 è annullata a causa di uno sciopero dei mezzi di trasporto pubblici. |
13/03/2013 |
Modifica al calendario dell'insegnamento di Analisi dei dati su larga scala A partire dal 19/03 le lezioni si svolgeranno il martedì dalle 14:30 alle 16:30 in aula 6 e il venerdì dalle 13:30 alle 15:30 in aula 5. |
13/03/2013 |
Spostamento lezione di Analisi dei dati su larga scala del 15/03 La lezione di venerdì 15/03 inizierà alle 14:30. |
05/03/2013 |
Annullamento lezione di Analisi dei dati su larga scala dell'8/3 La lezione dell'8/3 è annullata. |
25/02/2013 |
Sospensione del ricevimento studenti Il ricevimento studenti del 28/02 è sospeso. Gli studenti possono contattare il docente per un ricevimento su appuntamento. |
Lingua
Le lezioni sono in italiano.
Orari del corso
Le lezioni si svolgeranno presso il dipartimento di Informatica, secondo il seguente orario:
Giorno | Ora | Luogo |
---|---|---|
martedì | 14:30 - 16:30 | aula 6 |
venerdì | 13:30 - 15:30 | aula 5 |
Eventuali variazioni rispetto al calendario pianificato verranno comunicate in aula e pubblicizzate nel paragrafo Avvisi di questa pagina.
Ricevimento studenti
Su appuntamento, stanza 5015 del Dipartimento di Informatica.
È possibile contattare il docente tramite posta elettronica, avendo cura di leggere preventivamente la guida predisposta dal Prof. Sebastiano Vigna e di specificare chiaramente nell'oggetto del messaggio il nome dell'insegnamento e l'anno accademico. In particolare, si invitano gli studenti a usare sempre come mittente l'indirizzo fornito loro dall'Ateneo (basato cioè sul dominio studenti.unimi.it
) firmando con nome, cognome e matricola e ricordando che i tempi di risposta possono variare in funzione degli impegni del docente.
Materiale didattico
Il corso è basato sul seguente libro di testo: Anand Rajaraman and Jeff Ullman, Mining of Massive Datasets, disponibile sia come PDF gratuitamente scaricabile che pubblicato in versione cartacea da Cambridge University Press (ISBN:9781107015357).
Per la parte sui file system distribuiti e il paradigma MapReduce si consiglia, oltre al capitolo 2 del libro di testo, la lettura del tutorial su Hadoop predisposto da Yahoo!
La parte sull'apprendimento automatico è descritta nel capitolo aggiuntivo del libro di testo disponibile online, nel capitolo 3 di S. Haykin, Neural Networks: A Comprehensive Foundation, Prentice Hall, 1999 (ISBN 0-13-908385-5) e in due tutorial online sulla classificazione e sulla regressione.
La parte sulla riduzione della dimensionalità è descritta in un capitolo aggiuntivo del libro di testo disponibile online.
Programma
Il programma riguarda gli argomenti dettagliati nel calendario delle lezioni, che corrisponde al materiale trattato sul libro di testo nei capitoli 1, 2 (escluso paragrafo 2.6.7), 3 (fino al paragrafo 3.7 incluso), 4 (fino al paragrafo 4.5 incluso), 5 (paragrafi 5.2.4 e 5.2.5 esclusi), 6 (fino al paragrafo 6.5.1 incluso), 7 (fino al paragrafo 7.5 incluso), 8 (fino al paragrafo 8.4.6 incluso), 9 (fino al paragrafo 9.4 incluso), 10 (paragrafi 10.1, 10.2, 10.4 e 10.5), 11 (fino al paragrafo 11.3 incluso) e 12 (fino al paragrafo 12.3 incluso), oltre che sui restanti documenti elencati tra il materiale didattico.
Calendario delle lezioni
Modalità d'esame
L'esame consiste in una prova orale, da svolgersi su appuntamento.