Laurea magistrale in Informatica (Università degli Studi di Milano)
L'insegnamento si propone di descrivere il quadro complessivo dei processi per l'elaborazione dei big data, sia per quanto riguarda le metodologie e le tecnologie applicate in tale contesto.
Risultati attesi
Gli studenti:
- saranno in grado di utilizzare le tecnologie per la memorizzazione distribuita dei dati;
- apprenderanno il framework dell'elaborazione distribuita MapReduce e le sue principali estensioni;
- apprenderanno i principali algoritmi utilizzati per problemi classici relativi ai big data, e a implementarli in un ambiente di elaborazione distribuito;
- saranno in grado di scegliere i metodi appropriati per risolvere problemi caratterizzati da big data.
Avvisi
Data | Informazione |
---|---|
31/05/2021 |
Incontro con Radicalbit Venerdì 4/6 è previsto un incontro rivolto agli studenti dell'insegnamento di «Algoritmi per dati su larga scala». In questo incontro l'azienda Radicalbit presenterà alcune opportunità di tesi esterne. L'incontro avverrà a distanza, usando lo stesso link Zoom delle lezioni. |
31/05/2021 |
Modifica ricevimento studenti A partire dal 31 maggio il ricevimento studenti sarà organizzato tramite e-mail. |
27/05/2021 |
Disponibilità video delle lezioni di «Statistica e
analisi dei dati» (Laurea in Informatica) e di «Algoritmi per
dati su larga scala» (Laurea Magistrale in Informatica) Le registrazioni delle lezioni di «Statistica e analisi dei dati» (Laurea in Informatica) e di «Algoritmi per dati su larga scala» (Laurea Magistrale in Informatica) saranno disponibili fino al 19 giugno. |
20/05/2021 |
Progetti per l'insegnamento di «Algoritmi per dati
su larga scala» (Laurea magistrale in Informatica) È disponibile il testo di un progetto per gli insegnamenti di «Algoritmi per dati su larga scala» e «Metodi statistici per l'apprendimento» della Laurea magistrale in «Informatica». |
02/05/2021 |
Progetti per l'insegnamento di «Algoritmi per dati
su larga scala» (Laurea magistrale in Informatica) Sono disponibili i testi dei progetti per l'insegnamento di «Algoritmi per dati su larga scala» della Laurea magistrale in «Informatica». Un progetto congiunto con l'insegnamento di «Metodi statistici per l'apprendimento» sarà pubblicato a breve. |
28/04/2021 |
Ricevimento del 30 aprile Il ricevimento studenti del 30 aprile è sospeso. |
01/04/2021 |
Ricevimento del 2 aprile Il ricevimento studenti del 2 aprile è sospeso. |
30/03/2021 |
Accessi ai video delle lezioni Per poter accedere ai video delle lezioni è necessario registrarsi alla pagina moodle del corso corrispondente. Nel caso questo non fosse possibile è necessario avvisare il docente. |
10/03/2021 |
Modifica ricevimento studenti dell'insegnamento «Algoritmi per dati su larga scala» Il ricevimento studenti dell'insegnamento «Algoritmi per dati su larga scala» dell'11/03 inizierà alle 18:30. Dalla settimana successiva il ricevimento avrà luogo ogni venerdì alle 16:30. |
29/09/2020 |
Semestre dell'insegnamento di Algoritmi per dati su larga scala L'insegnamento di Algoritmi per dati su larga scala sarà erogato nel secondo semestre. |
Lingua
Le lezioni sono in inglese.
Orari del corso
Le lezioni si svolgono (fino a nuove indicazioni) a distanza autenticandosi a un link zoom accessibile dalla pagina moodle dell'insegnamento. L'orario provvisorio è il seguente:
Giorno | Ora | Luogo |
---|---|---|
lunedì | 16:30 - 18:30 | zoom |
mercoledì | 14:30 - 16:30 | zoom |
Eventuali variazioni rispetto al calendario pianificato verranno comunicate in aula e pubblicizzate nel paragrafo Avvisi di questa pagina. La registrazione delle lezioni, contrassegnate con (R) nel calendario, è resa disponibile fino alla fine dell'insegnamento, accedendo alla pagina moodle relativa.
Ricevimento studenti
Su appuntamento, stanza 5015 del Dipartimento di Informatica.
È possibile contattare il docente tramite posta elettronica, avendo cura di leggere preventivamente la guida predisposta dal Prof. Sebastiano Vigna e di specificare chiaramente nell'oggetto del messaggio il nome dell'insegnamento e l'anno accademico. In particolare, si invitano gli studenti a usare sempre come mittente l'indirizzo fornito loro dall'Ateneo (basato cioè sul dominio studenti.unimi.it
) firmando con nome, cognome e matricola e ricordando che i tempi di risposta possono variare in funzione degli impegni del docente.
È inoltre previsto un ricevimento settimanale di gruppo, specifico per l'insegnamento, che avrà luogo ogni giovedì alle 17:30, utilizzando lo stesso link zoom delle lezioni.
Materiale didattico
Le lezioni sono basate:
- sul libro Mining of Massive Datasets, scritto da A. Rajaraman e J. Ullman (indicato come RU nel calendario delle lezioni), gratuitamente scaricabile dal sito degli autori e pubblicato in versione cartacea da Cambridge University Press (ISBN:9781107015357);
- sulle dispense e sul codice di esempio pubblicati nel calendario delle lezioni.
Programma
Il programma riguarda gli argomenti dettagliati nel calendario delle lezioni (disponibile all'inizio delle lezioni), che corrisponde al materiale trattato sul libro di testo, oltre che sui restanti documenti elencati tra il materiale didattico.
Propedeuticità
È richiesta la conoscenza degli argomenti principali di programmazione degli elaboratori, analisi matematica e probabilità e statistica al livello considerato in una laurea triennale di area informatica.
Calendario delle lezioni
Modalità d'esame
L'esame consiste di un progetto e di una prova orale, entrambi relativi agli argomenti trattati nell'insegnamento. Il progetto richiede l'elaborazione di un dataset tramite applicazione critica delle tecniche descritte durante le lezioni, ed è riassunto in una relazione scritta. La valutazione del progetto, espressa in termini approvato/respinto, tiene conto del livello di padronanza degli argomenti e della chiarezza espositiva nella relazione presentata. La prova orale, alla quale si accede dopo che il progetto è stato valutato positivamente, è basata sulla discussione di alcuni argomenti trattati nell'insegnamento e sull'approfondimento di alcuni aspetti del progetto presentato. La valutazione della prova orale, espressa in trentesimi, tiene conto del livello di padronanza degli argomenti, della chiarezza espositiva e della proprietà di linguaggio.
Appelli d'esame
Sessione | Data | |
---|---|---|
giugno | 17/06/2021 | |
luglio | 02/07/2021 | |
settembre | 08/09/2021 | |
settembre | 22/09/2021 | |
gennaio | N/A | |
febbraio | N/A |