Master di II livello in Data science for economics, business and finance (Università degli Studi di Milano)
Lingua
Le lezioni sono in italiano.
Materiale didattico
L'insegnamento è basato sul libro Mining of Massive Datasets (MMD nel resto di questa pagina).
Programma
Il programma riguarda gli argomenti dettagliati nel calendario delle lezioni.
Calendario delle lezioni
Data | Argomento | Materiale |
---|---|---|
07/07/2018 | Storage distribuito (HDFS). |
|
07/07/2018 | Map-reduce |
|
12/07/2018 | Esempi di algoritmi map-reduce. |
|
14/07/2018 | Apache Spark. | |
14/07/2018 | Analisi di link. | |
14/07/2018 | Ricerca di elementi simili. |
|
19/07/2018 | Ricerca di insiemi frequenti. |
|
19/07/2018 | Clustering. |
|
19/07/2018 | Sistemi di raccomandazione. |
|
20/07/2018 | Regressione. |
Modalità d'esame
L'esame è congiunto per i corsi di Parallel and distributed computing, Elements of R and python (modulo di python), Databases, data linking and data visualization e Cloud computing, Data Base and Web Scraping Lab (modulo di Cloud computing). Gli studenti possono scaricare un notebook contenente il testo del progetto da realizzare e il file contenente i dati da elaborare. Il progetto va svolto indidualmente o a gruppi di due persone, e inviato tamite mail ai docenti dei corsi coinvolti.