Cours de spécialisation en Science des données pour l'économie, le business et la finance (Università degli Studi di Milano)
Langue
Les leçons sont en italien.
Materiel bibliographique
Le cours fait référence au livre Mining of Massive Datasets (MMD par la suite).
Programme
Le programme fait référence aux arguments detaillés dans le calendrier des leçons.
Calendrier des leçons
Date | Sujet | Documents |
---|---|---|
07/07/2018 | Stockage distribué (HDFS). |
|
07/07/2018 | Map-reduce |
|
12/07/2018 | Exemples d'algorithmes map-reduce. |
|
14/07/2018 | Apache Spark. | |
14/07/2018 | Analyse de liens. | |
14/07/2018 | Recherche d'éléments similaires. |
|
19/07/2018 | Recherche d'ensembles fréquents. |
|
19/07/2018 | Regroupement. |
|
19/07/2018 | Systèmes de recommandation. |
|
20/07/2018 | Régression. |
Modalités d'examination
L'examination consiste en un projet pour les cours de Parallel and distributed computing, Elements of R and python (module sur python), Databases, data linking and data visualization e Cloud computing, Data Base and Web Scraping Lab (modulo sur le Cloud computing). Les étudiants peuvent télécharger un notebook qui contient le text du projet et le fichier avec les données à élaborer. La réalisation du projet (individuelle ou par groupes de deux personne maximum) doit être envoyée aux enseignants par courriel.