Cours de spécialisation en Science des données pour l'économie, le business et la finance (Università degli Studi di Milano)

Langue

Les leçons sont en italien.

Materiel bibliographique

Le cours fait référence au livre Mining of Massive Datasets (MMD par la suite).

Programme

Le programme fait référence aux arguments detaillés dans le calendrier des leçons.

Calendrier des leçons

Date Sujet Documents
07/07/2018 Stockage distribué (HDFS).
07/07/2018 Map-reduce
12/07/2018 Exemples d'algorithmes map-reduce.
14/07/2018 Apache Spark.
14/07/2018 Analyse de liens.
14/07/2018 Recherche d'éléments similaires.
19/07/2018 Recherche d'ensembles fréquents.
19/07/2018 Regroupement.
19/07/2018 Systèmes de recommandation.
20/07/2018 Régression.

Modalités d'examination

L'examination consiste en un projet pour les cours de Parallel and distributed computing, Elements of R and python (module sur python), Databases, data linking and data visualization e Cloud computing, Data Base and Web Scraping Lab (modulo sur le Cloud computing). Les étudiants peuvent télécharger un notebook qui contient le text du projet et le fichier avec les données à élaborer. La réalisation du projet (individuelle ou par groupes de deux personne maximum) doit être envoyée aux enseignants par courriel.