Master en Informatique (Università degli Studi di Milano)


Cet enseignement présente les principales techniques liées à l'analyse de grandes quantités de données.

Infos

Date Info
13/03/2018 Heures de bureau annulées
À partir du 14 mars les heures de bureau regulières sont annulées. Les étudiants peuvent organiser un rendez-vous via e-mail.
09/01/2018 Test de Analyse des mégadonnées de janvier 2018
Les test de Analyse des mégadonnées de janvier aura lieu le 15/1 à 9:30 dans le bureau du professeur.
20/04/2017 Heures de bureau du 9 janvier annulées
Les heures de bureau du 9 janvier sont annulées. Les étudiants peuvent organiser un rendez-vous via e-mail.
16/12/2017 Changement d'horaire pour les leçons de Analyse des mégadonnées
La leçon du 19 décembre de Analyse des données est annullée. Elle sera rattrapée le 8/1/2018.
07/12/2017 Changement d'horaire pour les leçons de Analyse des mégadonnées
La leçon du 11 décembre de Analyse des mégadonnées aura lieu le 12 décembre.
29/11/2017 Changement d'horaire pour les leçons de Analyse des mégadonnées
Les prochâines leçons de Analyse des mégadonnées auront lieu le 4, 11, 18 et 19 décembre.
02/11/2017 Changement d'horaire pour les leçons de Analyse des mégadonnées
La leçon de Analyse des mégadonnées du 27/11 aura lieu à 14:30 dans l'aula 6; celle du 28/11 aura lieu à 13:30 dans l'aula alfa.
04/10/2017 Container docker pour l'enseignement d'Analyse des mégadonnées
Les étudiants du cours d'Analyse des mégadonnées peuvent télécharger un archive ZIP contenant les fichiers nécéssaires à fin de construire et exécuter le container docker utilisé en classe.

Langue

Les leçons sont en italien.

Horaires du cours

Les cours auront lieu au département d'Informatique, selon le calendrier provisoire suivant:

Jour Heure Lieu
lundi 14:30 - 16:30 aula Delta
mardi 14:30 - 16:30 aula Omega

Tout changement à l'horaire sera annoncé en classe et publié dans la section Infos de cette page.

Heures de bureau

Sur rendez-vous, salle 5015 du Département d'Informatique. Il est possible contacter l'enseignant par e-mail, en prenant soin de lire à l'avance le guide préparé par le professeur Sebastiano Vigna et précisant clairement dans le message le nom du cours et l'année scolaire. En particulier, les étudiants sont encouragés à toujours utiliser leur adresse académique (c'est à dire celui basée sur la domaine studenti.unimi.it) en signant avec nom et numéro d'identification et rappelant que le temps de réponse peut varier en fonction des engagements de l'enseignant.

Materiel bibliographique

La partie théorique du cours fait référence au livre: Anand Rajaraman and Jeff Ullman, Mining of Massive Datasets (indiqué par RU dans le calendrier des leçons), disponible soit en format PDF téléchargeable gratuitement soit en version imprimée et publiée par Cambridge University Press (ISBN:9781107015357). Les lectures conseillées pour la partie pratique sont Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia, Learning Spark. Lightning-Fast Big Data Analysis, O'Reilly, 2015 (ISBN:978-1-449-35862-4) et Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills, Advanced Analytics with Spark. Patterns for Learning from Data at Scale, O'Reilly, 2015 (ISBN:978-1-491-91276-8)

La partie sur les systèmes de fichiers distribués et sur MapReduce fait réference au livre adopté et au tutoriel sur Hadoop publié par Yahoo!

Quelques laboratoires font référence au programme edX Data Science and Engineering with Spark.

Programme

Le programme fait référence aux arguments detaillés dans le calendrier des leçons, qui corresponds au matériel du livre adopté, plus le reste des documents indiqués entre le materiel bibliographique.

Calendrier des leçons

Loading...

Modalités d'examination

L'examination consiste en un test orale, sur rendez-vous.