Master en Informatique (Università degli Studi di Milano)
Cet enseignement présente les principales techniques liées à l'analyse de grandes quantités de données.
Infos
Date | Info |
---|---|
13/03/2018 |
Heures de bureau annulées À partir du 14 mars les heures de bureau regulières sont annulées. Les étudiants peuvent organiser un rendez-vous via e-mail. |
09/01/2018 |
Test de Analyse des mégadonnées de janvier 2018 Les test de Analyse des mégadonnées de janvier aura lieu le 15/1 à 9:30 dans le bureau du professeur. |
20/04/2017 |
Heures de bureau du 9 janvier annulées Les heures de bureau du 9 janvier sont annulées. Les étudiants peuvent organiser un rendez-vous via e-mail. |
16/12/2017 |
Changement d'horaire pour les leçons de Analyse des mégadonnées La leçon du 19 décembre de Analyse des données est annullée. Elle sera rattrapée le 8/1/2018. |
07/12/2017 |
Changement d'horaire pour les leçons de Analyse des mégadonnées La leçon du 11 décembre de Analyse des mégadonnées aura lieu le 12 décembre. |
29/11/2017 |
Changement d'horaire pour les leçons de Analyse des mégadonnées Les prochâines leçons de Analyse des mégadonnées auront lieu le 4, 11, 18 et 19 décembre. |
02/11/2017 |
Changement d'horaire pour les leçons de Analyse des mégadonnées La leçon de Analyse des mégadonnées du 27/11 aura lieu à 14:30 dans l'aula 6; celle du 28/11 aura lieu à 13:30 dans l'aula alfa. |
04/10/2017 |
Container docker pour l'enseignement d'Analyse des mégadonnées Les étudiants du cours d'Analyse des mégadonnées peuvent télécharger un archive ZIP contenant les fichiers nécéssaires à fin de construire et exécuter le container docker utilisé en classe. |
Langue
Les leçons sont en italien.
Horaires du cours
Les cours auront lieu au département d'Informatique, selon le calendrier provisoire suivant:
Jour | Heure | Lieu |
---|---|---|
lundi | 14:30 - 16:30 | aula Delta |
mardi | 14:30 - 16:30 | aula Omega |
Tout changement à l'horaire sera annoncé en classe et publié dans la section Infos de cette page.
Heures de bureau
Sur rendez-vous, salle 5015 du Département d'Informatique.
Il est possible contacter l'enseignant par e-mail, en prenant soin de lire à l'avance le guide préparé par le professeur Sebastiano Vigna et précisant clairement dans le message le nom du cours et l'année scolaire. En particulier, les étudiants sont encouragés à toujours utiliser leur adresse académique (c'est à dire celui basée sur la domaine studenti.unimi.it
) en signant avec nom et numéro d'identification et rappelant que le temps de réponse peut varier en fonction des engagements de l'enseignant.
Materiel bibliographique
La partie théorique du cours fait référence au livre: Anand Rajaraman and Jeff Ullman, Mining of Massive Datasets (indiqué par RU dans le calendrier des leçons), disponible soit en format PDF téléchargeable gratuitement soit en version imprimée et publiée par Cambridge University Press (ISBN:9781107015357). Les lectures conseillées pour la partie pratique sont Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia, Learning Spark. Lightning-Fast Big Data Analysis, O'Reilly, 2015 (ISBN:978-1-449-35862-4) et Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills, Advanced Analytics with Spark. Patterns for Learning from Data at Scale, O'Reilly, 2015 (ISBN:978-1-491-91276-8)
La partie sur les systèmes de fichiers distribués et sur MapReduce fait réference au livre adopté et au tutoriel sur Hadoop publié par Yahoo!
Quelques laboratoires font référence au programme edX Data Science and Engineering with Spark.
Programme
Le programme fait référence aux arguments detaillés dans le calendrier des leçons, qui corresponds au matériel du livre adopté, plus le reste des documents indiqués entre le materiel bibliographique.
Calendrier des leçons
Modalités d'examination
L'examination consiste en un test orale, sur rendez-vous.