Master en Informatique (Università degli Studi di Milano)
Cet enseignement présente les principales techniques liées à l'analyse de grandes quantités de données.
Infos
Date | Info |
---|---|
23/06/2017 |
Diapositives du séminaire «The role of the data scientist» Les diapositives du séminaire «The role of the data scientist» par A. Condorelli sont disponibles. |
20/04/2017 |
Heures de bureau annulées À partir du 20 avril les heures de bureau regulières sont annulées. Les étudiants peuvent organiser un rendez-vous via e-mail. |
06/03/2017 |
Heures de bureau pour le deuxième sémestre Les heures de bureau pour le deuxième sémestre seront le jeudi entre 14:30 et 17:30 dans le bureau du professeur, à partir du 9/3. |
01/02/2017 |
Heures de bureau annulées À partir du 2 fevrier les heures de bureau regulières sont annulées jusqu'au prochaîn semestre. Les étudiants peuvent organiser un rendez-vous via e-mail. |
09/01/2017 |
Changement de classe pour la leçon de Analyse des mégadonnées du 10/1/2017 La leçon de Analyse des mégadonnées du 10/1/2017 aura lieu dans l'aula Beta. |
20/12/2016 |
Heures de bureau du 22/12 modifiées Les heures de bureau du 22/12 termineront à 16:00. |
21/11/2016 |
Heures de bureau du 24 novembre annulées Les heures de bureau du 24 novembre sont annulées. Les étudiants peuvent organiser un rendez-vous via e-mail. |
26/09/2016 |
Changement du calendrier pour les leçons de Analyse des mégadonnées À partir du 27 septembre, les leçons de Analyse des mégadonnées auront lieu dans l'aula Delta. |
21/09/2016 |
Heures de bureau pour le premier sémestre Les heures de bureau pour le premier sémestre seront le jeudi entre 14:00 et 17:00 dans le bureau du professeur, à partir du 29/09. |
02/09/2016 |
Déplacement de l'étude À partir d'aujourd'hui, Prof. Malchiodi a déplacé son étude dans le bureau P102 au premier étage du siège du département en via Comelico. |
Langue
Les leçons sont en italien.
Horaires du cours
Les cours auront lieu au département d'Informatique, selon le calendrier provisoire suivant:
Jour | Heure | Lieu |
---|---|---|
lundi | 15:30 - 17:30 | aula Delta |
mardi | 15:30 - 17:30 | aula Delta |
Tout changement à l'horaire sera annoncé en classe et publié dans la section Infos de cette page.
Heures de bureau
Sur rendez-vous, salle 5015 du Département d'Informatique.
Il est possible contacter l'enseignant par e-mail, en prenant soin de lire à l'avance le guide préparé par le professeur Sebastiano Vigna et précisant clairement dans le message le nom du cours et l'année scolaire. En particulier, les étudiants sont encouragés à toujours utiliser leur adresse académique (c'est à dire celui basée sur la domaine studenti.unimi.it
) en signant avec nom et numéro d'identification et rappelant que le temps de réponse peut varier en fonction des engagements de l'enseignant.
Materiel bibliographique
La partie théorique du cours fait référence au livre: Anand Rajaraman and Jeff Ullman, Mining of Massive Datasets, disponible soit en format PDF téléchargeable gratuitement soit en version imprimée et publiée par Cambridge University Press (ISBN:9781107015357). Les lectures conseillées pour la partie pratique sont Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia, Learning Spark. Lightning-Fast Big Data Analysis, O'Reilly, 2015 (ISBN:978-1-449-35862-4) et Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills, Advanced Analytics with Spark. Patterns for Learning from Data at Scale, O'Reilly, 2015 (ISBN:978-1-491-91276-8)
La partie sur les systèmes de fichiers distribués et sur MapReduce fait réference au livre adopté et au tutoriel sur Hadoop publié par Yahoo!
Quelques laboratoires font référence au programme edX Data Science and Engineering with Spark.
Programme
Le programme fait référence aux arguments detaillés dans le calendrier des leçons, qui corresponds au matériel du livre adopté, plus le reste des documents indiqués entre le materiel bibliographique.
Calendrier des leçons
Modalités d'examination
L'examination consiste en un test orale, sur rendez-vous.