Master en Informatique (Università degli Studi di Milano)


Cet enseignement présente les principales techniques liées à l'analyse de grandes quantités de données.

Infos

Date Info
23/06/2017 Diapositives du séminaire «The role of the data scientist»
Les diapositives du séminaire «The role of the data scientist» par A. Condorelli sont disponibles.
20/04/2017 Heures de bureau annulées
À partir du 20 avril les heures de bureau regulières sont annulées. Les étudiants peuvent organiser un rendez-vous via e-mail.
06/03/2017 Heures de bureau pour le deuxième sémestre
Les heures de bureau pour le deuxième sémestre seront le jeudi entre 14:30 et 17:30 dans le bureau du professeur, à partir du 9/3.
01/02/2017 Heures de bureau annulées
À partir du 2 fevrier les heures de bureau regulières sont annulées jusqu'au prochaîn semestre. Les étudiants peuvent organiser un rendez-vous via e-mail.
09/01/2017 Changement de classe pour la leçon de Analyse des mégadonnées du 10/1/2017
La leçon de Analyse des mégadonnées du 10/1/2017 aura lieu dans l'aula Beta.
20/12/2016 Heures de bureau du 22/12 modifiées
Les heures de bureau du 22/12 termineront à 16:00.
21/11/2016 Heures de bureau du 24 novembre annulées
Les heures de bureau du 24 novembre sont annulées. Les étudiants peuvent organiser un rendez-vous via e-mail.
26/09/2016 Changement du calendrier pour les leçons de Analyse des mégadonnées
À partir du 27 septembre, les leçons de Analyse des mégadonnées auront lieu dans l'aula Delta.
21/09/2016 Heures de bureau pour le premier sémestre
Les heures de bureau pour le premier sémestre seront le jeudi entre 14:00 et 17:00 dans le bureau du professeur, à partir du 29/09.
02/09/2016 Déplacement de l'étude
À partir d'aujourd'hui, Prof. Malchiodi a déplacé son étude dans le bureau P102 au premier étage du siège du département en via Comelico.

Langue

Les leçons sont en italien.

Horaires du cours

Les cours auront lieu au département d'Informatique, selon le calendrier provisoire suivant:

Jour Heure Lieu
lundi 15:30 - 17:30 aula Delta
mardi 15:30 - 17:30 aula Delta

Tout changement à l'horaire sera annoncé en classe et publié dans la section Infos de cette page.

Heures de bureau

Sur rendez-vous (par e-mail). Il est possible contacter l'enseignant par e-mail, en prenant soin de lire à l'avance le guide préparé par le professeur Sebastiano Vigna et précisant clairement dans le message le nom du cours et l'année scolaire. En particulier, les étudiants sont encouragés à toujours utiliser leur adresse académique (c'est à dire celui basée sur la domaine studenti.unimi.it) en signant avec nom et numéro d'identification et rappelant que le temps de réponse peut varier en fonction des engagements de l'enseignant.

Materiel bibliographique

La partie théorique du cours fait référence au livre: Anand Rajaraman and Jeff Ullman, Mining of Massive Datasets, disponible soit en format PDF téléchargeable gratuitement soit en version imprimée et publiée par Cambridge University Press (ISBN:9781107015357). Les lectures conseillées pour la partie pratique sont Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia, Learning Spark. Lightning-Fast Big Data Analysis, O'Reilly, 2015 (ISBN:978-1-449-35862-4) et Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills, Advanced Analytics with Spark. Patterns for Learning from Data at Scale, O'Reilly, 2015 (ISBN:978-1-491-91276-8)

La partie sur les systèmes de fichiers distribués et sur MapReduce fait réference au livre adopté et au tutoriel sur Hadoop publié par Yahoo!

Quelques laboratoires font référence au programme edX Data Science and Engineering with Spark.

Programme

Le programme fait référence aux arguments detaillés dans le calendrier des leçons, qui corresponds au matériel du livre adopté, plus le reste des documents indiqués entre le materiel bibliographique.

Calendrier des leçons

Loading...

Modalités d'examination

L'examination consiste en un test orale, sur rendez-vous.