Master en Informatique (Università degli Studi di Milano)


Cet enseignement présente les principales techniques liées à l'analyse de grandes quantités de données.

Infos

Date Info
06/06/2016 Heures de bureau annulées
À partir du 13 juin les heures de bureau regulières sont annulées jusqu'au prochaîn semestre. Les étudiants peuvent organiser un rendez-vous via e-mail.
01/05/2016 Heures de bureau annulées pour deux semaines
Les heures de bureau sont annulées pour deux semaines. Les étudiants peuvent contacter le professeur via e-mail.
16/02/2016 Heures de bureau du 22 février annulées
Les heures de bureau du 22 février sont annulées. Les étudiants peuvent organiser un rendez-vous via e-mail.
23/11/2015 crédits AWS
Les étudiants du cours en analyse de mégadonnées peuvent obtenir des codes promotionnels pour AWS s'enregistrant au AWS educate program et spécifiant «Università degli Studi di Milano» comme institution. Crédits additionnels peuvent être obtenus avec le GitHub education program.
05/10/2015 Interruption leçon de Analyse des mégadonnées
La leçon de Analyse des mégadonnées du 7 octobre est annulée.
01/10/2015 Heures de bureau pour le premier sémestre
Les heures de bureau pour le premier sémestre seront le jeudi à 14:30 dans le bureau du professeur, à partir du 5/10.

Langue

Les leçons sont en italien.

Horaires du cours

Les cours auront lieu au département d'Informatique, selon le calendrier provisoire suivant:

Jour Heure Lieu
lundi 14:30 - 16:30 aula 5
mercredi 14:30 - 16:30 aula 6

Tout changement à l'horaire sera annoncé en classe et publié dans la section Infos de cette page.

Heures de bureau

Sur rendez-vous (par e-mail). Il est possible contacter l'enseignant par e-mail, en prenant soin de lire à l'avance le guide préparé par le professeur Sebastiano Vigna et précisant clairement dans le message le nom du cours et l'année scolaire. En particulier, les étudiants sont encouragés à toujours utiliser leur adresse académique (c'est à dire celui basée sur la domaine studenti.unimi.it) en signant avec nom et numéro d'identification et rappelant que le temps de réponse peut varier en fonction des engagements de l'enseignant.

Materiel bibliographique

La partie théorique du cours fait référence au livre: Anand Rajaraman and Jeff Ullman, Mining of Massive Datasets, disponible soit en format PDF téléchargeable gratuitement soit en version imprimée et publiée par Cambridge University Press (ISBN:9781107015357). Les lectures conseillées pour la partie pratique sont Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia, Learning Spark. Lightning-Fast Big Data Analysis, O'Reilly, 2015 (ISBN:978-1-449-35862-4) et Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills, Advanced Analytics with Spark. Patterns for Learning from Data at Scale, O'Reilly, 2015 (ISBN:978-1-491-91276-8)

La partie sur les systèmes de fichiers distribués et sur MapReduce fait réference au livre adopté et au tutoriel sur Hadoop publié par Yahoo!

Programme

Le programme fait référence aux arguments detaillés dans le calendrier des leçons, qui corresponds au matériel du livre adopté, plus le reste des documents indiqués entre le materiel bibliographique.

Calendrier des leçons

Loading...

Modalités d'examination

L'examination consiste en un test orale, sur rendez-vous.