Master en Informatique (Università degli Studi di Milano)
Cet enseignement présente les principales techniques liées à l'analyse de grandes quantités de données.
Infos
Date | Info |
---|---|
21/05/2015 |
Heures de bureau du 28 mai annulées Les heures de bureau du 28 mai sont annulées. Les étudiants peuvent organiser un rendez-vous via e-mail. |
19/03/2015 |
Heures de bureau du 2 avril annulées Les heures de bureau du 2 avril sont annulées. Les étudiants peuvent organiser un rendez-vous via e-mail. |
12/03/2015 |
Heures de bureau du 12/3 modifiées Les heures de bureau d'aujourd'hui commenceront à 16:00. |
05/03/2015 |
Heures de bureau pour le deuxième sémestre Les heures de bureau pour le deuxième sémestre seront le jeudi à 14:30 dans le bureau du professeur, à partir du 5/3. |
09/01/2015 |
Heures de bureau annulées Les heures de bureau regulières sont annulées jusqu'au prochaîn semestre. Les étudiants peuvent organiser un rendez-vous via e-mail. |
25/11/2014 |
Heures de bureau du 25/11 modifiées Les heures de bureau d'aujourd'hui termineront à 15:00. Les étudiants peuvent organiser un rendez-vous via e-mail. |
13/11/2014 |
Tutoriel sur MapReduce dans AWS J'ai publié un tutoriel sur l'execution de job MapReduce encodé en JAR dans AWS. |
15/10/2014 |
Financement AWS in Education pour le cours de Analyse de mégadonnées Les étudiants du cours de Analyse de mégadonnées peuvent bénéficier d'un financement de 100US$ chacun afin d'utiliser les outis de Amazon Web Services. |
09/10/2014 |
Tutoriel sur l'installation de Hadoop J'ai mis à jour mon tutoriel sur l'installation de Hadoop sur une machine virtuelle. |
Langue
Les leçons sont en italien.
Horaires du cours
Les cours auront lieu au département d'Informatique, selon le calendrier provisoire suivant:
Jour | Heure | Lieu |
---|---|---|
mardi | 16:30 - 18:30 | aula 5 |
jeudi | 15:30 - 17:30 | aula 5 |
Tout changement à l'horaire sera annoncé en classe et publié dans la section Infos de cette page.
Heures de bureau
Sur rendez-vous, salle 5015 du Département d'Informatique.
Il est possible contacter l'enseignant par e-mail, en prenant soin de lire à l'avance le guide préparé par le professeur Sebastiano Vigna et précisant clairement dans le message le nom du cours et l'année scolaire. En particulier, les étudiants sont encouragés à toujours utiliser leur adresse académique (c'est à dire celui basée sur la domaine studenti.unimi.it
) en signant avec nom et numéro d'identification et rappelant que le temps de réponse peut varier en fonction des engagements de l'enseignant.
Materiel bibliographique
L'enseignement fait référence au livre: Anand Rajaraman and Jeff Ullman, Mining of Massive Datasets, disponible soit en format PDF téléchargeable gratuitement soit en version imprimée et publiée par Cambridge University Press (ISBN:9781107015357).
La partie sur les systèmes de fichiers distribués et sur MapReduce fait réference au livre adopté et au tutoriel sur Hadoop publié par Yahoo!
Les étudiants du cours peuvent bénéficier d'un credit de 100 US$ pour utiliser les outils de Amazon Web Services.
La partie sur l'apprentissage automatique est décrite dans le chapitre additionel du livre disponible en ligne, dans le chapitre 3 de S. Haykin, Neural Networks: A Comprehensive Foundation, Prentice Hall, 1999 (ISBN 0-13-908385-5) et dans deux tutoriels en ligne sur la classification et sur la régression.
La partie sur la réduction dimensionnelle est décrite dans le chapitre additionel du livre disponible en ligne.
Programme
Le programme fait référence aux arguments detaillés dans le calendrier des leçons, qui corresponds au matériel du livre adopté dans les chapitres 1, 2 (jusqu'au paragraphe 2.6.2 inclus), 3 (jusqu'au paragraphe 3.7 inclus), 4 (jusqu'au paragraphe 4.5 inclus), 5 (excluant les paragraphes 5.2.4 et 5.2.5), 6 (jusqu'au paragraphe 6.5.1 inclus), 7 (jusqu'au paragraphe 7.5 inclus), 8 (jusqu'au paragraphe 8.4.6 inclus), 9 (jusqu'au paragraphe 9.4 inclus), 10 (paragraphes 10.1, 10.2, 10.4 et 10.5), 11 (jusqu'au paragraphe 11.3 inclus) et 12 (jusqu'au paragraphe 12.3 inclus), plus le reste des documents indiqués entre le materiel bibliographique.
Calendrier des leçons
Modalités d'examination
L'examination consiste en un test orale, sur rendez-vous.