L’objectif du Master DSMS est de former des experts exerçant dans le domaine des statistiques et des sciences des données.
Cette offre de formation orientée à la fois vers les entreprises et vers la recherche est particulièrement attractive, car elle permet de développer des compétences nécessaires à l’essor des technologies de l’information qui irriguent tous les secteurs de l’économie et qui intéressent les entreprises de toutes tailles.
L’analyse et le traitement de ces données hétérogènes, complexes et massives font de plus en plus appel aux derniers développements des mathématiques appliquées, de l’informatique et de la statistique.
La formation se déroule en 4 semestres et s’appuie sur les enseignements de la Licence. Ces enseignements sont complétés chaque semestre par des enseignements de Sciences Humaines et Sociales (SHS), l’apprentissage par projets et des stages favorisant l’ouverture vers le monde extérieur, et donnant lieu à la délivrance de 30 ECTS par semestre.
L'insertion professionnelle est à 100% après ce Master.
M1 - Semestre 1 | |
---|---|
UE 1 | Modèles linéaires généralisés |
UE 2 | Méthodes chronologiques et Prévisions |
UE 3 | Systèmes d'information opérationnels : bases de données |
UE 4 | Programmation et traitement statistique des données (SAS et R) |
UE 5 | Statistique bayésienne et MCMC |
UE 6 | Enseignement complémentaire |
M1 - Semestre 2 | |
---|---|
UE 1 | Apprentissage Statistique |
UE 2 | Modèles de durées et analyse de Survie |
UE 3 | Systèmes d'information décisionnels et entrepôt de données |
UE 4 | Consultance et projets tuteurés |
UE 5 | Optimisation Statistique et Business Intelligence |
UE 6 | Enseignement complémentaire |
M2 Semestre 1 | |
---|---|
UE 1 | Machine Learning : application aux données complexes |
UE 2 | Machine à Vecteurs Supports (SVM) et Méthodes à Noyaux |
UE 3 | Challenge Kaggle & Arbres de décision et Méthodes ensemblistes |
UE 4 | Deep Learning |
UE 5 | Statistique appliquée : statistique spatiale, robustesse et actuariat |
UE 6 | Enseignement complémentaire |
M2 Semestre 2 | |
---|---|
Stage |
Cours : 21H ; TD : 21H
Objectifs :
Contenu :
Prérequis : Probabilités MTH1303. Statistique mathématique STA1512.
Bibliographie :
Cours : 21H ; TD : 21H
Objectifs :
Contenu :
Prérequis : Statistique inférentielle, régression.
Bibliographie :
Cours : 21H ; TD : 21H
Objectifs :
Contenu :
Prérequis : Bases de données relationnelles et langages associés.
Bibliographie :
Cours : 21H ; TD : 21H
Objectifs :
Contenu :
Prérequis : Bases de données relationnelles et langages associés.
Bibliographie :
Cours : 21H ; TD : 21H
Objectifs :
Contenu :
Prérequis : Statistique inférentielle, régression
Bibliographie :
TD : 18H (anglais) ; TD : 21H (droit, économie et gestion)
Objectifs :
Contenu :
Prérequis : Aucun
Bibliographie :
Cours : 21H ; TD : 21H
Objectifs :
Contenu :
Prérequis : Optimisation, Inférence statistique.
Bibliographie :
Cours : 21H ; TD : 21H
Objectifs :
Contenu :
Prérequis : Analyse, Algèbre, Calcul Matriciel, Optimisation, Calcul des Probabilités, Statistique Inférentielle.
Bibliographie :
Cours : 21H ; TD : 21H
Objectifs :
Contenu :
Prérequis : Connaissance en système d’information et d’un SGBD [INF2105].
Bibliographie :
Projet personnel sous la direction d'un enseignant du master. Durée 20 semaines minimum.
Objectifs :
Contenu :
Prérequis : Licence de mathématiques et premier semestre du M1.
Bibliographie : La bibliographie adaptée au projet sera communiquée par le tuteur.
Cours : 21H ; TD : 21H
Objectifs :
Contenu :
Prérequis : Statistique inférentielle, Méthode du Maximum de Vraisemblance, Programmation R, Programmation SAS.
Bibliographie :
TD : 18H (anglais) ; TD : 24H (techniques d'expression)
Objectifs :
Contenu :
Prérequis : Aucun.
Bibliographie :
Cours : 21H ; TD : 21H
Objectifs :
Contenu :
Prérequis : Statistique mathématique, processus stochastique, Modèle linéaire généralisé, régression linéaire.
Bibliographie :
Cours : 21H ; TD : 21H
Objectifs :
Contenu :
Prérequis : Modèles linéaires généralisé, Analyse discriminante, Survie.
Bibliographie :
Cours : 21H ; TD : 21H
Objectifs : l’objectif de cette UE est d'une part d'initier les étudiants aux problématiques liées à l'apprentissage avec une mise en situation concrète d'analyse de données réelles sous la forme d'un challenge de type Kaggle. D'autre part, une partie de cette UE est consacrée aux arbres de décisions et méthodes ensemblistes dont les objectifs sont les suivants :
Contenu :
Prérequis : Analyse de données, machine learning, Modèle linéaire généralisé.
Bibliographie :
Cours : 21H ; TP : 21H
Objectifs :
Contenu :
Prérequis : Bases de l’apprentissage par ordinateur (classification supervisée et non-supervisée), langage de programmation scientifique (python).
Bibliographie :
Cours : 21H ; TD : 21H
Objectifs :
Contenu :
Prérequis : Notions d'analyse, de calcul des probabilités et de statistique inférentielle.
Bibliographie :
Cours : 21H ; TD : 21H
Objectifs :
Contenu :
Prérequis : Aucun.
Bibliographie :
Stage de 20 semaines à 6 mois, en entreprise ou en laboratoire de recherche.
Objectifs :
Contenu :
Prérequis : Master 1.
Bibliographie :
Cette unité d’enseignement s’intéresse à la représentation et au traitement des données numériques.
Les cours sont associés à des travaux pratiques en Python.
Ce cours constitue une initiation à la veille technologique. L’objectif est de comprendre les enjeux de cet exercice (que ce soit à titre individuel ou au sein d’une entreprise), et d’acquérir les compétences permettant de réaliser une veille ciblée et efficace sur des technologies précises.
Au cours du semestre les étudiants s’exerceront à la veille sur des sujets de leurs choix ou sur des sujets imposés, et restitueront le fruit de cette veille sous la forme de comptes-rendus écrits ou de présentations orales.
Ce cours est une introduction à l’informatique graphique. Il s’agit de comprendre comment dessiner des primitives 2D à l’écran, puis comment modéliser et transformer une scène 3D pour l’afficher sur un écran 2D. Une fois les bases posées, nous verrons comment modéliser des objets plus complexes et comment leur associer des matériaux afin de leur donner un aspect plus ou moins métallique et de les colorer. Ces notions seront mises en pratique avec OpenGL et GLSL.
Ce cours constitue une introduction aux systèmes distribués, vus sous l’angle de la programmation. Après une définition de ce qu’est un système distribué, et la présentation des différents concepts et modèles s’y appliquant, on étudiera plusieurs techniques de bases permettant le développement d’applications en Java : la communication à travers les sockets TCP/UDP, l’appel de méthodes à distance (RMI) et la communication via un intergiciel orienté messages (JMS).
Ce cours concerne l’étude et la pratique de la pile Javascript en développement Web Client et Serveur (full stack) : Javascript, node.js, jQuery, Ajax, HTML 5, express, Pug (Jade), Angular ainsi que les bases de données noSQL MongoDB.
Ce cours aborde la problématique du traitement des masses de données d’un point de vue matériel, algorithmique et programmation. Après une présentation des métriques pertinentes pour les applications Big Data, en terme de quantité de calculs, de mémoire et d’entrées/sortie, plusieurs techniques de parallélisation sont étudiées. Les principaux paradigmes de calcul haute performance sont ensuite comparés à travers leurs mise en œuvre avec les outils de programmation phares du domaine : Hadoop et sa galaxie (HDFS, HBase, Hive, Spark, Pig), Cuda, OpenCL...
Trois supports matériels du parallélisme sont expérimentés en TP : les instructions SSE des micro-processeurs, les cartes graphiques et les clusters de serveurs.
Ce cours est orienté vers les théories et modèles de la science de l’interaction. Il présente également le domaine de l’expérience utilisateur, du design graphique et de l’évaluation ergonomique. Enfin, il développe, dans un contexte historique, les différents paradigmes d’interaction avec une vision prospective sur les évolutions futures.
Cette unité d’enseignement est une introduction aux fondamentaux de l’analyse de données et du machine learning.
Les projets ont pour objectif d’apporter aux étudiants une expérience pratique dans la réalisation d’un projet en groupe (répartition des tâches, gestion des sources) dans une relation maîtrise d’ouvrage (représentée par un chercheur en informatique qui porte le projet) - maîtrise d’oeuvre (représentée par le groupe d’étudiants).
Face à un besoin exprimé par le chercheur, le groupe projet doit, dans un premier temps, proposer une solution et l’organisation à mettre en oeuvre pour la réaliser puis, une fois la proposition validée par le chercheur, la réaliser. Un soin particulier est apporté pour former les étudiants aux meilleures pratiques du monde de l’entreprise en particulier sur la communication maîtrise d’oeuvre - maîtrise d’ouvrage ainsi que sur le respect des engagements pris. Les projets sont en général l’occasion pour les étudiants de réaliser un projet de sa phase d’analyse à sa réception et d’approfondir ou découvrir les méthodes et technologies nécessaires à la réalisation du projet.
L’évaluation est faite sur la qualité des livrables et la gestion du projet.
Ce cours constitue une initiation à l’administration d’un parc d’équipements informatiques. Tout au long du semestre les étudiants sont amenés à assurer collectivement l’administration d’un ensemble de machines dans une salle dédiée.
Prérequis : Notions de bases en système d’exploitation, programmation de scripts shell, bonne compréhension de TCP/IP