Université Bretagne Sud
Master mention Mathématiques Appliquées, Statistique
Parcours DSMS


Parcours DSMS

Data Science et Modélisation Statistique

Présentation

L’objectif du Master DSMS est de former des experts exerçant dans le domaine des statistiques et des sciences des données.

Cette offre de formation orientée à la fois vers les entreprises et vers la recherche est particulièrement attractive, car elle permet de développer des compétences nécessaires à l’essor des technologies de l’information qui irriguent tous les secteurs de l’économie et qui intéressent les entreprises de toutes tailles.

L’analyse et le traitement de ces données hétérogènes, complexes et massives font de plus en plus appel aux derniers développements des mathématiques appliquées, de l’informatique et de la statistique.

La formation se déroule en 4 semestres et s’appuie sur les enseignements de la Licence. Ces enseignements sont complétés chaque semestre par des enseignements de Sciences Humaines et Sociales (SHS), l’apprentissage par projets et des stages favorisant l’ouverture vers le monde extérieur, et donnant lieu à la délivrance de 30 ECTS par semestre.

L'insertion professionnelle est à 100% après ce Master.


Enseignements de 1re année

M1 - Semestre 1
UE 1Modèles linéaires généralisés
UE 2Méthodes chronologiques et Prévisions
UE 3 Systèmes d'information opérationnels : bases de données
UE 4Programmation et traitement statistique des données (SAS et R)
UE 5 Statistique bayésienne et MCMC
UE 6Enseignement complémentaire
M1 - Semestre 2
UE 1 Apprentissage Statistique
UE 2Modèles de durées et analyse de Survie
UE 3Systèmes d'information décisionnels et entrepôt de données
UE 4 Consultance et projets tuteurés
UE 5Optimisation Statistique et Business Intelligence
UE 6Enseignement complémentaire

Enseignements de 2e année

M2 Semestre 1
UE 1Machine Learning : application aux données complexes
UE 2Machine à Vecteurs Supports (SVM) et Méthodes à Noyaux
UE 3 Challenge Kaggle & Arbres de décision et Méthodes ensemblistes
UE 4Deep Learning
UE 5Statistique appliquée : statistique spatiale, robustesse et actuariat
UE 6Enseignement complémentaire
M2 Semestre 2
Stage
×
Modèles linéaires généralisés

Cours : 21H ; TD : 21H


Objectifs :

  • L’objectif de ce cours et de montrer comment on peut généraliser le modèle linéaire dans des situations où il ne donne pas des résultats satisfaisants. Nous analysons en détails la régression logistique, les données de comptage et les tableaux de contingence.

Contenu :

  • Modèle linéaire. Condition d’utilisation. Les types des variables. Exemples.
  • Famille exponentielle et modèles linéaires généralisés. Information de Fisher. Exemples.
  • Estimation dans les modèles linéaires généralisés. Exemples.
  • Inférence statistique pour les modèles linéaires généralisés. EMV et sa loi limite. Déviance. Exemples.
  • Réponses binaires et régression logistique. Exemples.
  • Régression logistique nominale et ordinale. Exemples.
  • Données de comptage et modèle log - linéaire. Exemples.
  • Tables de contingence. Exemples.
  • Réduction de la dimension de l’espace des variables explicatives. Exemples.

Prérequis : Probabilités MTH1303. Statistique mathématique STA1512.

Bibliographie :

  • A. Doobson. An introduction to generalised linear models. Chapman and Hall 2002.
  • P. McCullagh and J.A. Nelder. Generalized linear models. Chapman and Hall 1989.
  • A. Antoniadis, J. Berruyer, R. Carmona. Régression non linéaire et applications. Economica 1992.
  • P.A. Cornillon, E.Matzner-Lober. Régression. Théorie et applications. Springer 2005.

STA2105 M1 - Semestre 1
×
Méthodes chronologiques et Prévisions

Cours : 21H ; TD : 21H


Objectifs :

  • L'analyse des séries temporelles et des processus stochastiques occupe, dans le domaine de la statistique, une place importante. Il est peu de disciplines qui ne soient confrontées à l'étude de phénomènes évoluant dans le temps et qu'on désire décrire, expliquer, contrôler ou prévoir.
  • L'économie, la gestion des entreprises, la météorologie, la démographie, la santé, les sciences expérimentales, constituent autant d'exemples de domaines intéressés par ce type de problèmes.

Contenu :

  • Présentation des séries temporelles
  • Tendance des séries
  • Saisonnalité
  • Périodogramme - Ajustements périodiques
  • Décompositions saisonnières par la méthode des moyennes mobiles ; par régression
  • Le programme Census-X11
  • Le Lissage Exponentiel Simple
  • Modèles autorégressifs
  • Autocorrélogrammes ; Estimation des paramètres du modèle autorégressif
  • Analyse spectrale
  • Modèles exponentiels de Holt-Winter
  • Les modèles de Box & Jenkins
  • La prévision
  • Compléments

Prérequis : Statistique inférentielle, régression.

Bibliographie :

  • Bourbonnais, R. Terraza, M. (2004), Analyse des séries Temporelles, Dunod, Paris.
  • Gouriéroux, C. Monfort, A. (1995), Séries Temporelles et Modèles Dynamiques.
  • Tenenhaus, M. (2007), Statistique ; Méthodes pour décrire, expliquer et prévoir, Dunod, Paris.

STA2120 M1 - Semestre 1
×
Systèmes d'information opérationnels : bases de données

Cours : 21H ; TD : 21H


Objectifs :

  • Dans le cadre de la conception de systèmes d’information, l’étudiant sera capable d’intervenir sur les différentes étapes du projet, depuis la re-documentation du cahier des charges jusqu’à la mise en production des bases de données, quelles qu’elles soient.

Contenu :

  • Modèles conceptuels des systèmes d’information
    • Merise
    • UML (cas d’utilisation, diagramme de classes et des séquences, diagramme d’activité, profiles)
    • modèle logique, modèle physique
  • Modèle logique, modèle physique
  • Programmation avancée des bases de données
    • PL/SQL ou Transact SQL
  • Performance d’accès aux BD
    • indexation
    • optimisation de requêtes
    • tuning de bases de données
    • répartition

Prérequis : Bases de données relationnelles et langages associés.

Bibliographie :

  • Merise et UML pour la modélisation des systèmes d’information, Joseph Gabay. Dunod, 2004
  • ORACLE 10g, guide du DBA, Kevin Loney, Bob Bryla. Oracle Press. 2005.
  • Oracle Performance Tuning for 10g, Gavin Powell. Elsevier, 2005
  • Oracle 10g, optimisation d’une base de données, Claire Noiraud, ENI, 2006
  • UML2 pour l’analyse d’un système d’information, Chantal Morley, Jean Hugues, Bernard Leblanc. Dunod, 2006.
  • Microsoft SQL Server 2005, guide de l’administrateur, William Stanck, Microsoft Press, 2006
  • SQL Server 2008, SQL, Transact SQL, Jérôme Gabillaud, ENI, 2008

INF1612 M1 - Semestre 1
×
Programmation et traitement statistique des données (R et SAS)

Cours : 21H ; TD : 21H


Objectifs :

  • L’objectif de ce cours est de permettre aux étudiants de maîtriser les concepts de programmation R, SAS et Python tout en approfondissant un ensemble de techniques statistiques.

Contenu :

  • Introduction aux logiciels R, Python et SAS
  • Programmation statistique sous R, Python et SAS
  • La proc SQL (SAS)
  • Le langage MACRO (SAS)
  • SAS IML Studio (SAS)
  • Simulation, modélisation et analyse de données sous R et SAS
  • Exemples d’applications sur des données réelles (R et SAS)

Prérequis : Bases de données relationnelles et langages associés.

Bibliographie :

  • H. Kontchou-Kouomegni, O. Decourt. SAS : Maîtriser SAS Base et SAS Macro, Dunod, 2006
  • S. Ringuedé. SAS : Introduction au décisionnel - Méthode et maîtrise du langage, Pearson Education, 2008
  • E. Duguet. Introduction à SAS, Economica, 2004
  • F. Husson, S. Lê, J. Pagès (2009) Analyse de données avec R, Presse Universitaires de Rennes
  • G. Sawitzki (2009) Computational Statistics: an introduction to R ; Chapman & Hall

STA2122 M1 - Semestre 1
×
Statistique bayésienne et MCMC

Cours : 21H ; TD : 21H


Objectifs :

  • Découvrir les bases de l'approche bayésienne des problèmes statistiques et s'initier aux outils de l'analyse bayésienne.

Contenu :

  • Introduction : Généralités : Fréquentistes / Bayésiens
  • Eléments de Théorie de la Décision - Modèle de décision - Règles de décision - Relation de préférence - Fonction de coût - Fonction de risque - Optimalité : minimaxité et admissibilité.
  • Analyse Bayésienne - Lois a priori - Lois conjuguées - Lois non informatives - Estimateur de Bayes - Tests et régions de confiance.

Prérequis : Statistique inférentielle, régression

Bibliographie :

  • Lehmann E. L., Theory of Point Estimation, Wiley, 1983.
  • Robert C., L'analyse statistique bayésienne, Economica, 1992.

STA2121 M1 - Semestre 1
×
Enseignement complémentaire

TD : 18H (anglais) ; TD : 21H (droit, économie et gestion)


Objectifs :

  • Anglais
  • Droit
    • Droit du travail : Expliquer la situation du salarié dans l'entreprise et celle de l'employeur en apportant le cadre juridique de la relation : droits et obligations des uns et des autres, la représentation des salariés dans l'entreprise - le déroulement du contrat de travail.
    • Droit de l'information : Donner les bases du droit de l'information et des créations informatiques.

Contenu :

  • Anglais
  • Droit
    • Droit du travail
      • L'environnement juridique du droit du travail (sources et structures)
      • Le contrat de travail (les opérations d'embauche, les caractéristiques spécifiques, le déroulement du contrat - durée, rémunération)
      • La rupture du contrat de travail
      • La représentation des salariés dans l'entreprise
    • Droit de l'information
      • Créations informatiques et acteurs
      • Montages contractuels et responsabilités
      • Montages contractuels spécifiques
      • Les licences logicielles
      • Création administration de sites web

    Prérequis : Aucun

    Bibliographie :

    • Code du travail.

SUCG401 M1 - Semestre 1
×
Modèles de durées et analyse de Survie

Cours : 21H ; TD : 21H


Objectifs :

  • Le cadre de l’épidémiologie est succinctement abordé d’un point de vue analytique dans des populations exposées à certains types de maladie sur des zones géographiques.
  • La modélisation intervient ensuite plus spécifiquement sur la variable durée de vie. Les modèles permettent à la fois de comparer des comportements avec ou sans facteurs d’exposition et de faire des prédictions en termes de probabilités de survie.

Contenu :

  • Eléments d’épidémiologie
  • Eléments d’épidémiologie
  • Les concepts de base sur les durées de vie
  • Les modèles de base : exponentiel, Weibull, le modèles de valeurs extrêmes, le model Gamma et log-Gamma
  • Modèles de mélange
  • La censure et les modèles statistiques. Types de censure. Censure aléatoire. L’inférence statistique pour les modèles de censure
  • Méthodes non paramétriques
  • Comparaisons de groupes de Survie
  • Modèles de Survie paramétriques
  • Le modèle de Cox
  • Adéquation des modèles de Survie
  • Généralisation

Prérequis : Optimisation, Inférence statistique.

Bibliographie :

  • Hill C., Com Nougé C., Kramar A., Moreau T. et al., Analyse Statistique des Données de Survie, Médecine-Sciences Flammarion, 1996.
  • Klein J. & Moeschberger M., Survival Analysis, Springer, 2003.

STA2123 M1 - Semestre 2
×
Apprentissage Statistique

Cours : 21H ; TD : 21H


Objectifs :

  • explorer un ensemble de stratégies et méthodes statistiques pour l'analyse d'un jeu de données
  • identifier et appliquer des méthodes adaptées et pertinentes selon la nature des données
  • apprendre des stratégies pour constuire des modèles et les évaluer
  • se familiariser avec quelques outils pour l'apprentissage disponibles dans le logiciel R

Contenu :

  • Principes de l'Apprentissage Statistique
    • Modèles, Coût, Risque.
    • Méthodes d'échantillonnage, de validation, d'évaluation (erreurs).
  • PRégression linéaire
    • Régression multivariée : généralités
    • Sélection de variables
    • Régression pénalisée (ridge, lasso, elasticnet)
  • Classification
    • Régression logistique
    • Analyse discriminante (ADL-ADQ)
    • K-plus-proches-voisins (KNN)
  • Eléments de régression non-linéaire
    • Régression polynomiale
    • Régression splines
    • Régression non paramètrique

Prérequis : Analyse, Algèbre, Calcul Matriciel, Optimisation, Calcul des Probabilités, Statistique Inférentielle.

Bibliographie :

  • An Introduction to Statistical Learning with Applications in R, James, G., Witten, E., Hastie, T. and Tibshiriani, R., Ed: Springer, Second Edition, 2021.
  • Machine learning avec R, Burger, S., Ed : O'Reilly, 2018.
  • Introduction au Machine Learning, Azencott, C., Ed : Dunod, 2018.

STA2215 M1 - Semestre 2
×
Systèmes d'information décisionnels et entrepôt de données

Cours : 21H ; TD : 21H


Objectifs :

  • En informatique décisionnelle, on est amené à traiter de grands ensembles de données, provenant de sources hétérogènes diffuses internes ou externes à l’entreprise. Ces données sont stockées dans des entrepôts, organisées par ‘métiers’ et décrites suivant des dimensions ou axes d’analyse. Cet enseignement a pour but d’apporter les éléments pour :
    • connaître les principaux composants d’un système décisionnel
    • savoir concevoir et modéliser un entrepôt de données
    • appréhender les différents outils de l’informatique décisionnelle

Contenu :

  • Architecture et composants d’un système décisionnel
  • Modélisation dimensionnelle des données : faits, dimensions, schémas en étoile et extensions
  • Administration des données de l’entrepôt
    • Alimentation de l’entrepôt : outils ETL
    • Qualité des données
    • Métadonnées et référentiel de données
  • Organisation et stockage des données dans l’entrepôt
    • Socle, historisation, agrégats, magasins de données (datamarts)
    • Optimisation : gestion des agrégats, parallélisme, fragmentation
    • Structures multidimensionnelles et OLAP

Prérequis : Connaissance en système d’information et d’un SGBD [INF2105].

Bibliographie :

  • Le système d’information décisionnel. Pascal Muckenhirn. Hermès – Lavoisier, 2003
  • Building the data warehouse, William H. Inmon, Wiley Editions, 2005
  • Le data warehouse, guide de conduite de projet, Ralph Kimball, Laura Reeves, Margy Ross, Warren Thornthwaite, Eyrolles, 2005
  • Oracle Data Warehouse Tuning for 10g, Gavin Powell. Elsevier, 2005
  • Business Intelligence avec SQL Server 2005, Bertrand Burquir, Dunod, 2007

INF2204 M1 - Semestre 2
×
Consultance et projets tuteurés

Projet personnel sous la direction d'un enseignant du master. Durée 20 semaines minimum.


Objectifs :

  • Le projet tuteuré consiste en un travail scientifique personnel à effectuer sous la responsabilité d'un enseignant-tuteur qui a proposé le sujet choisi par l'étudiant.
  • Le sujet et les modalités d'exécution du projet peuvent être variables; ils sont définis par l'enseignant-tuteur en accord avec l'étudiant et le directeur des études en prenant notamment en compte les souhaits de poursuite d'études de l'étudiant ainsi que son projet professionnel.

Contenu :

  • Face à un besoin exprimé par l'entreprise, le groupe projet doit, dans un premier temps, proposer une solution et l'organisation à mettre en oeuvre pour la réaliser puis, une fois la proposition validée par l'entreprise, la réaliser. Un soin particulier est apporté pour former les étudiants aux meilleures pratiques du monde de l'entreprise en particulier sur la communication maîtrise d'oeuvre - maîtrise d'ouvrage ainsi que sur le respect des engagements pris. Les projets sont en général l'occasion pour les étudiants de réaliser un projet de sa phase d'analyse à sa réception d'approfondir ou découvrir les méthodes et technologies nécessaires à la réalisation du projet. L'évaluation est faite sur la qualité des livrables et la gestion du projet.
  • Au début du Semestre 2, les étudiants doivent contacter leur directeur des études ou un enseignant du master afin de choisir leur sujet. Des réunions régulières entre l'étudiant et son tuteur permettent la bonne avancée du projet. A la fin du Semestre 2, les étudiants rendent un rapport scientifique et soutiennent publiquement leur travail.

Prérequis : Licence de mathématiques et premier semestre du M1.

Bibliographie : La bibliographie adaptée au projet sera communiquée par le tuteur.

MIS2251 M1 - Semestre 2
×
Optimisation Statistique et Business Intelligence

Cours : 21H ; TD : 21H


Objectifs :

  • Acquérir une vision d’ensemble des méthodes d’optimisation différentielle utilisées en Statistique et les mettre en oeuvres sur des exemples concrets à l’aide de R, SAS et Python.
  • Avoir un premier aperçu des méthodes d’optimisation combinatoire et de leurs applications en Business Intelligence.

Contenu :

  • Introduction générale
  • Le problème d'optimisation
  • Quelques exemples statistiques
  • Principe des algorithmes de minimisation
  • Définition de la Business Intelligence
  • Modélisation en Business Intelligence
  • Optimisation en Business Intelligence

Prérequis : Statistique inférentielle, Méthode du Maximum de Vraisemblance, Programmation R, Programmation SAS.

Bibliographie :

  • Optimization Techniques in Statistics. J. Rustagi, Academic Press 1994.
  • Introduction to Optimization Methods and Their Application in Statistics. B. S. Everitt, Chapman and Hall 1987.
  • Introduction à l’Analyse Matricielle et à l’Optimisation. P. G. Ciarlet, Dunod 1982.
  • Fundamentals of Business Intelligence, W. Grossmann, S. Rinder-Ma. Springer 2015.

STA2124 M1 - Semestre 2
×
Enseignement complémentaire

TD : 18H (anglais) ; TD : 24H (techniques d'expression)


Objectifs :

  • Anglais.
  • Techniques d'expression
    • Connaître les entreprises qui emploient dans les disciplines des étudiants (mathématique, informatique, statistique)
    • Cibler un projet professionnel et mettre au point des stratégies de recherche d'emploi: CV, lettre, entretiens, questionnaires
    • Aborder l'actualité et des questions pratiques pour les jeunes diplômés en milieu professionnel

    Contenu :

    • Anglais
    • Techniques d'expression
      • Présentation des méthodes de recrutement, du marché du travail, de la recherche d'emploi, des ressources
      • Ateliers de ré écriture de CV et lettres de motivation
      • Exposés étudiants sur des thèmes d'actualité en RH (harcèlement, gestion du stress, donner sa démission...)
      • Simulation d'entretiens d'embauche

      Prérequis : Aucun.

      Bibliographie :

      • Présentation des méthodes de recrutement, du marché du travail, de la recherche d'emploi, des ressources
      • Ateliers de ré écriture de CV et lettres de motivation
      • Exposés étudiants sur des thèmes d'actualité en RH (harcèlement, gestion du stress, donner sa démission...)
      • Simulation d'entretiens d'embauche

SUCG402 M1 - Semestre 2
×
Machine Learning : application aux données complexes

Cours : 21H ; TD : 21H


Objectifs :

  • L’objectif de cette UE est de faire découvrir aux étudiants les problèmes posés par l’analyse de données complexes.Des stratégies de modélisation sont introduites.

Contenu :

  • Données standard et données complexes
  • Prise en compte de la structure des données
  • Couplage Modèle-Données
  • Régression fonctionnelle (estimateur à noyau, régression spline, polynômes locaux)
  • Données manquantes
  • Analyse de données simulées et données réelles

Prérequis : Statistique mathématique, processus stochastique, Modèle linéaire généralisé, régression linéaire.

Bibliographie :

  • Hastie T., Tibshirani R. and Wainwright M., Statistical Learning with Sparsity: The Lasso and Generalizations, Chapman & Hall, 2015.
  • Kolaczyk E.D., Statistical Analysis of Network Data: Methods and Models, Springer, 2009.
  • Little J.A. and Rubin D.B., Statistical Analysis with Missing Data, Wiley, 2002.
  • Van Buuren S., Flexible Imputation of Missing Data, Chapman & Hall, 2012.

STA2326 M2 - Semestre 1
×
Machine à Vecteurs Supports (SVM) et Méthodes à Noyaux

Cours : 21H ; TD : 21H


Objectifs :

  • En statistique la reconnaissance des formes a pour but de détecter et de caractériser les relations entre les données.
  • Les méthodes à noyaux qui sont apparues sous la forme de «machine à vecteur support» (SVM) pour les problèmes de classification, se sont rapidement étendues à d’autres problèmes de la statistique.
  • Il s’agit d’un progrès important dans l’étude des problèmes liés à tous les types de traitement de données, en particulier à des données hautement mutivariées, géoréférencées et souvent longitudinales.
  • L'objectif de ce cours est de proposer des outils de modélisation pour ces données qui permettront de réaliser des simulations et/ou des prévisions.

Contenu :

  • Rappel en optimisation convexe sous contraintes. Machine à vecteur support pour la classification : données séparables et non séparables
  • L’astuce du noyaux. Machine à vecteur support dans l’espace des traits
  • Machine à vecteur support pour la régression
  • Analyse des formes par décompositions propres. Décomposition en valeurs singulières (SVD). Méthode à noyaux pour la régression linéaire et la régression PLS. Analyse discriminante de Fisher, ACP avec la méthode à noyaux
  • Quelques problèmes de données spatiales
  • Données référencées ponctuellement. Données référencées par des régions
  • Modèles hiérarchiques pour les données spatiales univariées. Données spatiales multivariées
  • Modèles spatiaux pour la survie

Prérequis : Modèles linéaires généralisé, Analyse discriminante, Survie.

Bibliographie :

  • Shawe Taylor & N. Cristianini, (2004), Kernel methods for pattern analysis, Cambridge University Press.
  • R. Duda, P. Hart & D. Stork, (2001), Pattern classification, Wiley.S. Banerjee, A. Gelfand, B.P. Carlin, Hierarchical Modeling and Analysis for Spatial Data (Chapman & Hall/CRC Monographs on Statistics & Applied Probability).
  • L. Rabiner. A tutorial on hidden markov model and selected applications in speech. Proccedings of the IEEE, 77(2):257– 285, 1989.

STA2321 M2 - Semestre 1
×
Challenge Kaggle & Arbres de décision et Méthodes ensemblistes

Cours : 21H ; TD : 21H


Objectifs : l’objectif de cette UE est d'une part d'initier les étudiants aux problématiques liées à l'apprentissage avec une mise en situation concrète d'analyse de données réelles sous la forme d'un challenge de type Kaggle. D'autre part, une partie de cette UE est consacrée aux arbres de décisions et méthodes ensemblistes dont les objectifs sont les suivants :

  • Savoir identifier et formuler un problème en apprentissage statistique supervisé.
  • Connaitre et comprendre les algorithmes d’arbres de décision (plus précisément l’algorithme CART), le bagging, l'algorithme des forêts aléatoires et le boosting : motivations, principes et principales propriétés de chaque méthode.
  • Être capable d’appliquer ces algorithmes à un jeu de données et savoir interpréter les résultats.

Contenu :

  • RApplication à l'analyse de données réelles
    • Analyse de données
    • Nettoyage des données
    • Sélection des features et des modèles
  • RApplication à l'analyse de données réelles
    • Rappels en apprentissage statistique supervisé
    • Arbres de décision
    • Méthodes d’ensemble – bagging et forêts aléatoires
    • Méthodes d’ensemble – boosting

Prérequis : Analyse de données, machine learning, Modèle linéaire généralisé.

Bibliographie :

  • Breiman, L., Friedman, J., Stone, C. J., and Olshen, R. A. (1984). Classification and regression trees, CRC press, 1984.
  • Breiman, L., Bagging predictors. Machine learning, 24(2):123–140, 1996.
  • Breiman, L., Random forests. Machine learning, 45(1):5–32, 2001.
  • Bruce, P., & Bruce, A. (2017). Practical Statistics for Data Scientists: 50 Essential Concepts (pp. 1-562). O'Reilly Media.
  • Freund, Y., Schapire, R. E., et al., Experiments with a new boosting algorithm, ICML, 96:148-156, 1996.
  • Géron, A. (2019). Hands-on Machine Learning with Scikit-Learn, Keras & TensorFlow (2nd ed., pp. 1-510). O'Reilly.
  • Hastie, T., Tibshirani, R., and Friedman, J., The elements of statistical learning: data mining, inference, and prediction, Springer Science & Business Media., 2009.
  • James, G., Witten, D., Hastie, T., and Tibshirani, R., An introduction to statistical learning, Springer, 2013.
  • McKinney, W. (2012). Python for Data Analysis (1st ed., pp. 1-470). O'Reilly Media.

STA2329 M2 - Semestre 1
×
Deep Learning

Cours : 21H ; TP : 21H


Objectifs :

  • Assimiler et appliquer les fondamentaux associés aux méthodes d’apprentissage profond, et application à des problèmes de classification sur des bases de données de taille importante.
  • L’accent est mis à la fois sur les aspects théoriques (modèles, optimisation) et pratiques (développement d’architectures de réseaux de neurones en PyTorch, issu de Python).

Contenu :

  • Bref historique sur les réseaux de neurones (McCuloch’s neurons, Hebb, Hopfield, perceptrons, etc.)
  • Principes fondamentaux de l’apprentissage profond (minimisation du risque empirique, fonctions de cout et d’activation, rétro-propagation, algorithmes du gradient stochastique, etc.)
  • Stratégies pour l’optimisation de modèles (dimensionnement des architectures, validation croisée)
  • Autoencoders
  • Applications en vision par ordinateur : réseaux convolutionnels
  • Applications en traitement du langage naturel
  • Ouvertures sur les architectures récentes (réseaux récurrents, modèles attentionnels type 'Transformers', etc.)

Prérequis : Bases de l’apprentissage par ordinateur (classification supervisée et non-supervisée), langage de programmation scientifique (python).

Bibliographie :

MIS2320 M2 - Semestre 1
×
Statistique appliquée : statistique spatiale, robustesse et actuariat

Cours : 21H ; TD : 21H


Objectifs :

  • Statistique spatiale :
    • introduire les bases de la géostatistique,
    • modéliser et simuler des processus spatiaux.
  • Statistique robuste :
    • introduction à la notion de robustesse en statistique,
    • présentation de méthodes robustes en estimation et modélisation.
  • Actuariat :
    • découvrir les principes de l'assurance,
    • s'initier aux calculs actuariels.

Contenu :

  • Statistique spatiale :
    • Description des processus stochastiques
    • Modélisation par processus gaussien
    • Simulations et applications à des données spatiales
  • Statistique robuste :
    • Quelques définitions
    • Exemples d'estimateur robuste
    • Régression quantile
    • Simulations et applications à des données réelles
  • Actuariat :
    • Principe de l'Assurance
    • Théorie du Risque : risquophile/risquophobe
    • Eléments de Mathématiques Financières
    • Assurance-vie : types de contrat, Tables de Mortalité et Calcul de Primes

Prérequis : Notions d'analyse, de calcul des probabilités et de statistique inférentielle.

Bibliographie :

  • Bower, N.L. et al. Actuarial Mathematics. 1997. The Society of Actuaries, 2nd Edition.
  • Durrieu G. and Briollais L. (2009). Sequential determination of sample size for robust linear regression: application to microarray experimental designs, Journal of the American Statistical Association, 104(486), 650-660.
  • Petauton, P. Théorie et Partiquede l'assurance vie. 2004. Dunod, 3ème Edition.
  • Rousseeuw P. and Leroy A. Robust Regression and Outlier Detection. Wiley Series in Probability and Mathematical Statistics. Wiley, 1987.

STA2325 M2 - Semestre 1
×
Enseignement complémentaire

Cours : 21H ; TD : 21H


Objectifs :

  • Anglais (COM2306T) :
  • Cycle de conférences et mini-cours (CON2302T)
    • Le premier objectif est qu'à travers des présentations faites par des conférenciers - anciens élèves, chercheurs spécialistes des applications des statistiques, acteurs du monde de l'entreprise - l'étudiant découvre comment les statistiques enseignées dans les autres cours du Master interviennent dans des applications concrètes.
    • L'autre aspect important est de faire connaître aux étudiants les différents métiers des statistiques, et les poursuites d'études possibles (thèse et notamment dispositif CIFRE, ingénieur en mathématique, chercheur, etc.) ainsi que de l'aider dans sa recherche de stage, puis d'emploi à l'issu du Master.

Contenu :

  • Une dizaine de conférences de deux heures. Intervenants prévus chaque année.

Prérequis : Aucun.

Bibliographie :

  • Aucune spécifique.

CON2302T-COM2306T M2 - Semestre 1
×
Stage professionnel

Stage de 20 semaines à 6 mois, en entreprise ou en laboratoire de recherche.


Objectifs :

  • Le stage en entreprise est l'occasion de se confronter à la vie professionnelle et de mettre en pratiques les connaissances et savoir-faire théoriques acquis.
  • Le stage en laboratoire est l'opportunité d'approfondir un sujet actuel de recherche.

Contenu :

  • Le stage se déroule entre mi-janvier et le mois d'août et doit avoir une durée effective minimum de 20 semaines.
  • Chaque stage est suivi par une tuteur enseignant qui effectue si possible une visite en cours de stage.
  • Il est évalué sur plusieurs délivrables, une proposition de projet, due un mois après le début du stage, un pré-rapport à mi-stage et un rapport final, et une soutenance orale publique.
  • La recherche des stages est sous la responsabilité des étudiants ; une commission du Master évalue l’intérêt pédagogique des stages proposés avant leur affectation définitive.

Prérequis : Master 1.

Bibliographie :

  • Aucune spécifique.

STA2324 M2 - Semestre 1
×
Traitement numérique des données

Cette unité d’enseignement s’intéresse à la représentation et au traitement des données numériques.

  • Rappels : algèbre linéaire, programmation scientifique en Python
  • Théorie de l’échantillonnage
  • Analyse de Fourier : séries de Fourier, transformée de Fourier
  • Filtrage
  • Exploration interactive de données
  • Méthodes d’intégration, différentielles
  • Régression

Les cours sont associés à des travaux pratiques en Python.

INF2166/INF2167 M1 - Semestre 1
×
Veille technologique

Ce cours constitue une initiation à la veille technologique. L’objectif est de comprendre les enjeux de cet exercice (que ce soit à titre individuel ou au sein d’une entreprise), et d’acquérir les compétences permettant de réaliser une veille ciblée et efficace sur des technologies précises.

Au cours du semestre les étudiants s’exerceront à la veille sur des sujets de leurs choix ou sur des sujets imposés, et restitueront le fruit de cette veille sous la forme de comptes-rendus écrits ou de présentations orales.

INF2164 M1 - Semestre 1
×
Introduction à l’informatique graphique

Ce cours est une introduction à l’informatique graphique. Il s’agit de comprendre comment dessiner des primitives 2D à l’écran, puis comment modéliser et transformer une scène 3D pour l’afficher sur un écran 2D. Une fois les bases posées, nous verrons comment modéliser des objets plus complexes et comment leur associer des matériaux afin de leur donner un aspect plus ou moins métallique et de les colorer. Ces notions seront mises en pratique avec OpenGL et GLSL.

  • Dessin de primitives 2D: lignes, polygones, caractères
  • Transformations géométriques
  • Voir en 3D: projection
  • Modèles de surfaces: polygonales, paramétriques…
  • Rendu: éclairage et lissage
  • Couleurs
  • OpenGL2/3
  • GLSL
INF2110 M1 - Semestre 1
×
Introduction aux systèmes distribués

Ce cours constitue une introduction aux systèmes distribués, vus sous l’angle de la programmation. Après une définition de ce qu’est un système distribué, et la présentation des différents concepts et modèles s’y appliquant, on étudiera plusieurs techniques de bases permettant le développement d’applications en Java : la communication à travers les sockets TCP/UDP, l’appel de méthodes à distance (RMI) et la communication via un intergiciel orienté messages (JMS).

INF2165 M1 - Semestre 1
×
Programmation Web

Ce cours concerne l’étude et la pratique de la pile Javascript en développement Web Client et Serveur (full stack) : Javascript, node.js, jQuery, Ajax, HTML 5, express, Pug (Jade), Angular ainsi que les bases de données noSQL MongoDB.

INF2245 M1 - Semestre 2
×
Calcul haute performance pour le Big Data

Ce cours aborde la problématique du traitement des masses de données d’un point de vue matériel, algorithmique et programmation. Après une présentation des métriques pertinentes pour les applications Big Data, en terme de quantité de calculs, de mémoire et d’entrées/sortie, plusieurs techniques de parallélisation sont étudiées. Les principaux paradigmes de calcul haute performance sont ensuite comparés à travers leurs mise en œuvre avec les outils de programmation phares du domaine : Hadoop et sa galaxie (HDFS, HBase, Hive, Spark, Pig), Cuda, OpenCL...

Trois supports matériels du parallélisme sont expérimentés en TP : les instructions SSE des micro-processeurs, les cartes graphiques et les clusters de serveurs.

INF2245 M1 - Semestre 2
×
Interaction avancée

Ce cours est orienté vers les théories et modèles de la science de l’interaction. Il présente également le domaine de l’expérience utilisateur, du design graphique et de l’évaluation ergonomique. Enfin, il développe, dans un contexte historique, les différents paradigmes d’interaction avec une vision prospective sur les évolutions futures.

  • Problématique de l’IHM
  • Théories et modèles de l’interaction
  • Expérience utilisateur
  • Ergonomie des interfaces graphiques
  • Évaluation des interfaces
  • Éléments de design graphique
  • Perspectives en IHM

INF2246 M1 - Semestre 2
×
Algorithmique des données

Cette unité d’enseignement est une introduction aux fondamentaux de l’analyse de données et du machine learning.

  • Introduction générale (pourquoi une science des données ?)
  • Rappel bases en algèbre linéaire + programmation python scientifique
  • Analyse exploratoire de données : ACP, réduction de dimensions supervisée (LDA)
  • Apprentissage de modèles: principes de l’Empirical Risk Minimization
  • Régression
    • cas linéaire, polynomial
    • logistique
  • Classification
    • non-supervisée (méthode des k-moyennes)
    • supervisée : classif linéaire, Naive Bayes, plus proche voisin
    • validation des paramètres / des résultats
    • ouverture vers d’autres schémas de classification
  • Analyse de graphes et des réseaux sociaux

INF2249 M1 - Semestre 2
×
Projet tutoré

Les projets ont pour objectif d’apporter aux étudiants une expérience pratique dans la réalisation d’un projet en groupe (répartition des tâches, gestion des sources) dans une relation maîtrise d’ouvrage (représentée par un chercheur en informatique qui porte le projet) - maîtrise d’oeuvre (représentée par le groupe d’étudiants).

Face à un besoin exprimé par le chercheur, le groupe projet doit, dans un premier temps, proposer une solution et l’organisation à mettre en oeuvre pour la réaliser puis, une fois la proposition validée par le chercheur, la réaliser. Un soin particulier est apporté pour former les étudiants aux meilleures pratiques du monde de l’entreprise en particulier sur la communication maîtrise d’oeuvre - maîtrise d’ouvrage ainsi que sur le respect des engagements pris. Les projets sont en général l’occasion pour les étudiants de réaliser un projet de sa phase d’analyse à sa réception et d’approfondir ou découvrir les méthodes et technologies nécessaires à la réalisation du projet.

L’évaluation est faite sur la qualité des livrables et la gestion du projet.

INF2212 M1 - Semestre 2
×
Administration sytème réseau

Ce cours constitue une initiation à l’administration d’un parc d’équipements informatiques. Tout au long du semestre les étudiants sont amenés à assurer collectivement l’administration d’un ensemble de machines dans une salle dédiée.

  • Introduction à l’administration système/réseau
  • Installation initiale et maintenance (distribution des systèmes, gestion de paquets logiciels...)
  • Mise en réseau (adressage, routage, DNS...)
  • Gestion des comptes d’utilisateurs (comptes locaux, comptes déportés, authentification...)
  • Gestion des services et partage de ressources (impression, archivage...)
  • Sécurisation du parc (définitions, enjeux, classification des risques, systèmes pare-feu...)
  • Virtualisation

Prérequis : Notions de bases en système d’exploitation, programmation de scripts shell, bonne compréhension de TCP/IP

INF2211 M1 - Semestre 2

Contact administratif
Sandrine Steinmann

Université Bretagne Sud
UFR SSI, Campus de Tohannic
BP 573, 56017 Vannes Cedex
 02 97 01 72 37
Sandrine.Steinmann@univ-ubs.fr
Responsable de la mention
Gilles Durrieu et François Septier

Directeurs des études
M1 DSMS : Ion Grama
M2 DSMS: François Septier
M1 IM : Marc Sevaux
M2 IM: Jacques Froment
Université Bretagne Sud
U.F.R. Sciences et Sciences de lʼIngénieur
Département MIS
Copyright @ 2021-2022 UBS
Dernière mise à jour le 25 juillet 2022