Enseignement

Option Géostatistique et Probabilités appliquées

L’option Géostatistique et Probabilités appliquées s’adresse aux étudiants de 3e année de l’école des Mines de Paris désireux de compléter leurs compétences en sciences des données acquises dans les différents enseignements de l’école.

La Géostatistique a pour objet l’étude quantitative de tout phénomène, naturel ou humain, qui présente une organisation dans l’espace et/ou le temps : c’est donc une indispensable extension des méthodes statistiques « classiques » lorsque les variables d’intérêt présentent une structuration spatiale et/ou temporelle. La connaissance de ses modèles et méthodes est essentielle en particulier pour appréhender les phénomènes environnementaux liés à la transition écologique.

Dans des domaines d’application variés (environnement ; climatologie ; ressources énergétiques, agricoles ou minérales ; assurances ; etc…), l’option choisit de donner la priorité aux méthodes et de mettre ainsi en évidence ce qui est commun au traitement de toutes les données spatialisées (géoréférencées), au-delà des disparités de langage inhérentes à la variété des champs d’applications. L’option est ainsi en priorité un lieu de rencontre et de dialogue privilégié entre étudiants aux goûts et aux domaines d’intérêt multiples ; c’est aussi fondamentalement l’occasion de passer à la pratique sur des jeux de données réelles, et de mesurer la distance qui sépare parfois une théorie bien maîtrisée d’une mise en application efficace.

Contenu et Activités

L’option se déroule sur deux périodes de 4 et 2 semaines. Elle alterne cours magistraux et TP d’application. Chaque thématique est approfondie par la lecture et la restitution en binôme d’un article de recherche associé. Des séminaires réguliers présentent des utilisations pratiques des méthodes enseignées dans des contextes industriels ou académiques. Une semaine de visites techniques en Provence est également prévue à la rencontre de différents acteurs des transitions écologique, énergétique et numérique (INRAe, LSBB, CEA Cadarache, laboratoire OIE de Mines Paris).

Certains cours sont ouverts aux personnes extérieures (étudiants en thèse, post-doctorants, …) souhaitant se former sur ces thématiques. Nous contacter pour plus d’informations.

L’enseignement est essentiellement divisé en quatre blocs détaillés ci-dessous :

  • Le premier bloc aborde en premier lieu les problématiques d’analyse exploratoire. Un cours d’introduction à l’apprentissage statistique est également dispensé.
  • Le second bloc permet aux élèves de se familiariser avec les outils et techniques géostatistiques de base (fonctions aléatoires, analyse structurale, estimation de paramètres par méthode des moments et maximum de vraisemblance, krigeage, en contexte uni et multi-varié, approche bayésienne).
  • Le troisième bloc est dédié à l’étude de techniques de simulations (conditionnelles) de modèles géostatistiques, qui permettent de caractériser les incertitudes dans de nombreux problèmes pratiques. Certains modèles de géométrie stochastique sont également abordés (processus ponctuels, droites poissonniennes, modèle booléen), ainsi que les méthodes de deep learning pour entraîner des modèles génératifs.
  • Le quatrième bloc porte sur des méthodes plus avancées : la modélisation spatio-temporelle, l’assimilation de données et la construction de modèles de fonctions aléatoires par équation aux dérivées partielles stochastiques.

Semaines ATHENS "Geostatistics et Extremes"

Le programme ATHENS vise à réaliser des cours intensifs de spécialisation, donnés dans chaque institution membre pendant une ou deux périodes définies (« Sessions ») de l’année académique (novembre et mars), permettant aux étudiants d’assister à l’un des cours offerts par les universités du réseau pendant 7 jours. Cette expérience, dans de nombreux cas, donne aux étudiants l’envie d’effectuer des études de plus longue durée (niveaux MSc et PhD) dans une institution différente de leur institution d’origine et facilite ainsi les échanges entre les étudiants des principales institutions technologiques européennes.

Semaine ATHENS Geostatistics (MP16)

En sciences de la terre, le développement des ressources naturelles et les études environnementales, les modèles probabilistes sont utilisés pour la prédiction et la quantification des incertitudes dues à la rareté de l’échantillonnage, aux erreurs de mesure ou aux observations indirectes du phénomène étudié. Comme les observations ne peuvent pas être considérées comme indépendantes dans ce contexte, les approches statistiques ou d’apprentissage automatique standard ne sont pas bien adaptées et manquent d’interprétabilité.

Ce cours vise à donner les éléments de base pour la modélisation mathématique des phénomènes régionalisés par des méthodes probabilistes. Après une introduction générale et une prise en main du logiciel R (www.r-project.org), ce cours d’une semaine couvre l’introduction aux modèles de fonctions aléatoires, leur inférence et les méthodes de prédiction associées, à savoir le Krigeage et les simulations conditionnelles.

Semaine ATHENS Extremes (MP15)

La théorie des valeurs extrêmes est basée sur des principes différents de ceux de la statistique conventionnelle ; elle est conçue pour étudier et modéliser des événements exceptionnels plutôt que les caractéristiques moyennes des phénomènes naturels.

Ce cours d’introduction d’une semaine commence par présenter des outils exploratoires pour analyser le comportement des valeurs extrêmes dans les données environnementales et d’assurance, afin de motiver les principes de base de la modélisation statistique des valeurs extrêmes et des distributions qui les caractérisent.

Les deux approches courantes pour évaluer le risque d’événements extrêmes à un niveau donné, c’est-à-dire l’approche par blocs de maxima et l’approche par dépassement de seuil, sont introduites et illustrées à l’aide d’exemples de données réelles. Le cours couvre ensuite les extensions non stationnaires, multivariées et spatio-temporelles de la théorie de base.

Le logiciel statistique R (disponible gratuitement à l’adresse www.r-project.org) est utilisé dans les travaux pratiques, car il contient de nombreuses ressources facilement accessibles pour étudier et modéliser les extrêmes.