Rejoignez-nous

Stage

Un travail de thèse démarré en 2022 a permis de développer une chaine de traitement associant théorie des valeurs extrêmes et méthode de correction de biais, afin de quantifier l’évolution des fréquences (ou des temps de retours) de certains événements climatiques composés bivariés au cours du XXIième siècle.

L’objectif de ce stage est de déployer cette approche à l’échelle de l’Europe, et éventuellement pour de nouveaux événements composés bivariés inspirés par des événements récents, comme par exemple la tempête Boris en septembre 2024. Ce stage fait intervenir plusieurs disciplines/compétences. Au niveau informatique, il s’agira d’automatiser la chaîne de traitement actuelle et de mettre en place des outils de visualisation. Au niveau statistique, des questions de dépendances spatiales pourront être traitées. Au niveau des sciences du climat, il s’agira de confronter les résultats obtenus aux connaissances climatiques actuelles.

Plus d’informations dans l’offre détaillée ci-dessous :

Stage_Compounds_LSCE_BioSP_2025

State-of-the-art generative models demonstrate remarkable performance on challenging high-dimensional data modalities. Current implementations predominantly utilize Variational AutoEncoders, generative adversarial networks or denoising diffusion generative models. However, the standard theoretical guarantees for these approaches usually rely on assumptions that do not hold for heavy-tailed distributions.

One such heavy-tailed distribution is the rainfall distribution derived from radar imaging of specific regions. While one might expect methods effective for typical image distributions to be well-suited for the task at hand, the unbounded and potentially heavy-tailed nature of the rainfall distribution poses significant challenges. Moreover, current research on climate change suggests that the likelihood of extreme rainfall events is expected to increase in the future. Therefore, generating data from the tail of this distribution is a critical task for urban planning and insurance.

The internship goal is to explore a subset of the following research lines.

• Understand the different theoretical guarantees holding for GAN, VAE and Diffusion models and identify their limitations when handling heavy-tailed data.
• Identify the main limitations of the existing algorithms in the specific benchmark datasets (homogeneous vs non homogeneous, tail vs bulk generation, etc.) and explore new architectures adapted to such data.
• Explore adaptations of current proof strategies in the existing literature to adapt the frameworks to handling heavy tailed data. A natural first step will be to investigate VAE for heavy-tailed distributions.

More information in the detailed offer below:

sujet_rainextgen

L’objectif de ce stage  de M2 vise à entraı̂ner et valider une architecture basée sur des réseaux convolutifs sur graphes (GNN) proposée lors d’un stage précédent et à développer une architecture adaptée au contexte spatio-temporel pour l’estimation de paramètres de modèles géostatistiques complexes. Un enjeu de cette généralisation est la définition d’une nouvelle structure de voisinage spatio-temporel dans le GNN et l’estimation d’un plus grand nombre de paramètres, qui n’a jamais été mise en œuvre pour l’instant. On s’intéressera ensuite à comparer la stratégie proposée avec les méthodes d’inférence spatio-temporelle de l’état de l’art sur des jeux de données simulées. Enfin, on cherchera à adapter l’approche pour des modèles issus des équations aux dérivées partielles stochastiques (SPDE). Une application à un jeu de données réelles de mesures du rayonnement solaire conclura le stage.

Plus d’informations dans l’offre détaillée ci-dessous :

Sujet_stage_gnn