- M. Jérémy JASPAR soutiendra sa thèse : Lundi 24 mars 2025 à 14h, à l’Université Paris XIII dénommée Université Sorbonne Paris Nord – 99, avenue Jean Baptiste Clément-93430 Villetaneuse – Institut Galilée-AMPHI DARWIN
Spécialité : Sciences pour l’ingénieur
Sujet : Méthodes d’obtention de garantie des performances d’un système d’intelligence artificielle appliqué à la compression d’images pour la conception des véhicules autonomes
Ces dernières années, l’intelligence artificielle (IA) a transformé de nombreux secteurs, notamment l’automobile, la médecine, la finance et l’aéronautique, en améliorant des tâches complexes telles que la détection d’anomalies ou la prise de décision. Cependant, les systèmes d’IA, en particulier ceux basés sur l’apprentissage profond, manquent de garanties solides en matière de fiabilité, ce qui limite leur adoption dans des applications critiques comme la conduite autonome ou le diagnostic médical. Le principal défi réside dans l’imprévisibilité de ces «boîtes noires» et dans l’absence de données couvrant la totalité des scénarios possibles. Les simulateurs et modèles génératifs comme les GANs ou modèles de diffusion offrent des perspectives pour générer des données synthétiques réalistes et élargir le spectre des cas de test, mais des questions sur leur réalisme et leur pertinence persistent. Dans ce contexte, la thèse, menée en collaboration avec le laboratoire L2TI et Stellantis, vise à développer une méthodologie pour garantir les performances des systèmes d’IA dans des scénarios critiques, en combinant approches statistiques et génération de données synthétiques. L’étude porte sur un cas concret dans la conduite autonome, intégrant un module de compression d’image et un module de détection d’objets, pour évaluer l’impact des distorsions générées par la compression sur la performance de détection. En utilisant des données réelles et synthétiques, cette méthodologie permet de définir des métriques d’erreur, d’identifier les scénarios critiques, et d’estimer la probabilité de dépassement de seuils de tolérance. L’objectif est de garantir que la qualité des données compressées reste suffisante pour des analyses fiables, minimisant ainsi les risques d’erreurs.
- Mme Marie GUION soutiendra sa thèse : Lundi 31 mars 2025 à 13h30, à Santé publique France, 12 Rue du Val d’Osne, All. Vacassy, 94410 Saint-Maurice-SALLE Salle – VEIL_Collaborative
Spécialité : Santé et santé publique
Sujet : Surveillance des inégalités sociales de santé dans le domaine du diabète de type 2 : Identifier les leviers d’actions pour la prévention
Contexte : Le diabète de type 2 est une maladie chronique emblématique d’un double défi. D’une part, un défi épidémiologique avec son fardeau croissant dans la population mondiale : 537 millions de personnes vivent avec un diabète. D’autre part, un défi sociétal avec des inégalités sociales de santé profondément ancrées : les personnes les plus défavorisées ont plus de risque de développer un diabète de type 2 et des complications liées au diabète que les plus favorisées. En France alors que de nombreux efforts ont été déployés en matière d’accès aux soins et de prévention, les inégalités sociales dans le diabète de type 2 restent majeures. Objectif : L’objectif de cette thèse est d’étudier l’évolution de l’association entre les inégalités socio-économiques et les indicateurs de la surveillance du diabète (prévalence, incidence, complications, mortalité), afin d’identifier des leviers d’actions pour renforcer la prévention et réduire le fardeau du diabète en France. Méthodes : Pour ce faire, l’utilisation des bases de données du Système National de Données de Santé (SNDS) apporte une réelle opportunité pour assurer une surveillance quasi-exhaustive, dans le temps et l’espace, de ces différents indicateurs dans la population. Les personnes avec un diabète ont été identifiées à partir d’un algorithme validé, basé sur les remboursements de traitements antidiabétiques à au moins trois dates différentes. Le statut socio-économique a été mesuré via un indice de désavantage social de la commune de résidence, le FDep. Parmi les personnes de 45 ans et plus traitées pharmacologiquement pour un diabète et résidant en France hexagonale, les taux annuels standardisés sur l’âge (population standard européenne 2013) ont été estimés pour chaque indicateur du diabète et par quintile de FDep. Des modèles de régression de Poisson ont permis d’estimer l’association entre les indicateurs du diabète et le FDep au cours du temps. Résultats : Nos résultats montrent que l’incidence du diabète et des complications cardiovasculaires, et la mortalité des personnes avec un diabète ont diminué au cours de la dernière décennie dans la majorité des groupes de désavantage social. Cependant, les inégalités sociales de santé dans le diabète ont persisté, avec un gradient de désavantage social présent dans la plupart des indicateurs du diabète, voire se sont exacerbées pour la prévalence (hommes et femmes) et l’incidence (hommes) du diabète. En 2020, les femmes résidant dans les communes les plus défavorisées vs. les moins défavorisées, avaient un sur-risque de 95 % de développer un diabète. Pour les hommes ce sur risque était de 67 %. En 2022, les femmes et les hommes résidant dans les communes les plus défavorisées avaient un sur-risque d’être hospitalisés pour une insuffisance cardiaque de 31 % et 27 % respectivement, et un sur-risque d’être hospitalisés pour une amputation des membres inférieurs de 22 % et 28 % respectivement, comparés à leurs homologues résidant dans les communes les plus favorisées. Enfin, le sur risque de décéder par maladies cardiovasculaires était respectivement 15% et 18% plus élevé en 2019. En outre, l’association entre inégalités socio-économiques et mortalité par COVID-19 différait durant les deux vagues épidémiques de 2020 : le gradient de désavantage social était présent durant la seconde vague épidémique, alors qu’il était peu présent durant la première. Conclusion : Cette thèse met en évidence que les efforts déployés jusqu’à présent ont participé à réduire une partie du fardeau du diabète, mais pas celui des inégalités sociales de santé. Or, des politiques publiques adaptées au gradient de désavantage social, prenant davantage en compte les plus vulnérables (principe d’universalisme proportionné), permettrait de répondre à ce double défi. Au-delà de l’enjeu d’équité en santé, la réduction des inégalités sociales de santé constitue une réponse aux enjeux sociétaux et économiques, en réduisant le fardeau du diabète.
- M. Kodjo AMEKOE soutiendra sa thèse : Jeudi 3 avril 2025 à 10h, à l’Université Paris XIII dénommée Université Sorbonne Paris Nord – 99, avenue Jean Baptiste Clément-93430 Villetaneuse – Institut Galilée-Salle B107
Spécialté : Informatique
Sujet : Apprentissage Adaptatif Appliqué à la Détection de la Fraude
La fraude aux moyens de paiement, dont sont victimes les institutions bancaires, peut emprunter plusieurs canaux (par exemple : chèque, carte bancaire, virement) et entraîner d’importantes pertes financières ou des désagréments pour les clients, notamment en cas de fausses alertes. La lutte contre la fraude est donc une nécessité pour les banques et se traduit par un cycle conflictuel entre les équipes dédiées à la sécurité, qui mettent en place des algorithmes de détection et de blocage, et les fraudeurs, qui adaptent leurs stratégies pour les contourner. Malgré les efforts visant à utiliser des approches de machine learning, les pertes liées à la fraude restent significatives, se chiffrant à des milliards de dollars chaque année. Il devient alors crucial de questionner l’efficacité des modèles de machine learning (ML) classiques, qui sont par nature plus statiques et, par conséquent, peut-être moins adaptés à un environnement en constante évolution. Dans cette thèse, nous explorons le domaine du machine learning adaptatif, qui vise précisément à résoudre des problèmes comportant des relations de cause à effet dynamiques. À cet égard, nous avons étudié et proposé des solutions pour évaluer l’efficacité des modèles incrémentaux par batch ou par lot, comparés à ceux incrémentaux par instance, en tenant compte des défis réels de la détection de fraude tels que le déséquilibre des classes et le retard des étiquettes. Par ailleurs, avec la sophistication croissante des solutions ML, il devient courant pour les data scientists d’utiliser des outils d’interprétabilité (comme SHAP ou LIME), bien que la fiabilité de cette approche reste discutable. Nous avons donc exploré dans quelle mesure l’utilisation de modèles intrinsèquement interprétables (II) peut constituer une alternative pertinente pour renforcer la confiance dans les systèmes ML appliqués à la lutte contre la fraude. Dans cette optique, nous avons proposé un modèle II basé sur le mécanisme d’attention, qui offre l’avantage de produire des explications stables, en plus d’être à la fois interprétable et performant sur le plan prédictif. Enfin, notre étude sur des données réelles de virements bancaires a permis de confronter les méthodes proposées et existantes aux contraintes du monde industriel, aboutissant à la formulation de recommandations concrètes pour les data scientists et/ou chercheurs travaillant sur ce sujet.