Jeudi 15 janvier 2026 à 14h, M. Elie SAAD soutiendra publiquement ses travaux de thèse intitulés Optimisation de la gestion de l’obsolescence en environnement de systèmes critiques K-Shot par modélisation générative profonde et petits modèles de langage, dirigés par M. Marc ZOLGHADR.
Résumé
Cette thèse aborde l’impératif industriel de gérer l’obsolescence des composants dans des systèmes critiques à longue durée de vie, un problème fondamentalement caractérisé en apprentissage automatique comme un environnement à faible K-shot. Ce décalage temporel dans le cycle de vie, couplé à la rareté des données critiques pour la sécurité, nécessite des solutions d’intelligence artificielle (IA) robustes offrant à la fois des prédictions haute fidélité et une interprétabilité inhérente. La recherche établit une trajectoire méthodologique double et novatrice. Initialement, un paradigme centré sur les données est avancé pour surmonter la contrainte K-shot. Ce pipeline intègre des modèles génératifs profonds (y compris les autoencodeurs variationnels et les flux normalisants) pour l’augmentation synthétique des données, combinés à un cadre d’apprentissage semi-supervisé basé sur le clustering, atteignant une précision prédictive à la pointe de la technologie en modélisant efficacement les distributions de caractéristiques latentes rares. Reconnaissant les limites de la synthèse de données — à savoir son opacité et son incapacité à traiter les scénarios sans données (« cold start ») — la thèse pivote vers un paradigme centré sur la connaissance, exploitant les Small Language Models (SLM). Cette phase génère deux contributions majeures au raisonnement en IA : un cadre d’apprentissage zéro-shot (ZSL) pour la prévision robuste des risques à partir de données tabulaires sérialisées, et une architecture intrinsèquement interprétable employant le raisonnement Chain-of-Thought (CoT). Ce système aligne le SLM déployable à la fois pour la classification et l’explication via l’apprentissage par renforcement avec feedback IA (RLAIF). Enfin, ce travail apporte une contribution fondamentale à la méthodologie en IA en abordant l’instabilité des algorithmes d’alignement sans critique. Une extension théorique formelle, GRPO-KD (Group Relative Policy Optimization avec distillation multi-enseignants), est dérivée et validée empiriquement, fournissant une nouvelle famille d’objectifs stables qui transfèrent efficacement des capacités de raisonnement complexes vers des SLM économes en paramètres. Validée sur des données industrielles du secteur ferroviaire, cette recherche propose un pipeline d’ingénierie IA complet, allant des algorithmes d’apprentissage innovants au raisonnement basé sur la connaissance et transparent, fournissant une feuille de route pour le développement d’intelligences artificielles fiables dans les domaines critiques.