Laboratoire d’accueil : Laboratoire Euler, équipe IS2M, ISAE-Supméca, 3 rue Fernand Hainaut, 93400 Saint-Ouen-sur-Seine
Date de début : mars 2026
Durée : 6 mois
Mots clés : Intelligence artificielle symbolique, Ontologie, Raisonnement OWL, Développement de scripts d’automatisation, Cohérence sémantique, Ingénierie des connaissances
Contexte et objectifs du stage
Ce stage intervient dans le cadre d’un projet collaboratif aéronautique sur la transformation numérique, et plus particulièrement sur la capitalisation et l’exploitation de connaissances multi-métiers. Afin de construire une base de connaissances, basée sur une ontologie standard, nous proposons d’enrichir cette ontologie avec la connaissance contenue dans des modèles de domaines métier variés, pour permettre de capitaliser et d’exploiter ces connaissances multi-métiers, sans nécessité d’expertise pour accéder à la connaissance incluse dans ces modèles. Pour cela, nous avons développé une méthodologie pour enrichir l’ontologie standard avec des extensions spécifiques issus de modèles métiers. Une première implémentation assez manuelle a été développée par un doctorant. L’objectif de ce stage est de rendre la plus automatisée et robuste possible l’implémentation de cette méthode en Python pour permettre de l’utiliser sur d’autres modèles métiers et d’autres cas d’étude. Les 2 modèles métiers utilisés pour cette implémentation sont un modèle SysML Produit-Process qui a été développé pour décrire le parcours d’une pièce de fonderie au sein d’une entreprise aéronautique, et un modèle d’allocation de ressources Excel pour cette ligne de production. Enfin, un dernier objectif, suivant l’avancement du stage, serait de travailler sur le développement d’un module d’interrogation de la base de connaissance en langage naturel qui permettrait la conversion en SPARQL, langage de requête de la base de connaissances, basée sur une ontologie.
Missions principales
- Développement d’un pipeline permettant l’automatisation du processus
- Extraction de faits (classes, relations, ) à partir des modèles métier en format UML, BPMN, etc.
- Script de classification de concepts automatisée par LLM, pour l’extension progressive d’une ontologie
- Instanciation automatisée des faits vers la base de connaissances (ontologie)
- Conversion de requêtes / questions du langage naturel vers le langage SPARQL à partir d’outils existants (NLP2SPARQL, …)
- Validation et tests : Développer une méthodologie de validation du travail réalisé, incluant la rédaction de tests unitaires pour garantir la robustesse de la solution.
- Collaboration avec les concepteurs : Travailler en étroite collaboration avec les équipes à l’origine du modèle SysML Produit-Process pour enrichir un profil SysML existant, facilitant ainsi l’extraction automatisée des connaissances.
- Interface en langage naturel : Développer des scripts permettant d’interroger la base de connaissances en langage naturel (français).
Livrables
- Pipeline de scripts Python permettant l’automatisation de la méthode et sa documentation (développeur)
- Tests unitaires validés
- Vérification et validation sur les modèles du scénario de fonderie et un autre cas d’usage fourni
- Tutorial d’utilisation des scripts / IHM associée
- Thesaurus des concepts utilisés
- (Module d’interrogation de la base en langage naturel)
Profil recherché
Étudiant·e en Master 2 en informatique, ingénierie des connaissances, ou domaine connexe, avec un intérêt marqué pour la modélisation, l’automatisation et les ontologies. Des compétences en Python et une sensibilité aux enjeux industriels (aéronautique, fonderie) seront appréciées.
Environnement de travail
ISAE-Supméca est un établissement d’enseignement supérieur public reconnu, spécialisé dans les domaines de la mécanique et de l’ingénierie numérique. Notre équipe de recherche, IS2M (Ingénierie des Systèmes Mécatroniques et Multiphysiques) au sein du Laboratoire Euler, est à la pointe de l’innovation en ingénierie mécatronique et multiphysique. La ou le stagiaire bénéficiera d’un encadrement scientifique et méthodologique ainsi que d’un accès aux outils et ressources nécessaires à la réalisation du projet. Cette immersion au sein d’une équipe pluridisciplinaire offre un environnement stimulant où votre travail aura un impact significatif sur les enjeux industriels actuels.
Contacts
- Romain Delabeye : romain.delabeye@isae-supmeca.fr
- Olivia Penas : olivia.penas@isae-supmeca.fr
- Régis Plateaux : regis.plateaux@isae-supmeca.fr
- Grégoire Blanc : gregoire.blanc@isae-supmeca.fr
Références
- R. Gruber, « A Translation Approach to Portable Ontology Specifications, » Knowledge Acquisition, vol. 5, no. 2, pp. 199-220, 1993.
- L. McGuinness and F. van Harmelen, « OWL Web Ontology Language Overview, » W3C Recommendation, 10 February 2004. [Online]. Available: https://www.w3.org/TR/owl-features/
- F. Noy and D. L. McGuinness, « Ontology Development 101: A Guide to Creating Your First Ontology, » Stanford Knowledge Systems Laboratory Technical Report KSL-01-05, 2001.
- A. Musen, « The Protégé Project: A Look Back and a Look Forward, » AI Matters, vol. 1, no. 4,4-12, 2015.
- Drobnjakovic, B. Kulvatunyou, F. Ameri, C. Will, B. Smith, and A. Jones, « The Industrial Ontologies Foundry (IOF) Core Ontology, » in Advances in Production Management Systems (APMS 2022), CEUR Workshop Proceedings, vol. 3240, 2022.
- R. Al Hasan Rony, U. Kumar, R. Teucher, L. Kovriguina, and J. Lehmann, « SGPT: A Generative Approach for SPARQL Query Generation from Natural Language Questions, » IEEE Access, vol. 10, pp. 70712-70723, 2022.
- H. Tran and L. Phan, « NLP2SPARQL: Translate Natural Language to SPARQL Query, » 2021. [Online]. Available: