STAGE - Ingénieur Data Scientist - Generation de systemes excecutable depuis un document (F/H)
Au sein de Dassault Systèmes, nos équipes R&D proposent des sujets de stage au sein de leurs équipes. Chaque équipe peut être dédiée à un produit (CATIA, SIMULIA, ENOVIA, etc.) ou un laboratoire de Recherche.
Ce stage se fera dans l'équipe IA de CATIA Cyber System. Cette équipe est responsable du développement et du déploiement des outils d'IA à destination des applications CATIA Cyber System.
Vos Missions
Développer des outils d'IA (agentique basé sur du LLM, modèles), pour générer des systèmes exécutables depuis un document. Concrètement nous avons déjà en place une pipeline qui extrait des requirements depuis un PDF, le but de ce stage est d'aller plus loin et d'explorer les possibilités pour générer des systèmes exécutables depuis un document (en réutilisant notre pipeline ou non). Il faudra combiner des modèles existants (LLM, OCR, VLM) et éventuellement en entrainer d'autres pour construire cette pipeline.
Le stage comporte ces différentes étapes :
- Prototypage et entrainement de modèles
- Prototyper les solutions et itérer pour finaliser un workflow IA qui répondra à la problématique. (avec utilisation de modèles existant (LLM, autres), ou entrainement de nouveau modèles)
- Documenter et présenter des avancements et résultats dans la communauté.
- Prototyper les solutions et itérer pour finaliser un workflow IA qui répondra à la problématique. (avec utilisation de modèles existant (LLM, autres), ou entrainement de nouveau modèles)
- Validation du prototype et du modèle
- Définir et documenter une stratégie de validation du prototype et du modèle
- Identifier les KPIs pertinentes au regard du scénario (entre 3 et 10)
- Identifier les besoins en data set
- Collecter un data set suffisant pour valider ou invalider les prototypes et les modèles
- Implémenter les KPIs (entre 3 et 10) identifiées, revues et validées avec l’équipe
- Définir et documenter une stratégie de validation du prototype et du modèle
- Implémentation
- Identifier l'architecture à terminaison
- Implémenter l'architecture à terminaison
- Implémenter les KPIs identifiées (validation et non-regression)
- Implémenter les tests de validation du code
- Implémenter les tests de déploiement du code
- Identifier l'architecture à terminaison
Langage : Python essentiellement
Qualifications
Vous préparez un diplôme de niveau BAC+5, Ecole d’ingénieur ou Master Universitaire.
Vous vous spécialisez en Data Science / Machine Learning
Compétences souhaitées pour ces missions
- Connaissances solides en algorithmique et structures de données
- Programmation en Python
- Bonne connaissance des algorithmes de classification et des modèles à réseaux de neurones
- Bagages solides en Machine Learning / Deep Learning
Les atouts en nous rejoignant
· Environnement collaboratif et innovant
· Collaboration internationale
· Diversité des technologies, produits et solutions
· Apprentissage au sein d’une équipe experte
· Engagement en faveur de la diversité et de l’inclusion
Inclusion statement

CATIA es la solución líder en todo el mundo para la experiencia y el diseño de productos. Ofrece la posibilidad única no solo de modelar cualquier producto en 3D, sino de hacerlo en el contexto del comportamiento de los productos.
¿Quieres saber más?
Visita otras secciones de nuestra web para obtener más información.
Estudiantes y graduados
¡Forma parte de nuestro futuro! Consulta nuestras ofertas de empleo y oportunidades de prácticas.
El camino hacia la contratación
Infórmate sobre cómo será el camino hacia tu contratación.
Nuestros valores y nuestra cultura
Descubre nuestros valores y nuestra cultura.