STAGE - Ingénieur Data Scientist - Generation de systemes excecutable depuis un document (F/H)
Au sein de Dassault Systèmes, nos équipes R&D proposent des sujets de stage au sein de leurs équipes. Chaque équipe peut être dédiée à un produit (CATIA, SIMULIA, ENOVIA, etc.) ou un laboratoire de Recherche.
Ce stage se fera dans l'équipe IA de CATIA Cyber System. Cette équipe est responsable du développement et du déploiement des outils d'IA à destination des applications CATIA Cyber System.
Vos Missions
Développer des outils d'IA (agentique basé sur du LLM, modèles), pour générer des systèmes exécutables depuis un document. Concrètement nous avons déjà en place une pipeline qui extrait des requirements depuis un PDF, le but de ce stage est d'aller plus loin et d'explorer les possibilités pour générer des systèmes exécutables depuis un document (en réutilisant notre pipeline ou non). Il faudra combiner des modèles existants (LLM, OCR, VLM) et éventuellement en entrainer d'autres pour construire cette pipeline.
Le stage comporte ces différentes étapes :
- Prototypage et entrainement de modèles
- Prototyper les solutions et itérer pour finaliser un workflow IA qui répondra à la problématique. (avec utilisation de modèles existant (LLM, autres), ou entrainement de nouveau modèles)
- Documenter et présenter des avancements et résultats dans la communauté.
- Prototyper les solutions et itérer pour finaliser un workflow IA qui répondra à la problématique. (avec utilisation de modèles existant (LLM, autres), ou entrainement de nouveau modèles)
- Validation du prototype et du modèle
- Définir et documenter une stratégie de validation du prototype et du modèle
- Identifier les KPIs pertinentes au regard du scénario (entre 3 et 10)
- Identifier les besoins en data set
- Collecter un data set suffisant pour valider ou invalider les prototypes et les modèles
- Implémenter les KPIs (entre 3 et 10) identifiées, revues et validées avec l’équipe
- Définir et documenter une stratégie de validation du prototype et du modèle
- Implémentation
- Identifier l'architecture à terminaison
- Implémenter l'architecture à terminaison
- Implémenter les KPIs identifiées (validation et non-regression)
- Implémenter les tests de validation du code
- Implémenter les tests de déploiement du code
- Identifier l'architecture à terminaison
Langage : Python essentiellement
Qualifications
Vous préparez un diplôme de niveau BAC+5, Ecole d’ingénieur ou Master Universitaire.
Vous vous spécialisez en Data Science / Machine Learning
Compétences souhaitées pour ces missions
- Connaissances solides en algorithmique et structures de données
- Programmation en Python
- Bonne connaissance des algorithmes de classification et des modèles à réseaux de neurones
- Bagages solides en Machine Learning / Deep Learning
Les atouts en nous rejoignant
· Environnement collaboratif et innovant
· Collaboration internationale
· Diversité des technologies, produits et solutions
· Apprentissage au sein d’une équipe experte
· Engagement en faveur de la diversité et de l’inclusion
Inclusion statement

CATIA è la soluzione leader a livello mondiale per la progettazione e l'esperienza dei prodotti. CATIA offre la capacità non solo di modellare qualsiasi prodotto in 3D, ma di farlo tenendo in considerazione il comportamento del prodotto in condizioni reali.
Vuoi saperne di più?
Visita le altre sezioni del nostro sito per avere maggiori informazioni.
Studenti e laureati
Entra a far parte del futuro della nostra forza lavoro: scopri le nostre opportunità di stage e di lavoro.
Il tuo percorso di selezione
Scopri quale sarà il tuo percorso di selezione.
La nostra cultura e i nostri valori
Scopri la nostra cultura e i nostri valori.