Stage - Data & Language Analyst (F/H)

France, Saint-Cloud
实习
4/9/2025
543566

Nous recrutons un·e Data & Language Analyst pour un stage de 6 mois afin de renforcer notre équipe Data Science.
OUTSCALE, marque de Dassault Systèmes, est un opérateur souverain et durable de l’Expérience en tant que Service qui offre à ses clients des environnements technologiques de confiance. 
Nous offrons des expériences uniques grâce au savoir-faire de nos équipes passionnées, qui se reflète notamment par la création de solutions de Business Experiences, le développement de notre propre orchestrateur Cloud, TINA OS, ou encore l’obtention de la qualification SecNumCloud.

Vos missions
Au cours de ce stage, vous ferez partie de l'équipe Data Science, en soutenant activement le développement d'ensembles de données de haute qualité pour l'apprentissage automatique (ML/DL) et l’entraînement de modèles d'IA. Vous participerez aux missions suivantes :

Gestion et traitement des données pour les projets d'IA
- Gérer la collecte, l'annotation et la transformation des données afin de garantir la qualité des données d'entrée pour les modèles d'IA
- Qualifier, structurer et améliorer les ensembles de données pour l'entraînement, l'inférence et l'évaluation des modèles d'IA, y compris les applications des LLMs, du NLP et de Computer Vision
- Contribuer à la gestion du cycle de vie des données, de l'ingestion au prétraitement et au stockage


Analyse des données et assurance qualité
- Analyser les erreurs et évaluer la qualité des données afin d'améliorer la cohérence des ensembles de données pour divers projets
- Identifier les biais, les incohérences et les lacunes dans les données d’entraînement et suggérer des améliorations
- Soutenir le perfectionnement des modèles d'IA en analysant les résultats et en proposant des améliorations fondées sur les données

Collaboration avec l'équipe Data Science
- Travailler en étroite collaboration avec les Data Scientists, les ingénieurs ML et les business analystes pour aligner les ensembles de données sur les objectifs de modèles
- Participer aux échanges sur les performances des modèles d'IA, les stratégies d'annotation et le développement des ressources linguistiques
- Développer des lexiques spécifiques à un domaine, des bases de connaissances et de la documentation pour améliorer les applications d'IA

Stack technique
- NLP- tokenization, segmentation, chunking, vectorisation, évaluation (NLTK, embeddings, transformers, F score/Precision/Rappel)
- Python - pandas, numpy, scikit-learn, pytorch (nice to have)
- Linux
- Git

Votre profil
- Étudiant·e en linguistique, en linguistique informatique, en science des données ou dans un domaine connexe (LEA, NLP, IA, etc.), vous recherchez un stage de fin d’études
- Vous possédez des compétences en matière d'analyse, de structuration, d'annotation et d'évaluation de la qualité des données
- Vous avez un esprit analytique, le souci du détail et une capacité à résoudre des problèmes
- Un intérêt pour l'IA, le NLP ou les LLM est un atout majeur
- Vous avez la capacité à travailler dans un environnement collaboratif et innovant
- Maîtrise du français et de l'anglais (à l'écrit et à l'oral)

Nous vous proposons
- Des technologies et méthodologies de pointe en matière d'intelligence artificielle
- Développer de l’expérience pratique dans des projets d'IA axés sur les données, contribuant directement à des applications du monde réel
- Collaborer avec des équipes pluridisciplinaires dans un environnement stimulant et de haute technologie
- Un parcours d'apprentissage structuré pour améliorer votre expertise en matière d'IA et de gestion des données


Nous rejoindre c'est aussi 
- Intégrer une entreprise scientifique au cœur de l’innovation technologique, portée par une forte croissance depuis plus de 40 ans
Principaux avantages et bénéfices :
- Environnement multiculturel
- Cadre de travail convivial axé sur le bien-être et la santé
- Engagement en faveur de la diversité et de l’inclusion
- Politique dynamique de développement de carrière : plan de formation, mobilités internes, etc.

Inclusion statement

As a game-changer in sustainable technology and innovation, Dassault Systèmes is striving to build more inclusive and diverse teams across the globe. We believe that our people are our number one asset and we want all employees to feel empowered to bring their whole selves to work every day. It is our goal that our people feel a sense of pride and a passion for belonging. As a company leading change, it’s our responsibility to foster opportunities for all people to participate in a harmonized Workforce of the Future.
OUTSCALE Logo > Dassault Systèmes

OUTSCALE 提供虚拟组织双胞胎和可信的云环境,使创新更加容易,并以可持续的方式提高竞争力。