Expert en sciences des données

Certification RNCP34262
Formacodes 31026 | Data science
Nomenclature Europe Niveau 7

Codes NSF 114g | Mathématiques de l'informatique, mathématiques financières, statistique de la santé
Voies d'accès : Formation initiale Contrat d'apprentissage Formation continue Contrat de professionnalisation Candidature individuelle VAE

Prérequis : Formation initiale et continue à ce jour et VAE dans le futur

Certificateurs :
Certificateur SIRET
DATA SCIENCETECH INSTITUTE 81023913700039


Activités visées :
Identifier les problématiques « décisionnelles » des directions métiers.
Définir une modélisation mathématique qui permette de répondre à la problématique.
Construire des outils d'analyse pour collecter les données de l'entreprise.
Rassembler l'ensemble des sources de données pertinentes (structurées ou non structurées) liées aux processus de production, de vente ou de la connaissance du client/usager.
Organiser, étudier et synthétiser ces sources de données sous forme de résultats exploitables.
Modéliser les comportements et en extraire de nouveaux usages utilisateurs.

Capacités attestées :
Intitulé : Analyser, concevoir et développer des modélisations mathématiques pour enrichir les systèmes d’aide à la décision Descriptif : Explorer, décrire et interpréter des données dans leur aspect multidimensionnel. Produire des traitements de données simples en utilisant les concepts de la statistique descriptive, en vue de présenter les résultats obtenus à l’aide de tableaux, de graphiques et d’indicateurs numériques. Mesurer la liaison entre deux variables. Choisir les outils et déterminer leurs limites afin de communiquer les conclusions et leur interprétation. Produire des études statistiques en mettant en œuvre les techniques d’apprentissage automatique par la machine (machine learning) pour des données avec ou sans caractères temporels. Intitulé : Concevoir et déployer des infrastructures informatiques distribuées pour stocker et traiter des données massives. Descriptif : Participer, avec des Data Engineers, à la rédaction d'un cahier des charges technique pour la conception et la mise en place d’une solution d’analyse des données volumineuses. Exploiter un système distribué d’entrepôt de données structurées et non structurées, notamment via Apache Hadoop & Apache Spark. Contribuer à la définition de l’architecture de stockage de données, en guidant les Data Engineers à prendre en compte les besoins de traitements algorithmiques de l’intelligence artificielle. Concevoir et implémenter des algorithmes pour le traitement des grands volumes de données dans le respect des bonnes pratiques de l’ingénierie logicielle (incluant les approches SQL et NoSQL). Exploiter des infrastructures informatiques distribuées en mode cloud sur la plateforme Amazon AWS pour y déporter des traitements algorithmiques de l’intelligence artificielle (préparation à la certification Amazon AWS Solution Architect – Associate) Intitulé : Détecter et évaluer l’état de l’art de l’intelligence artificielle pour développer des projets innovants. Descriptif : Cibler et faire ressortir des modèles linéaires, non-linéaires, généralisés ou mixtes et construire des modèles complexes ou novateurs de prévisions en utilisant les techniques de modélisation, estimations, tests et diagnostics. Identifier les variables ou composantes importantes d’un modèle afin de tester des hypothèses en utilisant les techniques de modélisation, estimations, tests et diagnostics. Modéliser des données observées, les interpréter pour en faire de la prédiction en utilisant des outils appropriés et en tenant compte de leur nature aléatoire. Déterminer et analyser des données complexes en utilisant les méthodes de fouille et de visualisation de séries temporelles et fonctionnelles, de textes (clustering, classification), de réseaux (statique ou dynamiques) ou d’images. Intégrer les technologies complémentaires (web sémantique, modélisation multi-agents) pour l’hybridation des approches intelligence artificielle connectivistes (réseaux de neurones) et symboliques (moteurs de raisonnement). Opérationnaliser une publication scientifique en implémentation informatique pour réaliser un prototype innovant. B3C6
- Utiliser l’écosystème des solutions SAS pour la modélisation prédictive (préparation à la certification SAS® Certified Predictive Modeler Using SAS® Enterprise Miner™) Intitulé : Conduire des projets complexes en intégrant les contraintes légales et les valeurs d’éthique pour diffuser les bonnes pratiques dans les organisations. Descriptif : Intégrer les philosophies, problématiques et contraintes des réglementations françaises et européennes (CNIL, RGPD) sur la protection des données dans un projet Data Science. Prendre la mesure de l’environnement international sur la réglementation de la protection des données, notamment aux Etats-Unis. Intégrer les deux grandes familles de pratiques de gestion de projets informatiques complexes (en cascade et en agilité) ainsi que les approches du « juste-à-temps ».

Secteurs d'activité :
Toutes entreprises industrielles et de services, organismes publics, associations, sociétés de services et de conseil en ingénierie (y compris informatique). Toutes ces structures ont comme point commun de générer et/ou d’avoir accès à des volumes importants de données numériques.

Types d'emplois accessibles :
Data Scientist Machine Learning Engineer Data Analyst M1403 : Études et prospectives socio-économiques M1802 : Expertise et support en systèmes d'information M1805 : Études et développement informatique M1806 : Conseil et maîtrise d'ouvrage en systèmes d'information

Objectif contexte :
Le métier visé est celui d’ expert (« Data Scientist » en Anglais) dans le domaine des Sciences des Données. Ces dernières peuvent être de toute taille, jusqu’à la qualification de « massives » (« Big Data » en Anglais). Ces données partagent une complexi

Statistiques : :
Année Certifiés Certifiés VAE Taux d'insertion global à 6 mois Taux d'insertion métier à 2 ans
2015 7 0 86 86
2016 22 0 86 100
2017 16 0 88 100

Bloc de compétences

RNCP34262BC01 : Analyser, concevoir et développer des modélisations mathématiques pour enrichir les systèmes d’aide à la décision
Compétences :
Explorer, décrire et interpréter des données dans leur aspect multidimensionnel. Produire des traitements de données simples en utilisant les concepts de la statistique descriptive, en vue de présenter les résultats obtenus à l’aide de tableaux, de graphiques et d’indicateurs numériques. Mesurer la liaison entre deux variables. Choisir les outils et déterminer leurs limites afin de communiquer les conclusions et leur interprétation. Produire des études statistiques en mettant en œuvre les techniques d’apprentissage automatique par la machine (machine learning) pour des données avec ou sans caractères temporels.
Modalités d'évaluation :
Examens écrits. Projets d’application. Mise en situation professionnelle réelle au travers du stage obligatoire d’application.
RNCP34262BC03 : Détecter et évaluer l’état de l’art de l’intelligence artificielle pour développer des projets innovants
Compétences :
Cibler et faire ressortir des modèles linéaires, non-linéaires, généralisés ou mixtes et construire des modèles complexes ou novateurs de prévisions en utilisant les techniques de modélisation, estimations, tests et diagnostics. Identifier les variables ou composantes importantes d’un modèle afin de tester des hypothèses en utilisant les techniques de modélisation, estimations, tests et diagnostics. Modéliser des données observées, les interpréter pour en faire de la prédiction en utilisant des outils appropriés et en tenant compte de leur nature aléatoire. Déterminer et analyser des données complexes en utilisant les méthodes de fouille et de visualisation de séries temporelles et fonctionnelles, de textes (clustering, classification), de réseaux (statique ou dynamiques) ou d’images. Intégrer les technologies complémentaires (web sémantique, modélisation multi-agents) pour l’hybridation des approches intelligence artificielle connectivistes (réseaux de neurones) et symboliques (moteurs de raisonnement). Opérationnaliser une publication scientifique en implémentation informatique pour réaliser un prototype innovant.
Modalités d'évaluation :
Questionnaires à choix multiples. Projets d’applications. Examen externe de certification industrielle « SAS® Certified Predictive Modeler Using SAS® Enterprise Miner™ ». Mise en situation professionnelle réelle au travers du stage obligatoire d’application.
RNCP34262BC02 : Concevoir et déployer des infrastructures informatiques distribuées pour stocker et traiter des données massives.
Compétences :
Participer, avec des Data Engineers, à la rédaction’ un cahier des charges technique pour la conception et la mise en place d’une solution d’analyse des données volumineuses. Exploiter un système distribué d’entrepôt de données structurées et non structurées, notamment via Apache Hadoop & Apache Spark. Contribuer à la définition de l’architecture de stockage de données, en guidant les Data Engineers à prendre en compte les besoins de traitements algorithmiques de l’intelligence artificielle. Concevoir et implémenter des algorithmes pour le traitement des grands volumes de données dans le respect des bonnes pratiques de l’ingénierie logicielle (incluant les approches SQL et NoSQL). Exploiter des infrastructures informatiques distribuées en mode cloud sur la plateforme Amazon AWS pour y déporter des traitements algorithmiques de l’intelligence artificielle (préparation à la certification Amazon AWS Solution Architect – Associate)
Modalités d'évaluation :
Questionnaires à choix multiples Projets d’applications Examen externe de certification industrielle « Amazon AWS Solutions Architect – Associate » Mise en situation professionnelle réelle au travers du stage obligatoire d’application.
RNCP34262BC04 : Conduire des projets complexes en intégrant les contraintes légales et les valeurs d’éthique pour diffuser les bonnes pratiques dans les organisations
Compétences :
Intégrer les philosophies, problématiques et contraintes des réglementations françaises et européennes (CNIL, RGPD) sur la protection des données dans un projet Data Science. Prendre la mesure de l’environnement international sur la réglementation de la protection des données, notamment aux États-Unis. Intégrer les deux grandes familles de pratiques de gestion de projets informatiques complexes (en cascade et en agilité) ainsi que les approches du « juste-à-temps ».
Modalités d'évaluation :
Mise en situation en travaux dirigés et pratiques. Questionnaires à choix multiples. Mise en situation professionnelle réelle au travers du stage obligatoire d’application.
Partenaires actifs :
Partenaire SIRET Habilitation
AMTALENTS 90021084000014 HABILITATION_FORMER
ECOLE NATIONALE SUPERIEURE D'ARTS ET METIERS (ENSAM) 19753472000010 HABILITATION_ORGA_FORM

Select your color
Light/dark Layout