Data Science : savoir collecter, décrypter, analyser et prédire à partir de mégadonnées
Certification RS5602
Formacodes 31026 | Data science 31028 | Intelligence artificielle 11036 | Statistique
Formacodes 31026 | Data science 31028 | Intelligence artificielle 11036 | Statistique
Codes NSF 114b | Modèles mathématiques ; Informatique mathématique 326m | Informatique, traitement de l'information
Voies d'accès : Formation continue
Prérequis : Une expérience professionnelle minimale de 3 ans est requise pour candidater au certificat de Data Scientist. Celle-ci s'adresse principalement aux Data Analysts, Ingénieurs en informatique, Chefs de projets, Ingénieurs quantitatifs ... Une formation initiale BAC+5 dans le domaine des mathématiques appliquées ou de l'informatique est souhaitable même si elle n’est pas indispensable. Lors du processus de candidature chaque postulant doit effectuer un test de positionnement en ligne. Celui-ci vise à vérifier les prérequis techniques et notamment les compétences en programmation dans le(s) langage(s) utilisé(s) pendant le cursus. Des entretiens entre le jury et les candidats sont organisés si nécessaire afin de clarifier certains points du dossier de candidature
Certificateurs :
Voies d'accès : Formation continue
Prérequis : Une expérience professionnelle minimale de 3 ans est requise pour candidater au certificat de Data Scientist. Celle-ci s'adresse principalement aux Data Analysts, Ingénieurs en informatique, Chefs de projets, Ingénieurs quantitatifs ... Une formation initiale BAC+5 dans le domaine des mathématiques appliquées ou de l'informatique est souhaitable même si elle n’est pas indispensable. Lors du processus de candidature chaque postulant doit effectuer un test de positionnement en ligne. Celui-ci vise à vérifier les prérequis techniques et notamment les compétences en programmation dans le(s) langage(s) utilisé(s) pendant le cursus. Des entretiens entre le jury et les candidats sont organisés si nécessaire afin de clarifier certains points du dossier de candidature
Certificateurs :
Certificateur | SIRET |
---|---|
GROUPE DES ECOLES NATIONALES D ECONOMIE ET STATISTIQUE | 13001422800089 |
Capacités attestées :
Analyser une problématique data science et en extraire les enjeux métier, informatique et mathématique afin de formaliser une étude Extraire des données depuis des bases de type SQL et NoSQL en utilisant des API (web scraping) et des techniques distribuées (Hadoop) afin de pouvoir mener une analyse Mener une analyse exploratoire d’un jeu de données afin de synthétiser l’information sous-jacente en choisissant la méthode adaptée au problème (analyse factorielle ou classification non supervisée) Mettre en œuvre un modèle de Machine Learning pour obtenir des prévisions d’une variable d’intérêt à partir de facteurs explicatifs connus en utilisant un algorithme approprié au contexte (random forest, gradient boosting, SVM, réseaux de neurones…) Explorer et analyser des données non structurées (textes ou graphes) pour mettre en lumière des arrangements (sacs de mots ou communautés) à l’aide d’algorithmes de text mining ou de graph mining Produire des synthèses visuelles afin de rendre accessibles aux décideurs des informations complexes issues de jeux de données en utilisant des outils de visualisation (dataviz)
Analyser une problématique data science et en extraire les enjeux métier, informatique et mathématique afin de formaliser une étude Extraire des données depuis des bases de type SQL et NoSQL en utilisant des API (web scraping) et des techniques distribuées (Hadoop) afin de pouvoir mener une analyse Mener une analyse exploratoire d’un jeu de données afin de synthétiser l’information sous-jacente en choisissant la méthode adaptée au problème (analyse factorielle ou classification non supervisée) Mettre en œuvre un modèle de Machine Learning pour obtenir des prévisions d’une variable d’intérêt à partir de facteurs explicatifs connus en utilisant un algorithme approprié au contexte (random forest, gradient boosting, SVM, réseaux de neurones…) Explorer et analyser des données non structurées (textes ou graphes) pour mettre en lumière des arrangements (sacs de mots ou communautés) à l’aide d’algorithmes de text mining ou de graph mining Produire des synthèses visuelles afin de rendre accessibles aux décideurs des informations complexes issues de jeux de données en utilisant des outils de visualisation (dataviz)
Objectif contexte :
Le dispositif permet de fournir l’expertise nécessaire pour la gestion et l’analyse pointues des données massives.
Le data scientist certifié pourra alors déterminer les indicateurs permettant de mettre en place une stratégie répondant à une problématique de l’entreprise.
Le dispositif permet de fournir l’expertise nécessaire pour la gestion et l’analyse pointues des données massives.
Le data scientist certifié pourra alors déterminer les indicateurs permettant de mettre en place une stratégie répondant à une problématique de l’entreprise.
Statistiques : :
Année | Certifiés | Certifiés VAE | Taux d'insertion global à 6 mois | Taux d'insertion métier à 2 ans |
---|---|---|---|---|
2021 | 44 | |||
2020 | 51 | |||
2018 | 50 | |||
2017 | 60 | |||
2019 | 67 |