Préparation avancée des données pour l’IA

Certification RS5336
Formacodes 11014 | Algorithme 11016 | Analyse données 31052 | Data Warehouse 31009 | Architecture système information 30812 | Langage Python

Codes NSF 326t | Programmation, mise en place de logiciels 326 | Informatique, traitement de l'information, réseaux de transmission
Voies d'accès : Formation continue
Certificateurs :
Certificateur SIRET
ECOLE DE LA DATA & DE L'IA DE BUSINESS & DECISION 38183776400095
ORANGE 38012986648625

Capacités attestées :
1.
Connaitre les bénéfices et les impacts de la DataScience 2.
Être capable d'identifier les sujets relavant de la DataScience 3.
Savoir scénariser des implémentations possibles de cas d'usage relevant de la DataScience 4.
Connaître les problématiques typiques en DataScience dans différents secteurs d'activité ou fonctions 5.
Savoir évaluer la complexité d'une problématique de DataScience 6.
Être capable d'évaluer la faisabilité d'un projet en fonction de sa complexité et des données disponibles 7.
Savoir identifier les algorithmes utilisables pour répondre aux besoins de la problématique du client 8.
Être capable de reconnaître le caractère éthique ou non éthique des données disponibles 9.
Savoir tester si un jeu de données est paramétrique ou non 10.
Pouvoir identifier les données atypiques et/ou aberrantes 11.
Être capable d'identifier et de traiter des données manquantes 12.
Maîtriser la Statistique descriptive monovariée 13.
Maîtriser le recodage des données non paramétriques 14.
Maîtriser les recodages non supervisés 15.
Maîtriser les recodages supervisés 16.
Savoir estimer l'impact du recodage sur la précision du modèle 17.
Savoir utiliser les algorithmes de deep learning et de Natural Language Processing (ou text mining) pour créer des métadonnées à partir de données structurées

Objectif contexte :
Depuis les cinq dernières années, les projets Data Science et d’intelligence artificielle connaissent une forte croissance dans des domaines très variés, tels que l’industrie pétrolière, la téléphonie, la distribution, la banque, la finance et les services.
Les récentes évolutions technologiques permettent de faire évoluer ces projets vers la mise en place de véritables solutions d’intelligence artificielle.
La réalisation de ces projets nécessite de former des équipes de « Data-Engineers » et de « Data Scientists » pour lesquelles il est nécessaire de conjuguer l’acquisition des compétences techniques et méthodologiques, l’expérience des cas concrets et surtout, un parcours d’apprentissage jalonné.
Les principales compétences visées par cette certification sont celles nécessaires à la mise en œuvre des activités suivantes :
* Expliquer les bénéfices de la DataScience à un interlocuteur métier et identifier les problématiques qui peuvent ou doivent être résolues grâce à la DataScience
* Identifier, évaluer la faisabilité et la création de valeur des problématiques client en se basant sur les besoins métiers et les données disponibles
* Auditer les sources de données disponibles, leur qualité et leur profondeur, leur caractère éthique ou non-éthique, leur potentiel en rapport avec le problème à résoudre
* Identifier et spécifier grâce à une analyse monovariée descriptive toutes les transformations et recodages nécessaires sur les données ainsi que la création de nouveaux indicateurs nécessaires pour la réalisation du projet

Select your color
Light/dark Layout