Préparation et intégration des données pour l’IA
Certification RS5340
Formacodes 11016 | Analyse données 31052 | Data Warehouse 31009 | Architecture système information 30812 | Langage Python 30887 | Langage SQL
Formacodes 11016 | Analyse données 31052 | Data Warehouse 31009 | Architecture système information 30812 | Langage Python 30887 | Langage SQL
Codes NSF 326t | Programmation, mise en place de logiciels 326 | Informatique, traitement de l'information, réseaux de transmission
Voies d'accès : Formation continue
Certificateurs :
Voies d'accès : Formation continue
Certificateurs :
Certificateur | SIRET |
---|---|
ECOLE DE LA DATA & DE L'IA DE BUSINESS & DECISION | 38183776400095 |
ECOLE DE LA DATA & DE L'IA DE BUSINESS & DECISION | 38183776400095 |
ORANGE | 38012986648625 |
Capacités attestées :
1.
Maîtriser la statistique descriptive monovariée 2.
Savoir utiliser la librairie Numpy en langage Python 3.
Savoir utiliser la librairie Pandas en langage Python 4.
Savoir réaliser un audit de qualité de données 5.
Connaitre les principales règles de RGPD 6.
Maîtriser la statistique bivariée 7.
Savoir tester et mesurer la paramétricité des données 8.
Savoir programmer en Python 9.
Savoir programmer le recodage des données pour les rendre paramétriques 10.
Savoir caractériser et traiter les valeurs manquantes 11.
Savoir identifier et traiter les valeurs aberrantes 12.
Maitriser le fonctionnement des bases de données SQL 13.
Pouvoir créer des jeux de données de test 14.
Savoir mettre en œuvre une stratégie inférentielle 15.
Maîtriser les bases de la statistique multivariée 16.
Être capable de mettre en œuvre du machine-learning non supervisé 17.
Être capable de mettre en œuvre du machine-learning supervisé 18.
Savoir utiliser les algorithmes du domaine public pour créer un modèle
1.
Maîtriser la statistique descriptive monovariée 2.
Savoir utiliser la librairie Numpy en langage Python 3.
Savoir utiliser la librairie Pandas en langage Python 4.
Savoir réaliser un audit de qualité de données 5.
Connaitre les principales règles de RGPD 6.
Maîtriser la statistique bivariée 7.
Savoir tester et mesurer la paramétricité des données 8.
Savoir programmer en Python 9.
Savoir programmer le recodage des données pour les rendre paramétriques 10.
Savoir caractériser et traiter les valeurs manquantes 11.
Savoir identifier et traiter les valeurs aberrantes 12.
Maitriser le fonctionnement des bases de données SQL 13.
Pouvoir créer des jeux de données de test 14.
Savoir mettre en œuvre une stratégie inférentielle 15.
Maîtriser les bases de la statistique multivariée 16.
Être capable de mettre en œuvre du machine-learning non supervisé 17.
Être capable de mettre en œuvre du machine-learning supervisé 18.
Savoir utiliser les algorithmes du domaine public pour créer un modèle
Objectif contexte :
Depuis les cinq dernières années, les projets Data Science et d’intelligence artificielle connaissent une forte croissance dans des domaines très variés, tels que l’industrie pétrolière, la téléphonie, la distribution, la banque, la finance et les services.
Les récentes évolutions technologiques permettent de faire évoluer ces projets vers la mise en place de véritables solutions d’intelligence artificielle.
La réalisation de ces projets nécessite de former des équipes de « Data-Engineers » pour lesquelles il est nécessaire de conjuguer l’acquisition des compétences techniques et méthodologiques, l’expérience des cas concrets et surtout, un parcours d’apprentissage jalonné.
Les principales compétences visées par cette certification sont celles nécessaires à la mise en œuvre des activités suivantes :
* Auditer la qualité des données
* Préparer, nettoyer et programmer le recodage des données
* Programmer les indicateurs nécessaires au fonctionnement des algorithmes
Depuis les cinq dernières années, les projets Data Science et d’intelligence artificielle connaissent une forte croissance dans des domaines très variés, tels que l’industrie pétrolière, la téléphonie, la distribution, la banque, la finance et les services.
Les récentes évolutions technologiques permettent de faire évoluer ces projets vers la mise en place de véritables solutions d’intelligence artificielle.
La réalisation de ces projets nécessite de former des équipes de « Data-Engineers » pour lesquelles il est nécessaire de conjuguer l’acquisition des compétences techniques et méthodologiques, l’expérience des cas concrets et surtout, un parcours d’apprentissage jalonné.
Les principales compétences visées par cette certification sont celles nécessaires à la mise en œuvre des activités suivantes :
* Auditer la qualité des données
* Préparer, nettoyer et programmer le recodage des données
* Programmer les indicateurs nécessaires au fonctionnement des algorithmes