Advanced AI for Data Analysis Program

  • Certifiant

Le volume de données à traiter sur Internet connaît une croissance exponentielle. Des quantités remarquables de données non structurées telles que des textes, des images, des relevés temporels, sont disponibles, toutes produites à un rythme effréné. Ces dernières années, la disponibilité d'une puissance de traitement très élevée combinée à l'intérêt de l'industrie a donné naissance à de nouvelles méthodes d'IA, telles que l'apprentissage profond et l'apprentissage par renforcement. Elles permettent d'extraire des volumes d'informations significatifs en un temps très court, de résoudre des problèmes complexes et d'ouvrir de nouvelles perspectives.

Le programme Advanced AI est conçu pour fournir des informations approfondies sur ces nouvelles méthodes et leurs applications à des données massives et hautement hétérogènes. Parmi les domaines d'application de ces méthodes figurent le marketing, les jeux vidéos, les systèmes de recommandation, l'exploration de textes, la programmation neurolinguistique, les réseaux sociaux, la détection des fraudes et la reconnaissance images et vidéo.

Cette formation en data intelligence donne l'opportunité à des professionnels de devenir des spécialistes de la big data (donnée massive). Ce programme est conçu pour apprendre à collecter, modéliser, stocker et analyser la data. Il est porté par des enseignants-chercheurs reconnus dans le domaine de l'advance AI, et l'analyse de la donnée industrielle (data analyst industriel).


  • Du 31/03/2023 au 13/05/2023
    Du 17/11/2023 au 16/12/2023 Voir toutes les dates de session

  • 11 jours (77 heures)

  • Formation à distance

  • Anglais

    • Chefs de projet
    • Consultants
    • Data scientists
    • Data analysts

    • Connaissances en sciences des données (algorithmes, apprentissage automatique supervisé et non supervisé)
    • Compétences en informatique (bases de données)
    • Compétences en programmation (Python)
    • Compétences en mathématiques (statistique, probabilités, algèbre linéaire)
    • Première expérience en data science : machine learning, deep learning, données non structurées, NLP, Graph mining
    • Anglais : les modules sont enseignés en anglais et les supports de cours sont en anglais


Présentation du programme

Programme

Contenu du programme

  • Introduction à l'écosystème de l'IA et de la Data Science

Objectif : Faire des rappels sur les fondamentaux en science des données, présenter les spécificités des données massives et non structurées.
Ce module rappelle l'écosystème actuel de la data et de l'IA, les opportunités, les enjeux et les points de vigilance à considérer pour un projet de ce type. Il permet à tous les participants de revoir les bases essentielles (normalement déjà acquises par les participants) en Data Science et Big Data.

  • Deep Learning pour texte / traitement du langage naturel (NLP)

Objectif : Les textes sont des données non structurées fréquentes, notamment dans les données web mais aussi celle des contrats, des lois (par exemple).
Ce module présente les méthodes et les outils pour le prétraitement, l'indexation, la recherche et le classement de textes dans un document ou une collection.

  • IA appliquée aux graphes et réseaux sociaux

Objectif : les graphes sont des données issus notamment du web et des réseaux sociaux.
Ce module explique et permet de mettre en oeuvre des méthodes et outils de niveau avancé pour le pré-traitement des graphes, leur recherche et classement ainsi que l'évaluation de noeuds ou de communautés.

  • IA pour les séries temporelles, l'images/vision et les recommandations pour le web marketing

Objectif : Donner les outils et les méthodologies permettant la prévision des données de type séries temporelles. Présenter l'état de l'art des méthodes de recommandation. Présenter une introduction complète aux méthodes d'IA pour les images et les applications de computer vision.

  • Data Challenge

Objectif : appliquer les techniques vues dans les cours précédents à une étude de cas venant d'un problème industriel ou académique. Deux journées complètes en équipe pour réaliser une analyse permettant de mettre en oeuvre la méthodologie et les techniques vues dans les modules précédents.

Objectifs du programme

  • Comprendre et d’utiliser des réseaux de neurones (Deep Learning) sur des volumes importants de données (Big Data) non structurées de type textes et graphes
  • Maîtriser les spécificités de ces données et d’apprendre quelles sont les techniques d’analyse les plus récentes

Modalités pédagogiques

  • Cours magistraux
  • Travaux pratiques sur machine
  • Mise à disposition d’un LMS : eLearnX

Mode d'évaluation

L’évaluation porte sur la remise d’un mémoire sur un projet professionnel (individuel ou collectif) et une soutenance individuelle devant un jury. Cette évaluation permet la mise en œuvre des compétences listées dans le référentiel et l'obtention d'une certification Ecole Polytechnique Executive Education.

La formation certifiante "Advanced AI for Data Analysis Program" permet de valider le bloc de compétences n°2 "Développement et intégration des savoirs hautement spécialisés" du Master informatique, RNCP34126.

Compétences acquises à l'issue de la formation

  • Compétences sur les méthodes récentes de Machine Learning
  • Maîtrise du Machine Learning et du Deep Learning pour les graphes : prédiction de liens, classification de noeuds
  • Maîtrise du Machine Learning et du Deep Learning pour répondre à des problèmes de minage de texte et d'analyse du langage naturel
  • Maîtrise d'algorithmes d'IA pour développer le commerce en ligne, la fraude et d'algorithmes pour l'extraction de connaissances depuis des sites web
  • Intégrer les possibilités techniques et les questions d'écosystème pour caractériser un projet basé sur la science des données (données massives)
  • Analyser les opportunités, les défis et les impacts associés à l'IA

Intervenants

Responsable pédagogique
Michalis VAZIRGIANNIS
Professeur et chercheur au Département d'Informatique de l'École polytechnique (DIX/LIX). Il a créée et il dirige l'équipe DaSciM (Data Science and Mining Team). Ses recherches se focalisent sur le Data Mining le Machine / Deep Learning avec des applications industrielles aux données de grande échelle. Il est titualire de chaires scientifiques et industrielles dans le domaine de la Science des Données et de l'Intelligence Artificielle.

Informations pratiques

Les cours sont dispensés en anglais

Statistiques de résultat

  • Taux de réussite des participants pour l'obtention de leur certification : 90%
  • Note de satisfaction obtenue suite à une enquête en fin de formation : 4,5 / 5
  • Nombre moyen de participants par session de formation : 10 participants

Ils vous en parlent

TEMOIGNAGES