Advanced AI for Data Analysis Program

  • Certifiant

Le volume de données à traiter sur Internet connaît une croissance exponentielle. Des quantités remarquables de données non structurées telles que des textes, des images, des relevés temporels, sont disponibles, toutes produites à un rythme effréné. Ces dernières années, la disponibilité d'une puissance de traitement très élevée combinée à l'intérêt de l'industrie a donné naissance à de nouvelles méthodes d'IA, telles que l'apprentissage profond et l'apprentissage par renforcement. Elles permettent d'extraire des volumes d'informations significatifs en un temps très court, de résoudre des problèmes complexes et d'ouvrir de nouvelles perspectives.

Le programme Advanced AI est conçu pour fournir des informations approfondies sur ces nouvelles méthodes et leurs applications à des données massives et hautement hétérogènes. Parmi les domaines applications de ces méthodes figurent le marketing, les jeux vidéos, les systèmes de recommandation, l'exploration de textes, la programmation neurolinguistique, les réseaux sociaux, la détection des fraudes et la reconnaissance images et vidéo.


  • Du 25/03/2022 au 23/04/2022
    Du 25/03/2022 au 23/04/2022 Voir toutes les dates de session

  • 11 jours (77 heures)

  • Formation à distance

  • Anglais

    • Chefs de projet
    • Consultants
    • Data scientists
    • Data analysts

    • Connaissances en sciences des données (algorithmes, apprentissage automatique supervisé et non supervisé)
    • Compétences en informatique (bases de données)
    • Compétences en programmation (Python)
    • Compétences en mathématiques (statistique, probabilités, algèbre linéaire)
    • Anglais : certains modules sont enseignés en anglais et les supports de cours sont en anglais


Présentation du programme

Programme

Contenu du programme

  • INTRODUCTION A L'IA ET A L'ECOSYSTEME DE LA DATA OUTILS DE LA DATA SCIENCE - CONTEXTE DU BIG DATA DEEP LEARNING POUR TEXTES ET NLP :méthodes et outils pour le prétraitement, l'indexation, la recherche et le classement de textes dans un document ou une collection.
  • L'IA POUR LES GRAPHES ET RESEAUX SOCIAUX :méthodes et outils de niveau avancé pour le prétraitement des graphes, leur recherche et classement ainsi que l'évaluation de noeuds ou de communautés.
  • IA POUR LES LES SÉRIES TEMPORELLES ET SYSTEMES DE RECOMMANDATION : donner les outils et la methodologies pour traiter les données de type séries temporelles et obtenir des recommandations optimales dans différents domaines du marketing en ligne
  • DATA CHALLENGE : Appliquer les techniques apprises à une étude de cas venant d'un problème industriel ou académique. Deux journées complètes en équipe pour réaliser une analyse permettant de mettre en oeuvre la méthodologie et les techniques vues dans les modules précédents.

Objectifs du programme

  • Comprendre et d’utiliser des réseaux de neurones (Deep Learning) sur des volumes importants de données (Big Data) non structurées de type textes et graphes
  • Maîtriser les spécificités de ces données et d’apprendre quelles sont les techniques d’analyse les plus récentes

Méthodes pédagogiques

  • Cours magistraux
  • Travaux pratiques sur machine

Mode d'animation

Mise à disposition d’un LMS : eLearnX

Mode d'évaluation

L’évaluation porte sur la remise d’un mémoire sur un projet professionnel (individuel ou collectif) et une soutenance individuelle devant un jury. Cette évaluation permet la mise en œuvre des compétences listées dans le référentiel et l'obtention d'une certification Ecole Polytechnique Executive Education.

Compétences acquises à l'issue de la formation

  • Compétences sur les méthodes récentes de Machine Learning
  • Maîtrise du Machine Learning et du Deep Learning pour les graphes : prédiction de liens, classification de noeuds
  • Maîtrise du Machine Learning et du Deep Learning pour répondre à des problèmes de minage de texte et d'analyse du langage naturel
  • Maîtrise d'algorithmes d'IA pour développer le commerce en ligne, la fraude et d'algorithmes pour l'extraction de connaissances depuis des sites web
  • Intégrer les possibilités techniques et les questions d'écosystème pour caractériser un projet basé sur la science des données (données massives)
  • Analyser les opportunités, les défis et les impacts associés à l'IA

Intervenants

Responsable pédagogique
Michalis VAZIRGIANNIS
Professeur au Laboratoire d'Informatique de l'École polytechnique (LIX)