Advanced AI for Data Analysis Program

  • Certifiant

Le volume de données à traiter sur Internet connaît une croissance exponentielle. Des quantités remarquables de données non structurées telles que des textes, des images, des relevés temporels, sont disponibles, toutes produites à un rythme effréné. Ces dernières années, la disponibilité d'une puissance de traitement très élevée combinée à l'intérêt de l'industrie a donné naissance à de nouvelles méthodes d'IA, telles que l'apprentissage profond et l'apprentissage par renforcement ou encore l'IA générative. Elles permettent d'extraire des volumes d'informations significatifs en un temps très court, de résoudre des problèmes complexes et d'ouvrir de nouvelles perspectives.

Le programme Advanced AI est conçu pour fournir des informations approfondies sur ces nouvelles méthodes et leurs applications à des données massives et hautement hétérogènes. Parmi les domaines d'application de ces méthodes figurent le marketing, les jeux vidéos, les systèmes de recommandation, l'exploration de textes, la programmation neurolinguistique, les réseaux sociaux, la détection des fraudes et la reconnaissance images et vidéo.

Cette formation en data intelligence donne l'opportunité à des professionnels de devenir des spécialistes de la Data (donnée massive). Ce programme est conçu pour apprendre à collecter, modéliser, stocker et analyser la data. Il est porté par des enseignants-chercheurs reconnus dans le domaine de l'advance AI, et l'analyse de la donnée industrielle (data analyst industriel).

Formation intelligence artificielle et data analyst


  • Du 05/04/2024 au 01/06/2024

  • 12 jours (84 heures)

  • Formation à distance

  • Anglais

    • Chefs de projet
    • Consultants
    • Data scientists
    • Data analysts

    • Connaissances en sciences des données (algorithmes, apprentissage automatique supervisé et non supervisé)
    • Compétences en informatique (bases de données)
    • Compétences en programmation (Python)
    • Compétences en mathématiques (statistique, probabilités, algèbre linéaire)
    • Première expérience en data science : machine learning, deep learning, données non structurées, NLP, Graph mining
    • Anglais : les modules sont enseignés en anglais et les supports de cours sont en anglais


Présentation du programme

Programme

Contenu du programme

  • Introduction à l'écosystème de l'IA et de la Data Science

Objectif : Faire des rappels sur les fondamentaux en science des données, présenter les spécificités des données massives et non structurées.
Ce module rappelle l'écosystème actuel de la data et de l'IA, les opportunités, les enjeux et les points de vigilance à considérer pour un projet de ce type. Il permet à tous les participants de revoir les bases essentielles (normalement déjà acquises par les participants) en Data Science et Big Data.
(Data Science ML and DL ecosystem)

  • Deep Learning pour texte / traitement du langage naturel (NLP)

Objectif : Les textes sont des données non structurées fréquentes, notamment dans les données web mais aussi celle des contrats, des lois (par exemple).
Ce module présente les méthodes et les outils pour le prétraitement, l'indexation, la recherche et le classement de textes dans un document ou une collection.
(Text Mining, IR, NLP methods, Word Embeddings, Graph based NLP, Contextual WE, CNNs for text, ELMO)

  • IA appliquée aux graphes et réseaux sociaux

Objectif : Les graphes sont des données issus notamment du web et des réseaux sociaux.
Ce module explique et permet de mettre en oeuvre des méthodes et outils de niveau avancé pour le pré-traitement des graphes, leur recherche et classement ainsi que l'évaluation de noeuds ou de communautés.
(Graph Mining and Exploration, Graph Kernels, GNNs, Graph generators, Applications)

  • IA pour les séries temporelles, l'images/vision et les recommandations pour le web marketing

Objectif : Donner les outils et les méthodologies permettant la prévision des données de type séries temporelles. Présenter l'état de l'art des méthodes de recommandation. Présenter une introduction complète aux méthodes d'IA pour les images et les applications de computer vision.
(Introduction to TS concepts (stationarity) TS preprocessing and feature extraction, Statistical approaches for Time series (ARIMA), Prophet, Deep learning methods for time series forecasting and classification, Deep learning and GNN methods for recommendations)

  • IA générative et grands modèles pré-entraînés

Objectif : Exposer les dernières évolutions de l'IA générative avec les modèles récents. Exemples : BARD, GPT, GLM, PALM2 ; modèles de langage et de génération multimodale (image et son).
(Transformer, BERT, BART, GPT, instruction, safety (alignment), evaluation of LLMs, optimization of LLMs (quantization, QLORA, Multimodal LMs (i.e. image captioning (CLIP), Text2mol, Graph generative models, applications in Chemo/Bio/Medical)

  • Data Challenge

Objectif : appliquer les techniques vues dans les cours précédents à une étude de cas venant d'un problème industriel ou académique. Deux journées complètes en équipe pour réaliser une analyse permettant de mettre en oeuvre la méthodologie et les techniques vues dans les modules précédents.

Objectifs du programme

  • Comprendre et d’utiliser des réseaux de neurones (Deep Learning) sur des volumes importants de données (Big Data) non structurées de type textes et graphes
  • Maîtriser les spécificités de ces données et d’apprendre quelles sont les techniques d’analyse les plus récentes

Modalités pédagogiques

  • Cours magistraux
  • Travaux pratiques sur machine
  • Mise à disposition d’un LMS : eLearnX

Mode d'évaluation

La formation "Advanced AI for Data Analysis" permet de valider le bloc de compétences "Développement et intégration des savoirs hautement spécialisés", RNCP34126BC02, éligible CPF.
 
Cette certification de bloc permet :
  • Une reconnaissance officielle par l'Etat du niveau des compétences et des connaissance acquises nécessaires à l'exercice d'activités professionnelles
  • Une valorisation des connaissances et des compétences acquises pour sécuriser le parcours professionnel et/ou offrir de nouvelles opportunités
  • L'éligibilité aux dispositifs de financement de la formation professionnelle (CPF, financement des branches professionnelles, financement public, etc.)
Les blocs de compétences ne sont pas capitalisables pour l'obtention du Master. La validation partielle d'un bloc n'est pas possible.

Compétences acquises à l'issue de la formation

  • Compétences sur les méthodes récentes de Machine Learning
  • Maîtrise du Machine Learning et du Deep Learning pour les graphes : prédiction de liens, classification de noeuds
  • Maîtrise du Machine Learning et du Deep Learning pour répondre à des problèmes de minage de texte et d'analyse du langage naturel
  • Maîtrise d'algorithmes d'IA pour développer le commerce en ligne, la fraude et d'algorithmes pour l'extraction de connaissances depuis des sites web
  • Maîtrise des modèles d'IA générative pour développer des applications dans les champs du langage (textes), des images, du son ou de la video
  • Intégrer les possibilités techniques et les questions d'écosystème pour caractériser un projet basé sur la science des données (données massives)
  • Analyser les opportunités, les défis et les impacts associés à l'IA

Débouchés après la formation :

  • Ingénieur IA
  • Ingénieur Machine Learning
  • Administrateur Système et réseaux

Intervenants

Responsable pédagogique
Michalis VAZIRGIANNIS
Professeur et chercheur au Département d'Informatique de l'École polytechnique (DIX/LIX). Il a créée et il dirige l'équipe DaSciM (Data Science and Mining Team). Ses recherches se focalisent sur le Data Mining le Machine / Deep Learning avec des applications industrielles aux données de grande échelle. Il est titulaire de chaires scientifiques et industrielles dans le domaine de la Science des Données et de l'Intelligence Artificielle.

Giannis Nikolentzos
Post-doctoral researcher au Computer Science Laboratory (LIX) de l'Ecole polytechnique.
Diplômé d'un Doctorat en Graph Mining de Athens University of Economics and Business.

Informations pratiques

Les cours sont dispensés en anglais

Statistiques de résultat

  • Taux de réussite des participants pour l'obtention de leur certification : 80%
  • Note de satisfaction obtenue suite à une enquête en fin de formation : 4,5 / 5
  • Nombre moyen de participants par session de formation : 8 participants

Ils vous en parlent

TEMOIGNAGES