En utilisant notre site, vous consentez à ce que des cookies soient utilisés à des fins d’analyse, de pertinence, et de publicité. Modifiez vos préférences.

Data Science Starter Program (Formation Big Data)

Share
formation-big-data

Découvrez notre formaton continue Big Data.
Avec l’explosion et la profusion des données disponibles dans un grand nombre de domaines, les nouvelles techniques de collecte et d’analyse vont affecter de façon profonde l’ensemble des secteurs de la vie économique, mais aussi certains secteurs de la recherche.
La formation en big data en formation continue, offre une introduction aux meilleurs outils méthodologiques pour appréhender et exploiter les données massives,
Une immersion dans l’univers du Big Data à travers un parcours intensif portant sur les fondamentaux en sciences des données.
Date limite de candidature : mardi 21 février 2017

  • Dates :mai, juin, juillet 2017. Le vendredi et le samedi
  • Durée :18 jours (120 heures)
  • Pour qui :Profil technique ayant une expérience de programmation ou statistique
  • Lieu :Ecole polytechnique
  • Langue :Anglais
  • Certification :Conduire un projet de sciences de données (CNCP 1527)

Objectifs

  1. Comprendre et s’approprier les Data Sciences
  2. Appréhender les enjeux du Big Data
  3. Identifier et assimiler les outils et techniques pour résoudre des problèmes complexes d’analyse des données
  4. Découvrir comment les appliquer à ses missions professionnelles
  5. Assimiler les clés de compréhension pour interagir avec les spécialistes dans un cadre professionnel ou académique

Programme

Introduction à la big data :

  • L'Écosystème du big data,
  • Le cycle de vie d’un projet de données
  • La gestion de projet,
  • L'architecture informatique 
  • L'introduction au calcul distribué,
  • Les questions de confidentialité

Bases de données et outils big data :

  • SQL et NoSQL
  • Calcul distribué
  • Cloud computing
  • Map Reduce et Hadoop
  • HIVE/PIG
  • Spark

Prétraitement des donnés et visualisation :

  • Le nettoyage de données
  • La normalisation
  • La sélection et création des variables
  • La réduction de dimensions
  • L'exploration de données
  • La visualisation avec R et Python
  • La visualisation par navigateur, data mashup, data mungin
  • La conception et ingénierie des variables

Atelier Données - 1ère partie :

  • L'introduction au jeu de données et à l’objectif de l’atelier
  • L'exploration et sélection/ingénierie des variables

Analyse des données et apprentissage automatique :

  • L'introduction à l’apprentissage
  • L'apprentissage non supervisé
  • L'apprentissage supervisé
    • régression et sélection des variables
    • régression logistique
    • classification naïve bayésienne
    • algorithme des k-voisins les plus proches (KNN)
    • machines à vecteurs de support (SVM)
    • arbres de décision et réseaux de neurones
  • L'évaluation des modèles
  • Le surapprentissage
  • La sélection de modèles
  • Les méthodes d’ensemble

Apprentissage automatique pour les données non-traditionnelles :

  • Le filtrage collaboratif
  • Les fouilles du Web, de graphes et de textes
    • Web
    • graph
    • text mining recommandation
  • La personnalisation
  • La publicité sur le web et marketing
     

Atelier Données - 2ème partie :

  • Application des méthodes d’apprentissage automatique aux résultats de la première partie
  • Sélection de modèles et méthodes d’ensemble

La pédagogie :

  • des cours
  • des travaux personnels sous forme de projet
  • des études de cas pratiques
  • des témoignages d’industriels
  • des conférences de personnalités académiques travaillant sur cette thématique

Chaque participant est également invité à apporter son propre projet, afin d’en explorer le potentiel. Cet accompagnement particulier permettra à chaque participant de bénéficier de conseils personnalisés et de bâtir une stratégie qui correspond à ses propres besoins
Mini site de la formation

Intervenants

  1. Responsable pédagogique
    Erwan
    École polytechnique

    Professeur associé au département de mathématiques appliquées
    Découvrir sa bibliographie complète
     

  2. Responsable pédagogique
    Michalis
    Professeur au Laboratoire d'Informatique de l'École polytechnique (LIX)
  1. Intervenant(s)
    Stéphane
    Professeur Chargé de Cours, Centre de Mathématiques Appliquées, Ecole polytechnique
  2. Intervenant(s)
    Balázs
    Chercheur au Laboratoire de l'accélérateur linéaire (LAL) du CNRS et de la chaire du Centre Data Science de l'Université Paris-Saclay
  3. Intervenant(s)
    Eric
    Enseignant-chercheur en Statistique, département MASS et à la composante Rennes 2 de l'équipe de Statistique de l'IRMAR.
  4. Intervenant(s)
    Apostolos
    Laboratoire d'Informatique (LIX)
  5. Intervenant(s)
    Christos
    Chercheur Post-doctorant au Laboratoire d'Informatique de l'École polytechnique (LIX)
  6. Intervenant(s)
    Catuscia
    Directeur de Recherche à l'INRIA

Intéressé(e) par nos formations ?

Téléchargez nos catalogues
Sélectionnez le ou les catalogues.
Select the catalogs.
  1. Catalogue Complet
  2. Catalogue complet Brochures Programmes certifiants 2016
  3. Catalogue Programmes courts 2016
  4. Catalogue Programmes courts Communication, Leadership et Management
  5. Catalogue Programmes courts Innovation et Business
  6. Catalogue Programmes courts Projets Systèmes
  7. Catalogue Programmes courts Sciences et Techniques

Veuillez remplir le formulaire ci-dessous. Vous recevrez votre catalogue directement dans votre boite email.
Please fill out the form below to receive your Catalogue by email.

Télécharger / Download
Téléchargement de la plaquette / Download the booklet

    Veuillez remplir le formulaire ci-dessous. Vous recevrez votre catalogue directement dans votre boite email.
    Please fill out the form below to receive your Catalogue by email.

    Télécharger / Download

    Please fill out the form below to download the Application File.

    Download