Quels sont les disciplines et les métiers de la data science ?
data science

À la croisée des mathématiques, de l’informatique et des technologies de l’information, La data science, ou science des données, est la collecte, la gestion et l’analyse de connaissances d’un ensemble de données. Face à l’augmentation du volume de données numériques, de nombreux métiers spécialisés dans la data science ont fait leur apparition dans des secteurs d’activités très variés.
➜ Data science ou la science des données
➜ Quelles sont les disciplines de la data science ?
➜ Quels sont les domaines d’application de la data science ?
➜ Quels sont les métiers de la data science ?
● Data scientist
● Data analyst
● Data manager
● Data engineer
Data science ou la science des données
La science des données a émergé avec l’apparition d’Internet et l’augmentation du volume de données numériques disponibles, dans des domaines très divers. Alors que le stockage et la conservation de ces données étaient les principales questions au départ, c’est maintenant les problématiques de leur exploitation et de leur analyse qui apparaissent comme des enjeux primordiaux. Les emplois engendrés par l’essor de ces nouvelles sciences des données nécessitent des compétences techniques et stratégiques pluridisciplinaires. Les étudiants en data science peuvent accéder à une large variété de métiers, aussi bien dans le domaine de la recherche, que dans les secteurs privés et publics.
Quelles sont les disciplines de la data science ?
La science des données, ou data science, est l’étude des données et de la manière dont nous pouvons en extraire des connaissances. Fondée sur des techniques et des théories émanant de plusieurs disciplines et champs d’expertise, elle utilise : les mathématiques, l’informatique (recours aux outils R et Python), les sciences statistiques et les probabilités, la data engineering, l’intelligence artificielle (IA), le machine learning et la programmation.
Quels sont les domaines d’application de la data science ?
Avec l’accumulation du volume des données disponibles dans un grand nombre de domaines, les nouvelles techniques de collecte et d’analyse sont présentes dans presque tous les secteurs d’activités économiques et de la recherche.
◆ Dans le secteur privé
La data science va améliorer l’exploitation, la protection et la valorisation des données. L’objectif pour les entreprises étant d’anticiper les évolutions du marché, développer leur secteur d’activité et mettre en place une stratégie de développement en fonction des tendances.
◆ Dans le secteur public
Dans les collectivités territoriales et les agences gouvernementales, la data science est utilisée pour produire et analyser des données et des statistiques en vue d’améliorer les politiques publiques.
◆ Dans le domaine de la recherche et les universités
La data science va permettre de produire, valoriser et mémoriser la connaissance.
La data science est utilisée dans des secteurs d’activités très variés. Citons les plus importants : l'aéronautique, l’automobile, les télécommunications, la finance, les moteurs de recherche, l’e-commerce, les médias, la médecine, etc.

Quels sont les métiers de la data science ?
Au cours de ces vingt dernières années, les entreprises ont pris conscience de l'intérêt d'analyser et d’exploiter les données. De nouveaux métiers ont vu le jour dans des univers très variés. Responsable de haut niveau dans de grands groupes industriels, conseiller technique dans des entreprises ou analyste dans des start-ups innovantes, le spécialiste de la data science peut occuper différents postes.
Les délimitations entre les attributions de ces nouveaux métiers de la donnée peuvent être parfois diverses, ou segmentées avec des dénominations particulières; mais quatre grands groupes de fonctions peuvent être identifiés :
● Data scientist
● Data analyst
● Data manager
● Data engineer
Data scientist
Le data scientist est le spécialiste de la data science. Au sein d’une équipe pluridisciplinaire, le data scientist a un rôle clé dans la valorisation et le partage des données. Il est chargé de la gestion de l’information et du traitement des données pour les transformer en informations exploitables. Ce travail d’analyse a pour objectif d’anticiper, d’améliorer et d’orienter les décisions stratégiques de l’entreprise. En analysant les données, le data scientist participe à l’amélioration des services et produits proposés aux employés, aux clients et aux usagers.
➜ Les principales missions du data scientist :
- Collaborer sur des projets d’analyse et de valorisation des données ;
- Définir une stratégie d’analyse des données digitales ;
- Explorer et décrire des volumes de données numériques issus de différentes sources ;
- Développer des modèles prédictifs ;
- Interpréter les résultats provenant des analyses statistiques ;
- Rédiger des rapports statistiques et proposer des solutions ;
- Développer des solutions d’analyse et des modèles de machine learning sur différents outils.
➜ Profil du data scientist :
Le data scientist doit avoir de solides connaissances en mathématiques et statistiques appliquées. Il se présente comme un expert dans le domaine de la data science, du big data et du machine learning. Il doit être polyvalent, curieux et autonome. Il fait preuve d’une très bonne maîtrise de l’anglais. Le data scientist possède également une grande capacité pour conceptualiser et résoudre des problèmes complexes. Au contact quotidien avec différents interlocuteurs en interne, il est doté d’une excellente capacité relationnelle.
Data analyst
Au sein d’une entreprise, le data analyst aide à la prise de décision en s’appuyant sur les méthodes et des outils développés en data science. Il crée, administre et modélise la base de données et s’assure de sa mise à jour régulière pour en faciliter l’exploitation. Il joue un rôle clé dans la coordination de l’ensemble des équipes pluridisciplinaires.
➜ Les missions du data analyst :
- Recueillir, traiter, analyser et restituer les données relatives à l’activité ;
- Contrôler la qualité des bases de données ;
- Concevoir et déployer des outils de pilotage ;
- Contribuer aux projets d’amélioration de la qualité des bases de données ;
- Collaborer et accompagner les équipes techniques pour définir les besoins et expliciter les résultats.
➜ Profil du data analyst :
Le data analyst maîtrise Python et ses librairies (Plotly, Matplotlib, Pandas), les tests et méthodes statistiques et le requêtage de base de données avec SQL. Idéalement, il maîtrise des outils de data visualisation (QuickSight) et possède des connaissances sur le concept du machine learning. Rigoureux et méthodique, le data analyst est reconnu pour ses excellentes facultés d’analyse avec les chiffres et ses capacités de synthèse. Il maîtrise l’anglais oral et écrit.
◆ Exemples de missions des spécialistes des données :
- Prédire des tendances du marché pour augmenter les ventes d’une entreprise en e-commerce ;
- Détecter des anomalies et des fraudes dans la cybersécurité ou pour des groupes bancaires ;
- Optimiser des itinéraires, en fonction du trafic et de la météo, dans le domaine de la logistique ;
- Organiser une campagne publicitaire.
Les offres de formation en data science & intelligence artificielle de l’école Polytechnique proposent de maîtriser les outils avancés et les méthodologies pour former des experts de l’univers des données.
Data manager
Le rôle du data manager - ou gestionnaire de données - est d'organiser l'acquisition de données pour l'entreprise, et de veiller leur qualité en garantissant leur conformité, leur accessibilité et leur facilité d'exploitation. Le data manager est amené à échanger avec des professionnels de la données - data scientists, data analysts - mais également avec d'autres fonctions de l'entreprise, rendant indispensable sa capacité de vulgarisation.
➜ Les missions du data manager :
- Structurer et valider les données de l'entreprise ;
- Définir et mettre en place les procédures et les stratégies qui contrôlent la façon dont l'entreprise collecte, stocke, exploite et utilise la donnée ;
- Convertir les données en modèles statistiques pour appuyer les prises de décision ;
➜ Profil du data manager :
Le data manager doit être à l'aise avec les mathématiques, les statistiques, l'algorithmie. Mais au-delà de ces bases scientifiques, c'est d'abord un poste de management et qui tend à évoluer de plus en plus vers la stratégie. Ainsi il doit faire preuve de clarté et d'un grand esprit de synthèse. Idéalement, il maîtrise des systèmes de gestion de bases de données (Apache Derby, DB2, Microsoft SQL server, DynamoDB, etc), les langages de requêtes de type SQL ou le langage d'interrogation de données (SQL,LDD, LMD, LCD, LID), les solutions de bases de données SQL (Taradata, SAS Base, OLAP, data warehousing, etc.), les framework de calcul massivement parallèle de données (Hadoop, Spark, Kafka). Il a également connaissance du CDISC et de la réglementation ICH. Il maîtrise l'anglais oral et écrit.
Data engineer
Le data engineer travaille dans des environnements multidisciplinaires en exploitant les données pour fournir un impact réel aux organisations dans le monde entier. Il influence les décisions stratégiques pour faire évoluer positivement les activités et améliorer les performances d’une entreprise. Il est chargé d’extraire, stocker, nettoyer et structurer des données numériques brutes afin de les enregistrer dans des bases de données structurées. Dans la pratique, le data engineer est chargé de la construction de l’infrastructure pour faciliter le travail du data scientist. Technicien de haut niveau, il travaille avec différents langages et outils spécifiques développés dans le big data comme Hardoop, Spark, Scala, Oracle, Cassandra, SQL, etc. Ses objectifs principaux sont d’acquérir, analyser et traiter des données provenant de sources et de systèmes multiples dans des plateformes de big data.
➜ Les missions du data engineer :
- Comprendre, évaluer et cartographier le paysage des données ;
- Concevoir des pipelines et des outils permettant de traiter des données de masse et construire des tableaux de modélisation ;
- Maintenir des normes de sécurité et de lisibilité de l’information des données ;
- Collaborer avec les data scientists pour cartographier les champs de données en fonction des hypothèses ;
- Préparer les données pour les utiliser dans leurs modèles analytiques avancés.
➜ Profil du data engineer :
Le data engineer possède des compétences avancées dans les langages Java, SQL, Python et Scala. Il maîtrise la communication orale et écrite en anglais pour travailler au sein d’équipes internationales. Le data engineer est rigoureux, autonome et passionné par la data ingénierie.