« Automatique, robotique, informatique »
ARF015

Panorama de l’univers big data & cloud computing

Motivation, présentation et applications

Dimitri BETTEBGHOR : Responsable de l’industrialisation de projets IA, Schneider Electric

2020 € HT*

Session 1

Programmé
Lieu : PARIS

7 au 9 Avril 2026

distanciel-jpg.jpg

Distanciel synchrone
Possible sur demande

3 jours (18 heures)

But

Cette formation a pour but de présenter et d’introduire les notions fondamentales de l’écosystème Big Data et du Cloud Computing et de leurs applications en science des données. Plus qu’un ensemble cohérent d’outils et de frameworks, cet écosystème répond essentiellement à des besoins de traitement et d’exploitation de données volumineuses et variées. Par ailleurs, la plateforme Cloud facilite l’accès à cet écosystème. La formation a donc pour objectif de présenter et d’illustrer les notions communes au Big Data, Cloud Computing et science des données.

Esprit Général

Les termes de Big Data, Data Science et Cloud sont désormais incontournables dans de nombreuses organisations. Bien qu’initialement promu par le secteur du Web, ces problématiques envahissent tous les secteurs, y compris l’aéronautique et défense. L’objet de cette courte introduction est de définir, préciser, illustrer et appliquer les notions propres au monde du Big Data ainsi que la myriade de services associées au Cloud Computing. On s’attachera à évaluer la pertinence de ces approches dans le contexte spécifique du monde aéronautique et/ou défense. En effet, loin de former un ensemble unifié, les outils et méthodes de cet univers s’appuient sur un socle de nouveaux usages informatiques accompagnant les diverses transitions numériques que connaissent les entreprises. Quelles sont les situations propres au Big Data ? Quels outils ? Pour quoi faire ? Qu’est-ce que le cloud Computing ? Cette formation tâchera de répondre à toutes ces questions et d’illustrer via des séances machines certains de ces outils. L’objet principal de la formation est de proposer une acculturation à tout l’écosystème Big Data/Cloud/Data Science afin de fournir aux stagiaires tous les moyens de décider d’investir plus en avant dans ses technologies.

Prérequis

Niveau de stage : Base / Perfectionnement
Formation ingénieur ou équivalent. Bases en systèmes informatiques (bases de données, génie logiciel, système GNU/Linux).

Durée et emploi du temps

Le stage dure 3 jours (18 heures) et comporte 12 heures de présentation des notions de Big Data, Cloud et Data Science et 6 heures de mise en application avec une mise en pratique sur le cloud via des tutoriels permettant au stagiaire de mieux appréhender les outils essentiels. Un temps de réflexion sur les données des stagiaires est prévu. Stage en français, supports en anglais.

Sommaire

Jour 1 BIG DATA ET BASES DE DONNEES

  • _Big Data : origines, besoin et défis_
    • L’ère du Big Data, Contexte de l’émergence des outils Big Data
    • Comparaison avec l’organisation traditionnelle des données (Datawarehouse vs. Datalake)
    • La promesse de valeur des données
    • Données structurées vs. Non structurées
  • _Big Data dans l’organisation_
    • Conception des systèmes à l’ère du Big Data
    • La donnée comme liant entre les différents métiers
    • Conséquence sur l’organisation
    • Aspects juridiques de la donnée (GDPR)
  • _Introduction aux bases de données_
    • Bases relationnelles
    • Théorème CAP, Mouvement NoSQL
  • _Différentes solutions NoSQL_
    • Entrepôts clé : valeur (e.g Redis)
    • Bases Orientées Colonnes (e.g Cassandra), Bases Orientées Documents (e.g. MongoDB) , Bases Orientées Graphes (e.g Neo4j)
  • _Mise en pratique Python/Java_

Jour 2 BIG DATA ET ARCHITECTURE

  • _Framework Hadoop/HDFS_
    • Résilience, Tolérance aux pannes
    • Distribution et monitoring des processus
    • Pattern Map Reduce, Composants Hadoop
  • _Architectures streaming et hybrides_
    • Architecture Lambda, Architecture Kappa
  • _Outils du Big Data et Machine Learning_
    • Présentation de Apache Spark
    • SparkML
  • _Mise en pratique Spark (Python ou Java) sous Databricks_

Jour 3 CLOUD COMPUTING ET DEPLOIEMENT

  • _Fondamentaux du Cloud_
    • IaaS vs. SaaS vs. PaaS
    • Gouvernance et sécurité
  • _Présentation des offres cloud_
    • Azure, GCP, AWS
    • Cloud souverain ?
  • _Déploiement moderne_
    • Conteneurisation vs. Virtualisation
    • Docker, Orchestration avec Kubernetes
  • _Découverte de Docker et d’un cloud provider_

Les formations associées qui pourraient vous intéresser

Demande d'informations

Si vous souhaitez des informations à propos du stage. Vous pouvez utiliser le formulaire ci-dessous