Nos domaines de formation :

Formation Big Data, synthèse technique

4,3 / 5
Cours de synthèse
Durée : 2 jours
Réf : BAG
Prix  2018 : 1770 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis vérifiés
Programme

Ce cours de synthèse vous présentera les enjeux et les apports du Big Data ainsi que les technologies pour sa mise en œuvre. Vous apprendrez à gérer un projet de gestion de données massives depuis l'installation d'une plateforme Big Data, tout en passant par la gestion, l'analyse et la visualisation des données.

Objectifs pédagogiques

  • Découvrir les concepts clés du Big Data
  • Comprendre l'écosystème technologique d'un projet Big Data
  • Evaluer les techniques de gestion des flux de données massives
  • Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Découvrir les outils de Data Visualisation

Démonstration

Présenter la plateforme Hadoop et ses composants de base, utiliser un ETL pour gérer les données, créer des modèles d'analyse et dashboards.
PROGRAMME DE FORMATION

Comprendre les concepts clés et les enjeux du Big Data

  • Les origines du Big Data.
  • La valeur de la donnée : un changement d'importance.
  • La donnée en tant que matière première.
  • Les chiffres clés du marché dans le monde et en France.
  • Les enjeux du Big Data : ROI, organisation, confidentialité des données.

Démonstration
Présentation d'une architecture Big Data.

Technologies du Big Data

  • Architecture et composants de la plateforme Hadoop 2.
  • Les modes de stockage (NoSQL, HDFS).
  • Fonctionnement de MapReduce et Yarn...
  • Principales distributions Hadoop : Hortonworks, Cloudera, MapR...
  • Les technologies émergentes : Spark, Storm, Machine Learning Azure...
  • Démarche d'installation d'une plateforme Hadoop.
  • Présentation des technologies spécifiques pour le Big Data (Talend, Tableau, Qlikview...).

Démonstration
Installation d'une plateforme Big Data complète.

Traitement des données Big Data

  • Fonctionnement de Hadoop Distributed File System (HDFS).
  • Importer des données vers HDFS.
  • Traitement des données avec PIG.
  • Requêtes SQL avec HIVE.
  • Création de flux de données massives avec un ETL.

Démonstration
Implémentation de flux de données massives.

Méthodes d'analyse et traitements des données pour le Big Data

  • Les méthodes d'exploration.
  • Segmentation et classification.
  • Machine Learning, estimation et prédiction.
  • Le temps réel, l'IA.
  • L'implémentation des modèles.

Démonstration
Présentation de l'environnement Spark, Jupyter Notebook, R Notebook et Shiny. Mise en place d'analyses de Machine-Learning avec le langage R, Python et Scala.

Data Visualisation, représenter des données de façon visuelle

  • Principales solutions du marché.
  • Aller au-delà des rapports statiques.
  • La Data Visualisation et l'art de raconter des chiffres de manière créative et ludique.
  • Mesurer l'e-réputation, la notoriété d'une marque, l'expérience et la satisfaction clients...

Démonstration
Présentation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques.

Conclusion

  • Les conditions du succès.
  • Synthèse des meilleures pratiques.
  • Bibliographie.
Participants / Prérequis

» Participants

Dataminers, chargés d'études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle.

» Prérequis

Connaissances de base des modèles relationnels, des statistiques et des langages de programmation. Connaissances de base des concepts de la Business Intelligence.
Intra / sur-mesure
Programme standard     Programme sur-mesure
Oui / Non

Vos coordonnées

Avis vérifiés
picto avis vérifiés
Olivier M. 20/09/2018
3 / 5
Sujet trop vaste Trop de technique Sujet data science intéressant mais hors sujet dans la formation

Sami B. 20/09/2018
3 / 5
Trop de temps passé sur les éléments d'architecture (1 jour) Le formateur est passionné et connaît bien le sujet mais un peu brouillon et pas assez didactique Les slides ne sont pas de bonne qualité mais le support écrit l'est (bien que trop verbeux)

Thierry B. 20/09/2018
4 / 5
Difficulté de s'y Retrouver dans le plan de présentation vs le support. Ordre de présentation diffèrent et complexe à suivre

Thierry G. 20/09/2018
5 / 5
Bon mix entre concepts, technologies et cas d'utilisation.

Thierry D. 20/09/2018
5 / 5
Formateur très compétent

Charlotte H. 20/09/2018
5 / 5
Formateur très intéressant

Agathe G. 17/05/2018
4 / 5
Très bonne introduction et présentation outils et architecture. - Le sujet sur les méthodes / algorithmes de machine Learning est trop théorique pour moi - Absence de pratique pour les participants

Vincent D. 17/05/2018
4 / 5
Bien par contre le support devrait être imprimée en couleur pour une meilleur lisibilité des graphes/schémas et réactualisé !

Alan B. 17/05/2018
5 / 5
SUPER FORMATEUR !

DER V. 22/02/2018
4 / 5
Bonne vision d'ensemble des infrastructures big data. L'aspect interfaces BI n'est peut être pas assez traité. J'aurai aimé un meilleur aperçu des solutions telles que "Qlik, tall..

Paul J. 22/02/2018
5 / 5
Très bonne formation

Marc C. 07/12/2017
5 / 5
Contenu très riche nécessitant plus de temps pour apprendre plus sereinement tous les sujets.

Aymeric S. 07/12/2017
5 / 5
Très complet et formateur très compétent. Très claire.

Florent G. 07/12/2017
5 / 5
Le formateur connait très bien le sujet.

Emilie M. 07/12/2017
5 / 5
Bon apreçu sur l'architecture BIG DATA et application en Data Science.

Bruno C. 07/12/2017
5 / 5
Très bien. Idéal pour la mise en place d'un projet BIG DATA.
Avis client 4,3 / 5

Les avis client sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

Dates de sessions

Pour vous inscrire, cliquez sur la session qui vous intéresse.
[-]
PARIS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.
Filières métiers
Thème associé