ORSYS formation
NOUS CONTACTER - +33 (0)1 49 07 73 73
NOUS CONTACTER - 📞 +33 (0)1 49 07 73 73    espace pro ESPACE PRO     inscription formation orsys S'INSCRIRE     drapeau francais   drapeau anglais
Nos domaines de formation :
Toutes nos formations Big Data, NoSQL

Formation Big Data, méthodes et solutions pratiques pour l'analyse des données

4,4 / 5
Stage pratique
Best
Durée : 5 jours
Réf : BID
Prix  2019 : 3090 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Cycles certifiants
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis vérifiés
Programme

Ce stage vous permettra de comprendre les enjeux et les apports du Big Data ainsi que les technologies pour le mettre en œuvre. Vous apprendrez à intégrer des volumétries massives de données structurées et non structurées via un ETL, puis à les analyser grâce à des modèles statistiques et des dashboards dynamiques.

Objectifs pédagogiques

  • Comprendre les concepts et l'apport du Big Data par rapport aux enjeux métiers
  • Comprendre l'écosystème technologique nécessaire pour réaliser un projet Big Data
  • Acquérir les compétences techniques pour gérer des flux de données complexes, non structurés et massifs
  • Implémenter des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Appréhender un outil de data visualisation pour restituer des analyses dynamiques

Exercice

Mettre en place une plateforme Hadoop et ses composants de base, utiliser un ETL pour gérer les données, créer des modèles d'analyse et dashboards.
PROGRAMME DE FORMATION

Comprendre les concepts et les enjeux du Big Data

  • Origines et définition du Big Data.
  • Les chiffres clés du marché dans le monde et en France.
  • Les enjeux du Big Data : ROI, organisation, confidentialité des données.
  • Un exemple d'architecture Big Data.

Les technologies du Big Data

  • Description de l'architecture et des composants de la plateforme Hadoop.
  • Les modes de stockage (NoSQL, HDFS).
  • Principes de fonctionnement de MapReduce, Spark, Storm...
  • Principales distributions du marché (Hortonworks, Cloudera, MapR, Elastic Map Reduce, Biginsights).
  • Installer une plateforme Hadoop.
  • Les technologies du datascientist.
  • Présentation des technologies spécifiques pour le Big Data (Tableau, Talend, Qlikview ...).

Exercice
Installation d'une plateforme Big Data Hadoop (via Cloudera QuickStart ou autre).

Gérer les données structurées et non structurées

  • Principes de fonctionnement de Hadoop Distributed File System (HDFS).
  • Importer des données externes vers HDFS.
  • Réaliser des requêtes SQL avec HIVE.
  • Utiliser PIG pour traiter la donnée.
  • Le principe des ETL (Talend...).
  • Gestion de streaming de données massive (NIFI, Kafka, Spark, Storm...)

Exercice
Implémentation de flux de données massives.

Technique et méthodes Big data analytics

  • Machine Learning, une composante de l'intelligence artificielle.
  • Découvrir les trois familles : Régression, Classification et Clustering.
  • La préparation des données (data preparation, feature engineering).
  • Générer des modèles en R ou Python.
  • Ensemble Learning.
  • Découvrir les outils du marché : Jupyter Notebook, Dataïku, Amazon Machine Learning...

Exercice
Mise en place d'analyses avec une des outils étudiés.

Data visualisation et cas d'usage concrets

  • Définir le besoin de la data visualisation.
  • Analyse et visualisation des données.
  • Peut concerner tous les types de données dans la DataViz ?
  • Les outils DataViz du marché.

Exercice
Installation et utilisation d'un outil de Data Visualisation pour constituer des analyses dynamiques.

Conclusion

  • Ce qu'il faut retenir.
  • Synthèse des bonnes pratiques.
  • Bibliographie.
Cycles certifiants
Participants / Prérequis

» Participants

Dataminers, chargés d'études statistiques, développeurs, chefs de projet, consultants en informatique décisionnelle.

» Prérequis

Connaissances de base des modèles relationnels, des statistiques et des langages de programmation. Connaissances de base des concepts de la Business Intelligence.
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
Avis vérifiés
picto avis vérifiés
MAMOUR F. 23/09/2019
5 / 5
L'animateur a très bien maitrisé son sujet. Le stage a été dirigé avec beaucoup efficacité.

ECOBICHON 23/09/2019
5 / 5
dommage que le support de cours soit imprimé en noir & blanc et pas en couleurs

Alexandre F. 23/09/2019
3 / 5
Cours mal structuré un peu brouillon, on devrait poser les bases en premier lieu par exemple les définitions. Montrer en cours que des choses maitrisé dont on est sur de l'information et non des choses incertaines. On aborde beaucoup de sujet en les survolant, on devrait réduire le périmètre en maitrisant mieux ce que l'on voit au lieu de partir dans tous les sens. Prendre plus de temps pour les corrections des exercices. Le

dominique g. 23/09/2019
4 / 5
Stage un peu technique, difficulté au démarrage par rapport à la partie pratique de l'après midi dont la théorie n'était pas vue.

Olivier R. 23/09/2019
4 / 5
Pas toujours simple de régler les problèmes techniques (connexions entrés éléments notamment)

Svetlana R. 09/09/2019
3 / 5
RAS sur la pédagogie, mais le contenu ne corresponde pas bien à mes besoin. J'aurai voulu plus de concepts explicites, plus des définitions et de la théorie, des éléments de base avec les définitions claires, et passer moins de temps sur les solutions existantes et leurs comparaison. Pour les exos on n'apprends pas grand chose en recopiant le code et en suivant les instruction qu'on maîtrise pas. Mais il est peut-êt

Chanaud d. 09/09/2019
4 / 5
Peut-être améliorer l'équilibre entre les différents chapitres de la formation: approfondir Spark et délaisser HDFS par exemple

bazin e. 09/09/2019
4 / 5
Un peu trop technique pour moi qui ne suis pas un pro de LINUX et des installations de VM et autres softs ... A mon avis cette formation (ou une autre sur le même thème) mériterait d'approfondir plus l'approche fonctionnelle que l'approche technique

Yannick T. 09/09/2019
5 / 5
Bon équilibre entre présentation et exercice Bon apport de l'expérience du formateur, anecdote & co

Said R. 19/08/2019
4 / 5
Bonjour, Les informations sont souvent parfois en vrac Le formateur sait bien de quoi il parle mais reste à travailler la pédagogie dans la transmission de la connaissance Absence d'exemple en Java au même titre que python ou scala

COZ L. 19/08/2019
4 / 5
Contenu très orienté mathématiques/ scientifique + shell sur les premiers jours. Les exercices sur Jupyter/ Python/ Zeppelin étaient très intéressants, cela aurait été idéal d'en faire un peu plus. Contenu très intéressant et très dense.

GALL L. 19/08/2019
5 / 5
Cours au contenu très complet. Support de cours et documentation bien préparés et adaptés. Excellente animation par le formateur : beaucoup de pédagogie, réponses apportées aux questions, implication dans la formation.

Gerald B. 19/08/2019
5 / 5
Malgré mes carences techniques, le formateur a pris le temps et fait preuve de patience pour m'expliquer et démocratiser les termes et actions. => Le formateur est le vrai point fort de cette formation.

Fabrice C. 15/07/2019
4 / 5
Ensemble de la formation très orienté technique. Peu de temps pour appréhender les concepts.

Nan K. 15/07/2019
4 / 5
une vision globale sur différentes phase de big data et manipulation des différents outils pendant les TPs

Stéphane M. 15/07/2019
5 / 5
Contenu très condensé, intensif et très intéressant Formateur très pédagogue et clair dans ses explications

Christophe T. 15/07/2019
5 / 5
Difficile de tout voir en 5 jours mais très bien pour un data analyst/scientist n'ayant pas cotoyé les environnement distributé.

Amandine D. 01/07/2019
5 / 5
C'était top. Réponses à toutes les questions même problématique lié à notre environnement professionnel. NB : Pour Orsys la version papier du support très mal imprimé, illisible sur les parties claires, mais heureusement version électronique

RANDA B. 01/07/2019
5 / 5
Très bonne formation, satisfaite, formateurs très pédagogues.

STEPHANE L. 01/07/2019
5 / 5
Le contenu et la pédagogie sont au rendez vous ! La formation répond aux attentes.
Avis client 4,4 / 5

Les avis client sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
PARIS
[+]
AIX
[+]
ANGERS
[+]
BORDEAUX
[+]
BRUXELLES
[+]
DIJON
[+]
GENEVE
[+]
GRENOBLE
[+]
LILLE
[+]
LIMOGES
[+]
LUXEMBOURG
[+]
LYON
[+]
MONTPELLIER
[+]
NANCY
[+]
NANTES
[+]
NIORT
[+]
ORLEANS
[+]
REIMS
[+]
RENNES
[+]
ROUEN
[+]
SOPHIA-ANTIPOLIS
[+]
STRASBOURG
[+]
TOULON
[+]
TOULOUSE
[+]
TOURS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.
En poursuivant votre navigation, vous acceptez l’utilisation de cookies nous permettant de vous proposer des offres correspondant à vos centres d’intérêt.
En savoir plus sur l’usage des cookies…   ✖ Fermer
linkedin orsys
twitter orsys
it! orsys
instagram orsys
pinterest orsys
facebook orsys
youtube orsys