> formation Technologies numériques > formation Big Data, Intelligence Artificielle > formation Big Data, NoSQL > formation Flink, développer des applications pour le Big Data
Toutes nos formations Big Data, NoSQL

Formation Flink, développer des applications pour le Big Data

4 / 5
Stage pratique
Durée : 3 jours
Réf : FKB
Prix  2021 : 2240 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis vérifiés
Programme

Apache Flink est un nouvel outil de traitement de Big Data de quatrième génération qui change le paysage des technologies de traitement des données. Ce cours vous permettra d’utiliser Apache Flink pour développer des applications en Java en vue de traiter des flux massifs de données issues du Big Data en temps réel.

Objectifs pédagogiques

  • Maîtriser les concepts fondamentaux de Flink
  • Développer des applications à l'aide de DataSet et DataStream API
  • Traitement de données distribué avec Flink et Hadoop
  • Exploiter des données avec Table API
  • Avoir une première approche du machine learning

Travaux pratiques

Mise en pratique des notions vues en cours à l'aide du langage Java.
PROGRAMME DE FORMATION

Introduction à Apache Flink

  • Historique du framework.
  • Les différentes versions de Flink.
  • Comparaison avec l'environnement Apache Hadoop et Apache Spark.
  • Les différents modules de Flink.

Travaux pratiques
Installation et configuration de Flink. Exécution d'un premier exemple avec le comptage de mots.

Traitement de données à l'aide de l'API DataStream

  • Environnement d'exécution et sources de données.
  • Les transformations: Map, FlatMap, Filter, KeyBy, Reduce...
  • Les opérations sur des flux multiples : Union, Cogroup, Connect, Join, Iterate...
  • Les opérations sur Windows : Global, Tumbling, Sliding, Session...
  • Le partitionnement physique personnalisé, aléatoire, rééquilibrage et redimensionnement.
  • Les DataSink et les connecteurs : Kafka, Twitter, ElasticSerch...

Travaux pratiques
Consommation et manipulation de différents flux des données.

Traitement de données à l'aide de l'API Batch

  • Les différents types de sources de données.
  • Les transformations et agrégations.
  • L'écriture des données.
  • Les DataSink et les connecteurs : HDFS, S3, Avro, MongoDB.

Travaux pratiques
Manipulation de DataSets à partir de plusieurs sources de données.

Traitement de données à l'aide de l'API Table

  • Enregistrement et lecture des tables enregistrées.
  • Les opérateurs : sélection, filtre, jointure, orderBy...
  • Utiliser du SQL sur le flux de données.
  • Traitement des événements complexes.

Travaux pratiques
Mise en place d'une analyse avec SQL sur un flux de données.

API Flink Graph - Gelly

  • Qu'est-ce qu'un graphe ?
  • Les différentes opérations.
  • Créer des graphes.
  • Transformations de graphes.
  • Présentation de différents algorithmes.

Travaux pratiques
Manipulation de l'API travers différents exemples.

Déploiement de Flink

  • Flink sur YARN Configurations.
  • Lancement et arrêt d'un cluster.
  • Soumettre un travail à Flink.
  • Flink sur Google Cloud.
  • Flink sur AWS.

Travaux pratiques
Configurer un cluster multinœuds et déployer une application.

Participants / Prérequis

» Participants

Développeurs, architectes.

» Prérequis

Bonnes connaissances du langage Java.
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
Avis vérifiés
picto avis vérifiés
Nikolai V. 05/10/2020
3 / 5
Les exercices mal préparés. 80% de temps dépensé aux tâches qui ne concernent pas du sujet du cours. Le formateur maîtrise pas parfaitement l'outil qu'il enseigne.

Mouhamadou M. 05/10/2020
4 / 5
Formateur excellant avec une très bonne pédagogie par contre le nombre de jours accordés à la formation est trop petite pour faire plus de pratiques et de pouvoir échanger avec le formateur sur certaines cas.

Didier B. 05/10/2020
4 / 5
Beaucoup de contenu / exercices - peut être faut-il étaler la formation sur une semaine... Quelques points/sujets non praticables

Lonquer L. 05/10/2020
4 / 5
Manque de théorie sur le fonctionnement interne de Flink. De bonnes informations données sur la partie développement. Mais demanderait une suite d'exercices axées spécifiquement sur le traitement de données avec Flink, dans lequel nous n'aurions pas à installer ou gérer l'environnement Kafka ou autre. Super énergie de présentateur.

Nicolas M. 05/10/2020
5 / 5
Le cours est complet sur les aspects de Flink (Batch, Streaming...) cependant, la partie ML de Flink n'est pas très utile. Les exercices sont intéressants, il s'appui sur des cas concrets avec des API qui permettent de manipuler de vrais données. Les exercices Streaming aurait pu être plus longuement abordé avec des bonnes pratiques (création des classes, configuration, optimisation...). Des squelettes de code aurait fait gagner pour la configur

Didier F. 10/02/2020
5 / 5
J'ai beaucoup aimé ce stage et surtout le formateur, très gentil et accessible. Il aurait fallu plus de temps pour tout traiter.

HOCINE A. 10/02/2020
5 / 5
Très bonne appreciation

Xavier C. 10/02/2020
5 / 5
application pratique juste après la théorie
Avis client 4 / 5

Les avis client sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

CLASSE A DISTANCE

En inter et en intra-entreprise
Inscrivez-vous ou contactez-nous !

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
CLASSE A DISTANCE
[+]
PARIS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.
Filières métiers