> formation Technologies numériques > formation Big Data, Intelligence Artificielle > formation Big Data, NoSQL > formation Big Data Analytics avec Python
Toutes nos formations Big Data, NoSQL

Formation Big Data Analytics avec Python
modélisation et représentation des données

4,4 / 5
Stage pratique
Best
Durée : 4 jours
Réf : BDA
Prix  2020 : 2580 € H.T.
Pauses et déjeuners offerts
  • Programme
  • Cycles certifiants
  • Participants / Prérequis
  • Intra / sur-mesure
  • avis vérifiés
Programme

Le Big Bata Analytics repose sur la maîtrise des techniques d'exploration de données fondamentales : statistiques descriptives, prédictives ou exploratoires. Ce stage pratique vous présentera des méthodes telles que les régressions et les ACP et vous apprendra à les mettre en œuvre avec le logiciel Python.

Objectifs pédagogiques

  • Comprendre le principe de la modélisation statistique
  • Choisir entre la régression et la classification en fonction du type de données
  • Évaluer les performances prédictives d'un algorithme
  • Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances

Travaux pratiques

Développement/réalisation d'analyses sur le logiciel Python, avec les modules pandas, NumPy, SciPy, MatPlotLib, seaborn, scikit-learn et statsmodels.
PROGRAMME DE FORMATION

Introduction à la modélisation

  • Introduction au langage Python.
  • Introduction au logiciel Jupiter Notebook.
  • Les étapes de construction d'un modèle.
  • Les algorithmes supervisés et non supervisés.
  • Le choix entre la régression et la classification.

Travaux pratiques
Installation de Python 3, d'Anaconda et de Jupiter Notebook.

Procédures d'évaluation de modèles

  • Les techniques de ré-échantillonnage en jeu d'apprentissage, de validation et de test.
  • Test de représentativité des données d'apprentissage.
  • Mesures de performance des modèles prédictifs.
  • Matrice de confusion, de coût et la courbe ROC et AUC.

Travaux pratiques
Mise en place d'échantillonnage de jeux de donnes. Effectuer des tests d'évaluations sur plusieurs modèles fournis.

Les algorithmes supervisés

  • Le principe de régression linéaire univariée.
  • La régression multivariée.
  • La régression polynomiale.
  • La régression régularisée.
  • Le Naive Bayes.
  • La régression logistique.

Travaux pratiques
Mise en œuvre des régressions et des classifications sur plusieurs types de données.

Les algorithmes non supervisés

  • Le clustering hiérarchique.
  • Le clustering non hiérarchique.
  • Les approches mixtes.

Travaux pratiques
Traitements de clustering non supervisés sur plusieurs jeux de données.

Analyse en composantes

  • Analyse en composantes principales.
  • Analyse factorielle des correspondances.
  • Analyse des correspondances multiples.
  • Analyse factorielle pour données mixtes.
  • Classification hiérarchique sur composantes principales.

Travaux pratiques
Mise en œuvre de la diminution du nombre des variables et identification des facteurs sous-jacents des dimensions associées à une variabilité importante.

Analyse de données textuelles

  • Collecte et prétraitement des données textuelles.
  • Extraction d'entités primaires, d'entités nommées et résolution référentielle.
  • Étiquetage grammatical, analyse syntaxique, analyse sémantique.
  • Lemmatisation.
  • Représentation vectorielle des textes.
  • Pondération TF-IDF.
  • Word2Vec.

Travaux pratiques
Explorer le contenu d'une base de textes en utilisant l'analyse sémantique latente.

Cycles certifiants
Participants / Prérequis

» Participants

Responsables Infocentre (Datamining, Marketing, Qualité...), utilisateurs et gestionnaires métiers de bases de données.

» Prérequis

Connaissances de base en statistiques ou avoir suivi le stages"Statistiques, maîtriser les fondamentaux" (Réf. STA). Connaissances de base en Python.
Intra / sur-mesure

Demande de devis intra-entreprise
(réponse sous 48h)

Vos coordonnées

En cochant cette case, j’atteste avoir lu et accepté les conditions liées à l’usage de mes données dans le cadre de la réglementation sur la protection des données à caractère personnel (RGPD).
Vous pouvez à tout moment modifier l’usage de vos données et exercer vos droits en envoyant un email à l’adresse rgpd@orsys.fr
En cochant cette case, j’accepte de recevoir les communications à vocation commerciale et promotionnelle de la part d’ORSYS Formation*
Vous pouvez à tout moment vous désinscrire en utilisant le lien de désabonnement inclus dans nos communications.
* Les participants inscrits à nos sessions de formation sont également susceptibles de recevoir nos communications avec la possibilité de se désabonner à tout moment.
Avis vérifiés
picto avis vérifiés
Julien J. 17/11/2020
5 / 5
Formateur très compétent sur le sujet et présentations dynamiques. Ce qui est dommage c'est que les approchent se résument souvent à devoir tester plusieurs combinaisons sans savoir à la fin pourquoi une méthode fonctionne mieux qu'une autre. Mais cela est lié à la thématique.

test 17/11/2020
5 / 5
Une planche ou deux de cartographie de tous ces outils (vue process par exemple) peut être intéressante: - ex: https://miro.medium.com/max/4360/1*PzzcJA-cwXQ8hwlpM4DwbA@2x.jpeg avec peut être un peu plus de détails (cas d'utilisation de chaque techno par exemple) L'objectif est de pouvoir raccrocher facilement à des cas métiers. Une planche de type "antisèche" peut être très intéressante pour p[eacu

Fontaine R. 17/11/2020
4 / 5
* trop théorique à mon gout (intéressant mais pas forcément à pousser aussi loin dans le cadre d'une formation courte en entreprise), j'aurai préféré une orientation plus pratique, plus simple en lien avec mon métier pour mieux appréhender les concepts (parfois codes Python trop complexes => difficulté à appréhender le code et les concepts de modèles) * formation pas assez longue (4

Damien C. 17/11/2020
5 / 5
Un programme chargé qui laisse peu de temps pour la pratique réelle mais cela n'est pas dérangeant car les notebooks sont clairs et les explications aussi.

Franck D. 17/11/2020
5 / 5
Excellent Formateur, capable d'expliquer simplement et très clairement des notions pourtant complexes ! Bravo !!

Audrey K. 17/11/2020
5 / 5
Formation qui donne un bon aperçu des méthodes existantes. TP a refaire chez soi au calme car programme très chargé

Bryan K. 17/11/2020
5 / 5
Très bien, juste une petite remarque peut être transmettre le modèle de données utilisé pendant la formation, avant celle-ci pour bien s'approprier les données avant.

Marianne D. 17/11/2020
5 / 5
Le contenu est très vaste, il faut s'accrocher. Néanmoins, les TP permettent d'assimiler plus facilement ce qui est vu pendant le cours et de saisir l'intérêt de chaque modèle. L'animateur est très clair, très bon pédagogue.

Marc D. 17/11/2020
5 / 5
Très bon contenu pédagogique, et très bonne maitrise du sujet par le formateur

Salhou D. 22/09/2020
4 / 5
Le contenu de la formation est très intéressant et très riche (trop ?). La difficulté : Il faut arriver assimiler la théorie de chacune des méthodes en parallèle à leur implémentation sous Python en même temps. Pourquoi ne pas découper la formation en deux parties : 1) Méthode de big data analytics 2) Implémentation Python des méthodes de bigdata analytics M

Pierre D. 22/09/2020
5 / 5
Très bon formateur et très bon cours avec un bon équilibre théorie/pratique et une bonne interaction entre les élèves et le formateur.

David R. 22/09/2020
5 / 5
Rythme très soutenu, un peu plus de temps aurait été bienvenu

Sebastien P. 22/09/2020
5 / 5
Un peu trop de temps passé sur des notions qui sont normalement un pré-requis à la formation (Python notamment).

Inpong L. 22/09/2020
4 / 5
Formateur ponctuel, très pédagogue et disponible. Maîtrise les outils de netmeeting.

THOMAS L. 22/09/2020
4 / 5
Contenu intéressant mais technique -> Vise un public averti. Beaucoup de sujets via un panorama -> J'aurais préféré moins de sujets mais plus de pratique. équilibre globalement OK. Bien d'avoir les solutions. Syntaxe librairie déroutante pour un novice. Exercices intéressants. Support très dense (beaucoup de slides), essayer de faire + concis avec des slides "techniques" permettant de creuser si besoin les fo

Romuald M. 22/09/2020
4 / 5
Le sujet est très vaste pour 4 jours de formation. Les notebooks sont de très bons outils pour combiner théorie et pratique, il faudrait que la formation se base plus sur ceux-ci et que le recours à une présentation type "powerpoint" soit plus ponctuelle.

Vincent C. 22/09/2020
5 / 5
formateur très compétent et bonne animation

Emmanuel B. 21/09/2020
5 / 5
Formateur très pédagogue

Stéphanie B. 21/09/2020
5 / 5
Bonne formation adaptée aux besoins initiaux.

Jérémy G. 15/09/2020
4 / 5
Fournir la version imprimée relative à aux transparents les plus récents
Avis client 4,4 / 5

Les avis client sont issus des feuilles d’évaluation de fin de formation. La note est calculée à partir de l’ensemble des avis datant de moins de 12 mois.

CLASSE A DISTANCE

En inter et en intra-entreprise
Inscrivez-vous ou contactez-nous !

Pour vous inscrire

Cliquez sur la ville, puis sur la date de votre choix.
[+]
CLASSE A DISTANCE
[+]
PARIS
[+]
AIX
[+]
ANGERS
[+]
BORDEAUX
[+]
BREST
[+]
BRUXELLES
[+]
CLERMONT-FERRAND
[+]
DIJON
[+]
GENEVE
[+]
GRENOBLE
[+]
LILLE
[+]
LIMOGES
[+]
LUXEMBOURG
[+]
LYON
[+]
MONTPELLIER
[+]
NANCY
[+]
NANTES
[+]
NIORT
[+]
ORLEANS
[+]
REIMS
[+]
RENNES
[+]
ROUEN
[+]
SOPHIA-ANTIPOLIS
[+]
STRASBOURG
[+]
TOULON
[+]
TOULOUSE
[+]
TOURS

Horaires

Les cours ont lieu de 9h à 12h30 et de 14h à 17h30.
Les participants sont accueillis à partir de 8h45.
Pour les stages pratiques de 4 ou 5 jours, les sessions se terminent à 15h30 le dernier jour.
Formations conseillées
Filières métiers
Thème associé