Big data : la grenouille qui se voulait plus grosse que le bœuf

 

Pierre Bourguet

Spécialiste des technologies d’entrepôt de données, il analyse l’emballement médiatique suscité par les grands volumes d’information (big data). Ses deux prochains articles s’intéresseront à ce phénomène sous l’angle de Big buzz et de Big Brother.

 

La donnée aurait soudainement pris de l’ampleur. Elle serait devenue BIG, déclenchant une avalanche de conférences, de séminaires, d’articles… Mais que se cache-t-il réellement sous cette lame de fond ? Assiste-t-on à une transformation profonde ou à un simple ravalement de façade du discours des éditeurs de logiciels décisionnels et des fabricants de calculateurs à haute performance ?

Mon expérience de plus de quinze ans dans les projets d’entrepôt de données me conduit à la plus grande circonspection : ce secteur est tout ce qu’il y a de plus stable. Les grands noms de la place n’ont pas changé, qu’il s’appelle Terradata, Oracle, IBM ou SAP. Les domaines d’application non plus.
Pour produire de la connaissance, il faut continuer de sourcer, stocker et analyser des informations. Banquiers et assureurs continuent donc de brasser consciencieusement des millions de paramètres pour affiner leur évaluation du risque. Les opérateurs collectent des milliards de tickets de télécommunication pour facturer leurs clients. Le nucléaire simule des explosions, la météorologie anticipe averses et éclaircies, les pétroliers sondent les sols à la recherche d’hydrocarbures. Les grandes surfaces déchiffrent nos comportements de consommateur via nos tickets de caisse…

Mais tout cela existe depuis plus de vingt ans. Bref, sous le (faux) soleil du big data, rien de vraiment nouveau – hormis l’explosion des contenus propagés par Internet, que nous étudierons dans un prochain billet.
Pourquoi dès lors cet engouement subit, cette déferlante suscités par les grands volumes de données, puisque ceux-ci n’ont pas fondamentalement changé de nature ? La réponse est peut-être à chercher sur le « plateau » technologique où se trouvent les techniques de forage, de collecte, de stockage et d’analyse des données. Les bases relationnelles affichent quarante ans d’existence au compteur, les infocentres plus de vingt, les systèmes multidimensionnels plus de dix.

Seules les base de données vectorielles ont fait souffler un vent de nouveauté, en créant une façon plus compacte d’enregistrer des informations répétitives (par exemple, en remplaçant des prénoms par des numéros génériques dans des bases de contacts clients, les x milliers de Kevin ou de Marie disparaissant au profit de codes, ce qui allège mécaniquement la taille de la base et facilite son traitement directement dans la mémoire de l’ordinateur).

En écosystème solidaire, le petit monde de l’informatique (et des médias) s’agite depuis des mois pour donner corps à une réalité que l’on voudrait innovante et inéluctable, faisant de grands moulinets autour du big data telle la grenouille de la fable de la Fontaine voulant devenir aussi grosse que le bœuf. A défaut de révolution technologique, à l’exception notable de l’offre HANA de SAP, cette mécanique médiatique aura au moins réussi à engendrer un big buzz presque aussi massif que le nuage Internet. C’est justement sur le Net que s’activent des chasseurs de données peu scrupuleux que nous étudierons prochainement.


Nos formations et séminaires associées : 

Green Data Center
Data Mining
Construire un Data Warehouse

____________________________________________
Le blog des experts en informatique  – ORSYS Formation – Le blog informatique – www.orsys.fr

 


Cette entrée a été publiée dans Informatique, avec comme mot(s)-clef(s) , , , , , , , , , . Vous pouvez la mettre en favoris avec ce permalien.

Commentaires

2 réponses à Big data : la grenouille qui se voulait plus grosse que le bœuf

  1. pc maroc dit :

    Merci pour l’article , riche d’info :)

  2. Ping : Transformer « Big Brother » en grand frère citoyen | Le blog de la formation informatique

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*