Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
by
(big)DATA?
Le Big Data est un concept qui s'est popularisé dès 2012 pour
signifier la croissance exponentielle des donn...
Upcoming SlideShare
Loading in …5
×

Infographie (Big?) Data - EnjoyDigitAll by BNP Paribas

16,517 views

Published on

Le Big Data est un concept qui s'est popularisé dès 2012 pour
signi er la croissance exponentielle des données (data) à traiter.
Ces mégadonnées dépassent l'intuition et les capacités humaines d'analyse. Elles nécessitent donc de nouveaux outils pour stocker, requêter, traiter et visualiser l'information.

Published in: Data & Analytics
  • Be the first to comment

Infographie (Big?) Data - EnjoyDigitAll by BNP Paribas

  1. 1. by (big)DATA? Le Big Data est un concept qui s'est popularisé dès 2012 pour signifier la croissance exponentielle des données (data) à traiter. Ces mégadonnées dépassent l'intuition et les capacités humaines d'analyse. Elles nécessitent donc de nouveaux outils pour stocker, requêter, traiter et visualiser l'information. Volume car les masses de données à traiter sont sans cesse croissantes. Vitesse car la collecte, l’analyse et l’exploitation des données doivent de plus en plus souvent se faire en temps réel. Valeur : il s'agit de se concentrer sur les données valables et actionnables. Véracité ou fiabilité, menacée par les comportements déclaratifs (formulaires), par la multiplication des formats de données et par l'activité des robots et faux profils. VOLUME VITESSE VARIÉTÉ VÉRACITÉ VALEUR On comprend souvent les dimensions du Big Data grâce aux 5V : Variété car les données sont de formes variées et pas toujours structurées (données relatives aux réseaux sociaux par exemple). 90% des données sont «non structurées» ÉVOLUTION DES FLUX DE DONNÉES les mystères de la data ? 2013 : 28 875Go/sec 2018 : 50000Go/sec 1992 : 100Go/jour 2002 : 100Go/sec 1997 : 100Go/heure WWW Données Structurées Les données structurées sont des informations organisées et classées en vue de faciliter leur lecture et leur traitement. Vos bases de données clients ou produits sont des données structurées. Date de naissance Adresse Points de fidélité Transactions NomMontants Les données semi-structurées constituent une forme intermédiaire. Elles ne sont pas organisées selon une méthode complexe rendant possible un accès et une analyse sophistiqués ; cependant, certaines informations peuvent leur être associées, telles que des balises de métadonnées, qui permettent l'adressage des éléments qu'elles renferment. Les données non structurées ne sont pas organisées dans un format qui permet d'y accéder et de les traiter facilement. En réalité, très peu de données sont complètement non structurées. Même des éléments souvent considérés comme non structurés, tels que des documents et images, sont structurés dans une certaine mesure. Un document Word est généralement considéré comme un ensemble de données non structurées. Données Semi/Non-Structurées Avis Produits Tweets Likes Images, etc... 90% DES DONNÉES AUJOURD’HUI DISPONIBLES ONT ÉTÉ CRÉÉES CES 2 DERNIÈRES ANNÉES ! 2000 20201970 L'analyse de données est la partie des Data Science qui décortique les données brutes en leur appliquant des algorithmes. Les analystes de données procèdent par inférence : partir de prémisses connus pour aller vers de nouvelles conclusions afin d'améliorer les systèmes et la prise de décision. ANALYTICS DATA QUE FAIRE DE TOUTES CES DONNÉES ? On peut distinguer, sans perdre la complexité des usages, deux grands potentiels : Lié à l’exploitation des informations collectées pour mieux comprendre une cible complexe (étude e-rep), créer des corpus d’informations pour améliorer les algorythmes d’IA... INFORMATIONINFORMATION Intelligence Artificielle INSIGHT & E-REPUTATION SEGMENTATION, PROFILING, TARGETING BIG DATA Lié à l’exploitation de la data pour l’amélioration des performances par ex. avec un tableau de pilotage global (dashboard) ou en menant des actions spécifiques d’optimisation ! PERFORMANCEPERFORMANCE OPTIMISATION DASHBOARD (tracking ROI, RTB programmatic...) DATA S C I E N C E D A T A Designed by by Sources : Definitions-Marketing.com, Le Big Data au Quotidien - Vouchercloud.fr, « United Nations Population Division » - Organisation des Nation Unies, Lexique - Nordnet.com SimpliLearn.com, Wikipedia.fr, FlatIcon.com, « Données Semi-Struturées » - LeMagIT.fr

×