Your SlideShare is downloading. ×
  • Like
Big Data : concepts, cas d'usage et tendances
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Now you can save presentations on your phone or tablet

Available for both IPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Big Data : concepts, cas d'usage et tendances

  • 3,218 views
Published

Présentation générales du Big Data et zoom sur des cas d'usage dans l'industrie et les services. …

Présentation générales du Big Data et zoom sur des cas d'usage dans l'industrie et les services.
Présentation réalisée à l'occasion de l'événement Big data de Niort du 20 mars 2014

Published in Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
3,218
On SlideShare
0
From Embeds
0
Number of Embeds
5

Actions

Shares
Downloads
159
Comments
0
Likes
4

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Big Data Tendances, perspectives et cas d’usage 20/03/2014 Jean-Michel Franco Directeur de l’innovation et des solutions jean-michel.franco@businessdecision.com Twitter : @jmichel_franco
  • 2. © 2 Définition 03/2014 Big Data Les challenges incluent la collecte, la curation, le stockage, l’enrichissement, le croisement, la partage, l’analyse et la visualisation. Le « Big Data » vise à tirer un avantage concurrentiel au travers de méthodes de collecte, d’analyse et d’exploitation des données qu’on ne pouvait utiliser jusqu’à présent du fait des contraintes économiques, fonctionnelles et techniques liées aux volumétries, à la vitesse de traitement et à la variété des données à considérer. Source “The 451 Group” & Gartner Source Wikipedia
  • 3. © 3 Le Big data : une cible mouvante… … mais qui désormais nous concerne tous 03/2014 Big Data 1950 1960 1970 1980 1990 2000 2010 100 Pétas 20 Pétas Assurances 600 MB Voyages 807 MB Transports 80 GB 40 Pétas 60 Pétas 1 Péta = 1.000.000.000.000.000 octets (1015) = 1.000.000 Giga octets = 1000 téra octets 80 Pétas Banque 450 GB Retail 180 TB Medias 100 PB Medias 25 PB
  • 4. © 4 Popularité Information disponible Notre enjeu : le principe de la longue traîne, appliqué à la gestion de l’information La gestion de l’information telle qu’on la connait - capital informationnel constitué sur la base des SI internes de l’entreprise - information exploitée transversalement uniquement en temps différé - information modélisée à priori La gestion de l’information telle qu’on la voudrait La gestion de l’information telle qu’on la connait + information générés par les humains + information gérée par les machines + information en « juste à temps » (vitesse) + information modélisable, assemblable, et extensible au fil de l’eau (élasticité) 03/2014 Big Data
  • 5. © 5 Exemple d’innovation dans la distribution: Au plus près du terrain et de la demande client La grande distribution a été pionnière dans la mise en œuvre de data warehouses d’entreprise, notamment pour l’analyse des données extraites des tickets de caisse. Mais il devient nécessaire de tirer encore plus de valeur de ces données, d’approfondir les capacités d’analyse et de les rendre « actionnables » . Gestion plus fine et dynamique des prix de vente Personnalisation des offres pour les programmes de fidélité Gestion proactive des fraudes Ajustement de l’offre et de la demande, par zone géographique Gestion du on line multi-canal (e-commerce, magasins, drive) 03/2014 Big Data
  • 6. © 6 • Passer d’une économie de l’attention à une économie de l’intention • Tester le bien fondé des offres, les remettre en cause en permanence • Offrir le même niveau de service au travers des canaux d’interaction • Mieux “maitriser” les recommandations associées aux hôtels du groupe et les interactions avec les promoteurs et détracteurs Exemple d’innovation dans le secteur de l’hôtellerie: recommandations temps réel Améliorer le taux de transformation (ROI en neuf mois) Capacité à tester les nouvelles offres, et de les retirer si peu efficaces Capacité d’écoute, de réactivité et d’ « influence » sur les promoteurs et détracteurs Fédération de la connaissance client pour s’adapter aux changements d’organisation et intégrer les médias sociaux Offre et communication personnalisée pour chaque client 03/2014 Big Data
  • 7. © 7 Exemple d’innovation dans les utilities : Le « Smart Watering » (*) Source : SIA conseil En France , 25% de l’eau injectée sur le réseau est perdue en fuites et fraudes ; Le manque à gagner pour les citoyens s’élève à 2,4 milliards d’euros par an. (*) Les canaux numériques et l’Internet des objets ouvrent de nouvelles opportunités pour collecter/exploiter les données, et les mettre à disposition de tous Informations en temps réel sur les débits et la qualité de l’eau Services à valeur ajoutée pour les consommateurs et les collectivités Détection au plus tôt des problèmes sur le réseau et en bout de chaine Engagement commun au principe de consommation responsable Automatisation du processus de collecte 03/2014 Big Data
  • 8. © 8 Exemple d’innovation dans le secteur des assurances : innover par de nouvelles offres Une start-up dédiée à l’assurance des exploitations agricoles face aux aléas du climat. La collecte d’un ensemble d’informations à un niveau très fin sur les températures, l’humidité, les précipitations… Des offres personnalisées pour chaque agriculture en fonction des spécificités de son exploitation et de son environnement Gestion des sinistres totalement dématérialisés : paiement automatisé en fonction des conditions Un potentiel de déploiement sans limites géographiques, permettant d’atteindre des marchés encore peu exploités 03/2014 Big Data
  • 9. © 9 Exemple d’innovation dans le secteur des assurances : gestion des fraudes Appliquer les principes du Scoring Crédit pour analyser les déclarations de sinistre. Exploitation des données non structurées pour mettre en exergue les incohérences dans les déclarations L’aide à la décision poussée sur le terrain au plus près des clients Taux de succès des investigations : de 50 à 85% 25% des dossiers sont réglés dès le première étape, contre 4% auparavant Le scoring influence la suite du processus et améliore son efficacité (aide à la décision « actionnable ») Le système est actif lors de la déclaration de sinistre, ce qui incite le client à renoncer à poursuivre s’il se sent suspecté 03/2014 Big Data
  • 10. © 10 Exemple d’innovation dans le secteur des utilities -> un « datalab » pour découvrir les données concurrence et les croiser avec les données internes Lyonnaise des Eaux est leader sur la qualité de l’eau et cherche à conforter son leadership en se dotant d’un outil de benchmark permettant l’analyse de ses performances et la comparaison avec les autres délégataires et régies. Récupérer des données publiques à partir de sources de données non structurées et externe au S.I (site web http://www.sante.gouv.fr) Création d’un « datalab » sur le cloud permettant à un « data scientist » de qualifier la qualité de données et de les rapprocher avec les données internes de l’entreprise 03/2014 Big Data
  • 11. © 11 Data Warehouse Systèmes transactionnels Systèmes décisionnels d’entreprise Big Data De la BI telle qu’on la connait au Big Data : à la recherche de la « longue traine » Exploiter et fédérer les données « non structurées » Documents, contenu numérique riche… Données publiques du web et réseaux sociaux Aller puiser la connaissance dans de nouvelles sources de données structurées Capteurs, Internet des objets Données externes Etendre les principes fondateurs des concepts du Data Warehouse et l’Information Management : Immédiateté Précision Agilité 03/2014 Big Data
  • 12. © 12 Big Data : pour qui, pour quoi ? Industrie • Produit comme un service • Qualité, innovation R&D • Maintenance préventive Assurance • Fraudes et risques • Recommandation client • Tarification à l’usage, personnalisation Secteur public • Services informationnels • Fraudes, abus • Sécurité publique • Personnalisation de la relation citoyen Distribution • Offres temps réel et service personnalisés • Optimisation de l’expérience magasin • Pricing dynamique Santé • Gestion des effets indésirables • Traitements personnalisés. • Amélioration des diagnostics Telecom • Parcours clients multi- canaux • Partage de données de géo localisation • Fraudes et analyse du comportement client Banques • Parcours clients multi- canaux • Fraude, anti blanchiment • Partage des données consommateurs pour personnalisation Transports, loisirs • Planification et gestion des evts liés à la logistique • Service client temps réel • Economie d’énergie • Pricing dynamique Produits gde conso. • Analyse de sentiments et retour produits • Relation personnalisée avec le consommateur • Produit comme un service 03/2014 Big Data Des arômes et ingrédients qui se déclinent dans tous les secteurs d’activité
  • 13. © 13 Le Big Data, appliqué au rôle d’étudiant, ça donnerait quoi ? http://www.knewton.com/platform/resources/ 03/2014 Big Data
  • 14. © 14 Le big data : avec quelles données ? Tous secteurs confondus Banque et services financiers 03/2014 Big Data
  • 15. © 15 Le big data : Pour quoi faire ? La relation client avant tout, puis l’efficacité des processus et l’innovation 0 10 20 30 40 50 60 Expérience client Efficacité des processus Innovation produit Marketing ciblé Réduction des coûts Gestion des risques Monétisation de l'information Governance et réglementations Sécurité Autres 03/2014 Big Data Sources : Gartner
  • 16. © 16 Si l’information devient un actif, alors il faut s’organiser et se spécialiser en conséquence 03/2014 Big Data Sources : R Casonato/Gartner : Addressing the Big Data Skills Crisis
  • 17. © 1703/2014 Big Data “Institutions are becoming naked, and if you're going to be naked … fitness is no longer optional. If you're going to be naked, you better get buff.” Vers un monde de plus en plus transparent… pour le meilleur et pour le pire Don Tapscott : four principles for the open world • Ne pas utiliser la donnée au- delà d’un périmètre bien délimité • Traitez les autres comme vous accepteriez d’être traités • Solliciter le consentement, partagez les résultats et les bénéfices avec vos partenaires Source : F Buytendijk Définir au plus tôt son éthique vis-à-vis du big data
  • 18. © 18 Quelles technologies pour le Big Data ? Sources : Ray Wang 03/2014 Big Data
  • 19. © 19 Appliances Bases de données analytiques In memory analytics In memory Extreme processing Moteurs de recherche NoSQL Zoom sur Les technologies de gestion des données (« stockage ») : la taille unique n’existe pas, la solution dépend des usages 03/2014 Big Data réinventer les principes fondateurs des bases de données Le Hardware à la rescousse du software Spécialiser la base de données à chaque cas d’usage Traiter l’information comme elle vient au fil de l’eau S’affranchir des contraintes mécaniques Appliquer les principes du net à l’informatique d’entreprise
  • 20. © 20 Appliances Bases de données analytiques In memory analytics In memory Extreme processing Moteurs de recherche No SQLExalead Endeca (Oracle) Data Explorer(IBM) Autonomy (HP) Teradata Pure Data (IBM) Exadata (Oracle) Vertica / Autonomy (HP) Paraccel (Actian) Sybase IQ (SAP) Infobright Bases Olap Streams (IBM) Times Ten (Oracle) Aleri et Hana (SAP) Teracota (Software AG) Streambase (Tibco) SQLServer 2014 (MS) Exalytics (Oracle) Hana (SAP) xVelocity (Microsoft) DB2 BLU (IBM) SAS LASR Analytic Server… Hadoop (IBM, MS, Oracle, Intel, Cloudera, Hortonworks), Mongo DB, Cassandra Lotus Domino Les technologies de gestion des données : exemple 03/2014 Big Data
  • 21. © 21 Appliances Bases de données analytiques In memory analytics In memory Extreme processing Moteurs de recherche NoSQL Volume Temps Réel (Vitesse) Variété Les technologies de gestion des données (« stockage ») : la taille unique n’existe pas, tout dépend des usages 03/2014 Big Data
  • 22. © 22 La technologie phare du Big Data Hadoop Distributed File System (HDFS) File Sharing & Data Protection Across Physical Servers MapReduce Distributed Computing Across Physical Servers Hadoop est un framework Java qui permet de constituer une plateforme Big Data complète  Adaptable sur des très gros volumes  Tolérant aux pannes  Open source  Hardware « banalisé » CORE HADOOP COMPONENTS 03/2014 Big Data
  • 23. © 23 Pourquoi Hadoop ? Source : P Russom – TDWI Best practices report ; Integrating Hadoop into BI & Data Warehousing 03/2014 Big Data
  • 24. © 24 Hadoop : freins et axes d’amélioration Source : P Russom – TDWI Best practices report ; Integrating Hadoop into BI & Data Warehousing 03/2014 Big Data
  • 25. © 25 Quelles évolutions pour Hadoop ? Intégrer le temps réel (Fast Data) • Base Colonne (Hbase) • Spark (in memory) • Storm-Yarn : • Calculs en temps réel sur les données • Gestion des données au fil de l’eau (streams) Faciliter les accès aux données structurées et l’interactivité avec SQL • Impala (Cloudera) • Drill (Mapr) • Stinger (Hortonworks) • Evolutions Hive, Hadapt Ecosytème « on top » autour de Hadoop • Intégration de données (Talend, Syncsort, Revelytix…) • Accès aux données (Datameer, Karmasphere…) • Data mining ( R, Weka ) 03/2014 Big Data
  • 26. © 26 Big Data Tendances, perspectives et cas d’usage 20/03/2014 Jean-Michel Franco Directeur de l’innovation et des solutions jean-michel.franco@businessdecision.com Twitter : @jmichel_franco
  • 27. © 27 Table ronde Big Data et industrie, services et retail 20/03/2014
  • 28. © 28 Table ronde : Big Data et industrie, services, retail Avec Denis Weiss DSI La poste Industrie Michael Lanotte Responsable R&D Itron Jérôme Cornillet Business Solutions Manager Sas Jean-Pierre Lartige Délégué Poitou Charentes Orange Baptiste Jouffroy Sales Manager Europe GE Intelligent Platforms Jean-Michel Franco Directeur Innovation Business & Decision 03/2014 Table ronde : Big Data et industrie
  • 29. © 29 Imagination at work. Baptiste Jouffroy 20 mars 2014 Big Data GE Intelligent Platforms 03/2014 Table ronde : Big Data et industrie (General Electric)
  • 30. © 30 Le Big Data pour l’Industrie De quoi s’agit-il? Equipements et Processus Temps réel Haute fréquence Température Pression Vitesse Jusquà la milliseconde Des Millions d’échantillons archivés plusieurs années Modélisation, Analyse Prédictive et Diagnostic Définition1 Type de données 2 Echantillonnage3 Archivage et Analyse Prédictive4 03/2014 Table ronde : Big Data et industrie (General Electric)
  • 31. © 31 Objectifs : Analogie Big Data  Google  Facebook  Amazon Que vont acheter les adolescents en Europe ? Mon compresseur opère-t-il dans de bonnes conditions ? Big Data Industriel  Machines  Capteurs  Temps Réel 03/2014 Table ronde : Big Data et industrie (General Electric)
  • 32. © 32 Le Big Data pour l’Industrie De quoi s’agit-il? 03/2014 Table ronde : Big Data et industrie (General Electric) Réduire les arrêts non programmés Améliorer la fiabilités des équipements Réduire les pertes de production Optimiser les coûts de maintenance
  • 33. © 33 Michaël Lanotte / Responsable R&D Itron v1.1 BIG DATA & COMPTEURS INTELLIGENTS 03/2014 Table ronde : Big Data et industrie (Itron)
  • 34. © 34 Vélocité s, min, h, jour Le contexte client Les compteurs communicants * = VolumeVariété Alarmes & Logs Profil de consommation Qualimétrie réseau Performance Index de facturation … 5 milliards / jour * Profil de consommation 10min sur 35M de compteurs 03/2014 Table ronde : Big Data et industrie (Itron)
  • 35. © 35 » Des centaines de produits sous test… …des milliers de lignes de LOG à la seconde » Une masse de données à transformer en informations utiles Analyser en temps réel Cas d’utilisation 1 – Indexer, rechercher & corréler des données non fonctionnelles (logs) Notre centre d’essai de performance & d’endurance Un outil d’analyse des logs Indexer Rechercher Corréler 03/2014 Table ronde : Big Data et industrie (Itron)
  • 36. © 36 » Expertise sur l’amélioration des performances de collecte terrain » Analyse de l’indicateur horaire de qualité des communications CPL • 1 site avec 280 compteurs sur 5 mois => 1.000.000 mesures Projet pilote dans le comptage communicant Mettre en valeur des données en masse Cas d’utilisation 2 – Qualité des communications CPL Utilisation d’une représentation graphique pour faciliter l’analyse » Suite à l’application de nouveaux paramètres optimisés • Pics moins nombreux & moins prononcés, meilleure performance (+ vert) Mai’12Jan’12 Changement paramètres le 20/03/12 03/2014 Table ronde : Big Data et industrie (Itron)
  • 37. © 37 Flux Vision Une solution Orange Data & Analytics Jean-Pierre Lartige - Orange 20 Mars 2014
  • 38. © 38 Une exploitation des données des mobiles totalement anonymes ! Mesure des flux de population Flux de véhicules sur les axes routiers Mouvements de foules sur des évènements Analyse des typologies de population Une version complètement adaptée au tourisme Au service du marketing et de la vente 03/2014 Table ronde : Big Data et industrie ( Orange)
  • 39. © 39 Cas d’usage pour un distributeur 03/2014 Table ronde : Big Data et industrie (Orange)
  • 40. © 40 Flux Vision : indicateurs statistiques permettant l'analyse de la mobilité d’une population ? ? ? ?  Zone : IRIS  Fréquentation (personnes différentes)  Fréquence  Durée de la présence  Tranche horaire  Lieu de résidence, lieu de travail  Origine / destination  Résidents / touristes  Profils socio-demo  Prédiction de trafic  Fréquentation indoor  Webservice France entière 03/2014 Table ronde : Big Data et industrie (Orange)
  • 41. © 41 Visualisation des données 03/2014 Table ronde : Big Data et industrie (Orange)
  • 42. © 42 Les + de Flux Vision fiabilité des résultats (volumes, événements réseaux) fraicheur des données (jursqu’au temps réel) personnalisation des rapports respect de la loi et de la vie privée des clients Orange une offre compétitive et complémentaire CNIL 1 2 3 4 5 03/2014 Table ronde : Big Data et industrie (Orange)