Le BigData, aussi par et pour les PMEs par Stéphane Mouton | Liege Creative, 24.10.13

832 views

Published on

Le datamining n'est pas un domaine neuf : il est pratiqué par les grandes entreprises depuis de nombreuses années. Les outils d'analyse de données traditionnels nécessitent des compétences rares et des investissements informatiques importants qui les rendent hors de portée des petites entreprises. Des avancées technologiques récentes changent cependant la donne. Une nouvelle génération d'outils logiciels permet de mobiliser, à moindre coût, de grandes quantités de puissance de calcul et de stockage pour le traitement de données. Dans le même temps, des logiciels d'analyse plus faciles à appréhender et à la diffusion rapide (notamment grâce à l'Open Source) sont apparus.

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
832
On SlideShare
0
From Embeds
0
Number of Embeds
32
Actions
Shares
0
Downloads
18
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Le BigData, aussi par et pour les PMEs par Stéphane Mouton | Liege Creative, 24.10.13

  1. 1. Parole d’expert Le BigData, aussi par et pour les PMEs Stéphane MOUTON, CETIC Département Software and Services Technologies
  2. 2. Avec le soutien de :
  3. 3. LIEGE CREATIVE Le Big Data, aussi par et pour les PMEs Stéphane Mouton CETIC © CETIC – www.cetic.be 1
  4. 4. Résultats innovants Internet du Futur Qualité Logicielle Technologie Information Internet des Objets Méthodes & outils utilisables Communication 40 chercheurs 2001 Centre de recherche appliquée agréé © CETIC – www.cetic.be
  5. 5. Au début, les ressources étaient rares © CETIC – www.cetic.be
  6. 6. Des technologies adaptées à la rareté des ressources ANALYSE BI & VISUALISATION STOCKAGE (DATAWAREHOUSE) ACQUISITION & EXTRACTION DES DONNEES DONNÉES STRUCTURÉES © CETIC – www.cetic.be WORKFLOW PRE-TRAITEMENT & REQUETES
  7. 7. Puis le stockage est devenu abordable © CETIC – www.cetic.be
  8. 8. Le Big Data vient de l’Internet Amazon -> Données produits et clients Yahoo! -> Tracking et profilage utilisateurs Microsoft -> Stockage Facebook -> Données utilisateurs Twitter -> Messages LinkedIn -> Profils et liens entre utilisateurs Google -> A peu près tout ce qui est ci-dessus © CETIC – www.cetic.be
  9. 9. Mais tout le monde n’est pas Twitter, Facebook, … © CETIC – www.cetic.be
  10. 10. BigData: consensus autour d’une definition Volume Vitesse Variété (Valeur) (Véracité) (Visualisation) * *Ajoutez votre “V” ici © CETIC – www.cetic.be
  11. 11. Un concept relatif Volume: How big is big? Velocity: How fast is fast? Variety: How diverse is diverse? Valable maintenant et dans un futur proche … © CETIC – www.cetic.be
  12. 12. Un bond technologique Amazon -> Dynamo Yahoo! -> HBase, Hadoop Microsoft -> Azure Storage Facebook -> Cassandra -> HBASE Twitter -> Cassandra LinkedIn -> Voldemort Google -> BigTable ... © CETIC – www.cetic.be
  13. 13. De nouvelles technologies de bases de données © CETIC – www.cetic.be
  14. 14. Une pile logicielle Big Data BI & VISUALISATION ANALYSE SCALABILITÉ STOCKAGE WORKFLOW PRE-TRAITEMENT & REQUETES ACQUISITION & EXTRACTION DES DONNEES DONNÉES STRUCTURÉES DONNÉES NON STRUCTURÉES © CETIC – www.cetic.be
  15. 15. Scalabilité : distribution des calculs / traitements Input Entrée Split Séparer Chien Ane Serpent Map Appliquer Chien,1 Ane, 1 Serpent, 1 Chien Ane Serpent Chat Chat Serpent Chat Chat Serpent Chien Chat Ane Chat,1 Chat, 1 Serpent, 1 Chien Chat Ane Chien,1 Chat, 1 Ane, 1 Shuffle Mélanger Reduce Réduire Ane, 1 Ane, 1 Ane, 2 Chat, 1 Chat, 1 Chat, 3 Chat, 1 Ane, 2 Chat,3 Chien, 2 Serpent, 2 Chien, 1 Chien, 1 Chien, 2 Serpent, 1 Serpent, 1 Serpent, 2 1 machine maître, plusieurs machines esclaves © CETIC – www.cetic.be Final result Résultat final
  16. 16. Une autre manière d’analyser les données source : © CETIC – www.cetic.be
  17. 17. Et pour les PME ? © CETIC – www.cetic.be
  18. 18. Des outils plus abordables Source: O’Reilly © CETIC – www.cetic.be
  19. 19. Et le Cloud Computing ? •  Réduire les investissements •  Déployer sur le Cloud pour un paiement à l’utilisation •  Outils BigData prêts à l’emploi •  Plateforme : pour bâtir Exemple : Hadoop on Azure •  Service : pour analyser Exemple : Google BigQuery •  Pouvoir disposer de ressources informatiques importantes © CETIC – www.cetic.be
  20. 20. Opportunités du Big Data •  Améliorer les services existants •  Utiliser des données inexploitées pour améliorer les analyses et résultats •  Fournir les mêmes informations mais mieux (plus rapide, plus précis, moins cher, …) •  Développer de nouvelles activités •  Traiter des données produites par l’entreprise et éventuellement d’autres sources pour fournir de nouveaux services. Exemple : bookt.com service aux hôteliers © CETIC – www.cetic.be
  21. 21. Définir une stratégie BigData •  Passer en revue les données Sources, Flux, Valeur •  Evaluer l’utilisation de données peu ou semi structurées Textes, graphique, images, feuilles de calcul •  Choisir les technologies appropriées Choisir l’angle d’attaque technologique du problème Réaliser une preuve de concept •  Définir une utilisation business mesurable / évaluable •  Eviter de traiter la donnée pour la technologie •  Eviter les « décharge de données » •  Etude Wikibon : danger de retour sur investissement négatif © CETIC – www.cetic.be
  22. 22. Prêts ? © CETIC – www.cetic.be
  23. 23. Merci stephane.mouton@cetic.be www.cetic.be/stephane-mouton © CETIC – www.cetic.be

×