CapCom13: CN4: Comment aborder l'ère du Big Data ?

1,773 views
1,598 views

Published on

L'analyse des données massives, autrement appelée Big Data, commence à toucher les collectivités et les acteurs publics. Quelles sont les formes et les opportunités offertes par ce nouveau phénomène ? Deux témoignages permettront de comprendre ce que peut apporter concrètement le Big Data. On en soulignera également les limites : des voix s'élèvent pour faire valoir la protection des données personnelles, une vraie responsabilité pour les acteurs publics.

Marc Cervennansky, Chef de projet numérique à la CU Bordeaux
Benjamin Teitgen, Responsable de la communication digitale de la ville de Besançon
Joël Rubino, Président ApiCube

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,773
On SlideShare
0
From Embeds
0
Number of Embeds
112
Actions
Shares
0
Downloads
41
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

CapCom13: CN4: Comment aborder l'ère du Big Data ?

  1. 1. 25e Forum de la communication publique et territoriale ! La Rochelle 10, 11 & 12 décembre! Carrefour numérique n°4! Comment aborder l'ère du Big Data ?! SESSION  ANIMÉE  PAR   –  Benjamin  Teitgen   –  Marc  Cervennansky   –  Joël  Rubino  
  2. 2. Agenda Big Data ? Exemples d’usage •  Etude 4G •  Incidents Trocadéro •  Empreinte Sociale Toulouse Q&R
  3. 3. Big Data «  La  Donnée  est  le   nouveau  Pétrole  »   Clive  Humby,  2006  
  4. 4. Big Data: Les 3V Volume Le  Volume  est  l’un  des  éléments  clés   dans  la  définiPon  du  Big  Data,  et  il  est   sans  doute  le  moins  important  des  trois   éléments…   Vitesse Variété La  Vitesse  évoque  la  rapidité  de   changement  des  données  et  la  rapidité   avec  laquelle  elle  doit  être  uPlisée  pour   créer  de  la  valeur.       La  Variété  fait  référence  aux  différents   types  de  données  et  de  fichiers  uPlisés   pour  une  analyse  exhausPve.   Exemples:  Vidéo,  texte,  images,   données  géo-­‐localisées,…    
  5. 5. Big Data: pour quoi faire ? Volume Vitesse Variété 12 5 100 Terabytes de Tweets créés chaque jour Millions de transactions par seconde Millions De cameras vidéo dans le monde Analyse du sentiment sur un produit Identifier la fraude potentielle Surveillance d’évènements 350 500 80% Milliards de lectures compteurs par an Prévision de la consommation électrique Millions d’appels téléphoniques enregistrés par jour Prévention des désabonnements Croissance Images, Vidéo, Documents Amélioration de la satisfaction client
  6. 6. Un univers digital en expansion INSIGHTS Depuis Adam et Eve jusqu’en 2011 90% des données publiques créées depuis le début de l’humanité et accessibles légalement ont été créées ces 2 dernières années (Source IBM) ACTIONS 90%   2012 - 2013 Explosion exponentielle de la quantité de données. Nous ne sommes qu’au début d’un phénomène d’ampleur. Focus sur la valeur pas sur la donnée
  7. 7. INSIGHTS Un univers digital en expansion Machines 75% des données actuellement disponibles sont générées par des humains (Source Cisco) Humains ACTIONS 75%   La multiplicité des objets connectés à internet va permettre de nouveaux usages Quels usages pour quel client / service dans un monde hyper connecté ?
  8. 8. Empreintes digitale Humaine 1  milliard  d’uPlisateurs,     3,2  milliards  de  «  Like  »  chaque  jour  en  2012   500  millions  d’uPlisateurs     400  Millions  de  tweets  par  jour  en  2012   4  milliards  d’heures  de  vidéos  vues  et  commentées  ou  «  likées  »  chaque  mois  
  9. 9. Toujours plus de données BLACKSOCKS:       RFID  Chaussedes     CommunicaPon  entre  chaque   chaussede  et  l’applicaPon  ‘the   Sock  Sorter  sur    iPhone  .     Permet  un  appairage  facile  ainsi   que  la  commande  de  nouvelles   paires  chausedes.  
  10. 10. Toujours plus de données VITALITY:       Pilulier  connecté     A  l’intérieur  du  couvercle,  une  puce   électronique    surveille  les  ouvertures  de   la  boite  à  pilules  et  envoi  un  signal  qui   sera  relayé  sur  votre  applicaPon  iphone   ou  celle  de  votre  infirmière  
  11. 11. Toujours plus de données SCENETAP:       Grace  à  une  applicaPon   disponible  sur  smartphone,   Scenetap  vous  permet  de   savoir,  à  distance,    combien  de   personnes  sont  présentes,  le   raPo  hommes  /  femmes    et   l’âge  moyen.    
  12. 12. Toujours plus de données GOOGLECAR     Voiture  sans  conducteur     «  Nous  analysons  et  prédisons  le  monde   20  fois  par  seconde  »     Levandowski,  Google    
  13. 13. Un univers digital en expansion INSIGHTS Données  analysées Actuellement, moins de 1% des données actuellement disponibles dans le monde sont analysées (Source EMC) Données non analysées ACTIONS +99%   Acquérir et stocker des données c’est bien utiliser ces données pour mieux connaître vos clients, prospects concurrents c’est mieux. Démarrez avec des questions pas avec des données
  14. 14. Subis Espace maitrisé: Communication institutionnelle Marque -> clients Site Corporate Publicité Espace semi-maitrisé: INSIGHTS Semi-Maitrisé Maitrisé Espaces de communication Modération du dialogue entre la marque et ses clients Page Facebook Blog Corporate S.A.V. Compte Twitter Chaine Youtube … Espace subi: Expression totalement libre et incontrôlée Sites Concurrents Presse en ligne Forum de discussions Instagram Tripadvisor Twitter Facebook Google …
  15. 15. Sémantique et sentiments Iden4fica4on  de  la  marque  «  La  grande  marche  »   Homme  marié  qui  parle   Iden4fica4on  du  temps   Iden4fica4on  du  lieu   …. « Hier soir, de passage par La Rochelle, j’ai diné à « La grande marche » avec mon épouse. Ce restaurant vaut le détour, mais la carte des vins n’est pas terrible »…. Opinion positive sur la marque Opinion négative sur le produit
  16. 16. Découvrir des usages Utilisation produit 1,5 milliards de sites analysés Nouvelle campagne Kraft a désiré savoir comment son produit était utilisé, en dehors des traditionnels toasts, sans lancer une étude de marché de plusieurs mois. 1,5 milliards de blogs, forums et autres sites de discussions ont été analysés afin de mieux comprendre les usages réels Cette étude a permis ainsi de découvrir que le produit était en réalité utilisé avec du fromage, de la tomate, mais aussi des sushis … Une campagne a été lancée à partir de ces « insights » et donnant à la marque une nouvelle vie.
  17. 17. Trocadero  
  18. 18. Surveillance   T wider   d es   é vénements   T rocadéro   AnPciper  des  débordements  liés  à  la  remise  du  trophée  des  champions  au  PSG.   •  48h  avant  la  remise  du  trophée   –  –  •  ObservaPon  et  confirmaPon     –  –  •  DétecPon  immédiate  des  premiers  messages  laissant  présager  des  débordements  potenPels.   Les  mots  «  zbeul  »  (bordel)  et  «  TweetLoc  »  (RDV)  sont  détectés  et  rajoutés  dans  le  champ   lexical  d’observaPon   Pendant  l’événement   –  –  •  Paramétrage  de  l’applicaPon  Livecatch  autour  d’un  champ  lexical  se  rapportant  à  l’événement.   Mot  clefs:  PSG,  Trophée,  Trocadéro,…   DétecPon  de  messages  et  de  photos  confirmant  les  troubles  et  l’idenPté  des  auteurs  (BouPque   PSG,  BouPque  Abercrombie  &  Fitch,  Echafaudage  Trocadéro,…)   Analyse  et  cartographie  des  différents  écosystèmes  en  présence  (Lynx  vs  Ultra  vs  CRS)   Après  l’événement   –  –  Remise  d’un  rapport  d’analyse  détaillé  des  événements  et  debrieffing     Surveillance  pro  acPve  du  match  PSG-­‐Brest  (semaine  suivante,     dernier  match  au  Parc  des  Princes)   18  
  19. 19. Avant et pendant les débordements  
  20. 20. Toulouse   M étropole:     +700   0 00   h abitants,   3 7   c ommunes,   4 60   k m²  
  21. 21. Toulouse   M étropole:     +700   0 00   h abitants,   3 7   c ommunes,   4 60   k m²   •  Stratégie:     –  Toulouse  Métropole  a  la  convicPon  que  les  Médias  Sociaux   doivent  être  le  fer  de  lance  de  sa  stratégie  de  communicaPon.   •  Problème:     –  Le  disposiPf  actuel  est  principalement  réacPf  sur  la  base  des   besoins  entrants  et  d’un  radar  arPsanal   –  Difficulté  à  écouter  des  flux  d’informaPon  en  dehors  des   médias  majeurs   –  IntervenPons  sur  requête  et  donc  pas  forcément   représentaPves  des  besoins  du  plus  grand  nombre   –  PriorisaPon  des  contenus  éditoriaux  à  créer  et  améliorer   –  Difficulté  à  détecter  les  sujets  émergents  avant  qu’ils  ne   deviennent  majeurs   –  Incapacité  à  prévenir  d’éventuelles  crises  
  22. 22. Smarter  Analysis:  Ecouter  les  Toulousains  pour  mieux  les  servir   •  Les  équipes  d’Apicube  ont  développé  à  4tre  expérimental  un  modèle  de  données  qui   analyse  les  grandes  thémaPques  importantes  pour  la  ville,  comme  les  transports,  la   sécurité  ou  la  culture.   •  Plus  d’1,6  millions  de  documents  ont  servi  de  base  à  la  1ère  analyse,  le  modèle  étant   maintenant  défini  et  opPmisé  il  pourrait  être  alimenté  en  conPnu  et  temps  réel,  au  fil   de  l’appariPon  de  nouvelles  données  et  servir  à  de  nouvelles  analyses.   •  Un  rapport  comprenant  des  synthèses  qualitaPves  et  quanPtaPves  sur  chaque  grand   thème  a  été  transmis  à  la  DirecPon  de  la  CommunicaPon  afin  d’adapter  leurs  acPons   sur  la  base  de  ces  informaPons,  améliorant  ainsi  l’efficacité  globale  de  leur  travail  et  du   service  aux  citoyens.   23  
  23. 23. ANALYSE SMA (Social Media Analytics) traite un large volume de données issues du web. La technologie sémantique traite et analyse les conversations selon un modèle prédéterminé. Ce modèle d’analyse a été paramétré afin de faire ressortir toutes les discussions autour de l’univers de la metropole Toulousaine en réduisant au maximum les conversations « polluantes » AXES D’ÉTUDE OUTILS METHODOLOGIE DE L’ETUDE L’étude analytique va croiser 3 dimensions: Types: Grandes Thématiques Concepts: Segmentation des thématiques principales (Bus, Metro, Tramway,…) Hotwords: Sujets transverses et non spécifiques à une des 4 marques (Ville, quartier, …)
  24. 24. Modèle analytique partiel de la ville de Toulouse
  25. 25. Ecouter pour mieux communiquer
  26. 26. Ecouter pour mieux communiquer
  27. 27. Ecouter pour mieux communiquer
  28. 28. Ecouter pour mieux communiquer
  29. 29. Pinterest
  30. 30. Avant / Après
  31. 31. Toulouse La sensation d’insécurité au centre des débats – 1/2 •  •  •  L‘affaire  Merah  a  maximisé  la  sensaPon  d’insécurité   Après  dépolluPon  du  modèle  on  retrouve  une   sensaPon  d‘insécurité  comparable  aux  autres   grandes  métropoles  Française  et  en  deçà  de   métropoles  telles  que  Paris/Marseille/Lyon.   En  bâPssant  le  modèle  de  données,  nous  avons  pu   constater  que  la  thémaPque  sécuritaire  est   écrasante  pour  les  Toulousains  qui  ressentent  la  ville   comme  peu  sûre.  (79.559  Documents,74%)   –  –  –  Pour  Toulouse  Métropole,  ce  senPment  est  un  réel  enjeux  car   le  besoin  de  sécurité  est  fondamental  pour  la  populaPon.   L’insécurité  a  une  influence  l’économie,  la  créaPon   d’entreprise,  la  natalité,  le  dynamisme  culturel,  la  santé,  etc...   En  analysant  les  informaPons  disponibles,  on  constate  une   prédominance  d’affaires  naPonales,  de  délinquance  ou  de   terrorisme,  qui  n’ont  pas  de  corrélaPon  directe  avec  Toulouse.   Toulouse  acquiert  une  visibilité  mondiale  sur  le  sujet  et  un   matraquage  médiaPque  quoPdien  s’abat  sur  les  habitants   pendant  plusieurs  mois.    
  32. 32. Toulouse La sensation d’insécurité au centre des débats – 1/2 •  En  géolocalisant  par  quarPer  les     expressions  des  Toulousains   –  Le  senPment  d’insécurité  est     globalement  homogène   –  Les  quarPers  pourtant  généralement     considérés  comme  «difficiles»,  ne  sont     pas  différents   •  Analyse  par    «  Media  Set  »  spécifique    (c.a.d.  par  typologies  de   sources  d’informaPon)   –  La  PQR,  principal  média  local,  traite  énormément  la  thémaPque  sécuritaire,  venant   indirectement  renforcer  la  percepPon  négaPve  de  la  populaPon.  
  33. 33. ElecPon   M unicipale   P aris   2 014  
  34. 34. 2014
  35. 35. Q  &  A   Joël  Rubino   CEO  Apicube     Mail:    joel@apicube.com    

×