Dataviz : quels outils pour quelles visualisations (Serge Courrier) - MAJ (11 sept. 2017)
1. DataViz
Quels outils pour quelles datavisualisations ?
Des outils simples aux plateformes intégrées
Serge Courrier | @secou + @RSSCircus | Créé le 02/12/2016 | Dernière mise à jour le 31/07/2017
2. Sommaire
Visualisation de données ou
infographie ?
1ère partie | Les outils
accessibles aux débutants
►Les logiciels bureautiques et leurs
extensions
►Les suites bureautiques en ligne
►Les outils simples, en ligne
2e partie | Les outils pour
utilisateurs aguerris
►Les librairies JavaScript
►Les générateurs de tableaux de
bord (dashboards)
►Les plateformes intégrées
►Visualisation de graphes
►[Focus] Visualisation de textes
Les défis du dataviz
►Choisir la bonne représentation
des données
►Choisir le bon outil pour une
visualisation donnée
►Accéder
►Nettoyer/préparer
►Filtrer
►Calculer
►Interpréter
►Ne pas faire mentir les données
Pour en savoir plus…
►Répertoires d’outils
►A lire…
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 2
4. Visualisation de données ou infographie ?
Une infographie… c’est plutôt :
favoriser la compréhension
d’une information que l’on
connait déjà en la représentant
sous forme graphique
un volume modeste
de données
une approche didactique
tournée vers autrui
une aide à la compréhension
Une dataviz… c’est plutôt :
faire émerger une information
que l’on ignorait en analysant
des données présentées sous
forme graphique
un gros volume de données
d’abord un outil de
connaissance pour soi-même
une aide à la décision
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 4
5. 1ère partie
Les outils accessibles aux débutants
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 5
8. Excel
Excel reste un des outils
de base de la visualisation
de données.
Nombre maximal de valeurs
dans une colonne :
►1 999 999 997
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 8
A lire : My Top 10 Data Visualization Excel Websites
9. Excel 2016
Excel 2016 dispose
de nouvelles fonctions
de cartographie
de l’information
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 9
Source : New mapping tools on Excel 2016
3D-Mapping
Filled Map
10. Les compléments d’Excel
Office Store > Compléments
Excel > Visualisation
►Cartes Bing
►E2D3 (D3.js pour Excel)
►Geographic Heat Map
►GIGRAPH – Network Visualization
►modernCharts (2,49€)
►People Graph
►Plotly
►Power BI Tiles
►Radial Bar Chart
►SmartCharts (3,99€)
►SmartCharts for Excel (Task Pane)
►Timeline Chart (2,49€)
►XLMiner Data Visualization App
Voir aussi Office Store :
catégorie « Visualisation »
Ploty
SmartCharts
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 10
11. Les compléments d’Excel
Bing Maps
(add-in pour Excel)
►Elaboration rapide
de diagrammes à
secteurs.
Le placement des points sur la carte s’effectue
automatiquement.
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 11
12. Les compléments d’Excel
People Graph
(add-in pour Excel)
►Elaboration rapide
d’infographies
« humaines »
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 12
15. Les extensions pour LibreOffice
GeOOo pour Draw et Calc
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 15
16. Les suites bureautiques en ligne
Intérêt : élaboration de visualisations collaboratives, interactives,
dynamiques, partageables et intégrables
Limites : confidentialité, paramétrages souvent limités
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 16
18. Diagrammes et cartographies avec Google Sheets
Google Sheets
►Choix correct,
mais réglages
limités
►Possibilité de
publier la
visualisation en
l’intégrant à un
site/article Web
(via un code
d’intégration
HTML
[embedding
code])
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 18
19. Les suggestions de Google Sheets
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 19
Sans même sélectionner le tableau, un clic sur
le bouton « Explorer » fait apparaître un volet
de suggestion automatisée. L’analyse s’effectue
par machine learning.
20. Les extensions de Google Drive
Table de fusion Google
►A partir de gros volumes de
données, génère des tableaux,
graphe, cartes.
►Particulièrement adapté à la mise
en forme de données
géolocalisées. La détection des
colonnes contenant les
coordonnées GPS se fait – dans la
plupart des cas –
automatiquement.
►Les « étiquettes » (voir copie
d’écran ci-contre) sont générées à
partir du contenu des autres
colonnes et sont personnalisables.
Il est même possible d’y associer
des images si une colonne
contient l’adresse (URL) d’images
déjà hébergées.
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 20
21. Les extensions de Google Drive
Slemma
►Création de cartes, diagrammes,
tableaux de bord.
►Connexion possible à…
•Google Drive,
•Dropbox,
•MySQL,
•PostgreSQL,
•Amazon Redshift
•et d'autres bases de données
►Création des tableaux de bord
dynamiques
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 21
22. Autres extensions pour Google Drive
GeoJSON Map Viewer with
Drive
►Visualiser des données GeoJSON
KML, KMZ Viewer with Drive
►Visualisation de données
géolocalisées
Mapper
►Visualiser des données GeoJSON
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 22
24. Excel en ligne
Tous les modèles de graphiques
présents dans Excel ne sont pas
disponibles sur Excel Online.
En revanche, tous les
compléments Excel sont
compatibles avec Excel Online.
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 24
25. Les outils simples, en ligne
Intérêt : élaboration de visualisations interactives, partageables,
intégrables, parfois dynamiques
Limites : nombre de réalisations assez faible dans les versions
gratuites
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 25
26. Des outils accessibles en ligne
}Diagrammes
Edition de diagrammes
►[+++] Infogr.am
►ChartBlocks
►DataWrapper
►Plotly
►Venngage
Infogr.am
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 26
27. Des outils accessibles en ligne
}Cartographies (cartes choroplèthes, dot maps)
Edition de cartographies,
de styles variés : cartes
choroplèthes (ci-contre),
symboles gradués,
► [+++] Infogr.am (dans la version
gratuite, uniquement carte des
Etats-unis et du monde)
► DataWrapper
► Khartis (Science Po)
► Magrit (CNRS)
•Nécessite des fonds de carte au
format Shapefile, GeoJSON,
TopoJSON, kml, gml ou csv
(contenant des colonnes x/y ou
geometry)
► TargetMap
► Venngage
► Vizualize.me
A voir aussi…
► Google Sheets
Venngage (exemple de carte choroplète)
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 27
A lire : A propos de la symbolisation des couches pour représenter une quantité (ArcMap)
28. Des outils accessibles en ligne
}Cartographies (« géoplacement », « géosignalement », itinéraires)
Des services permettent
de placer des points sur
une carte pour signaler
des éléments, voir
réaliser des itinéraires.
►Click2Map
►Google MyMaps
►uMap (OPenStreetMap)
uMap
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 28
29. Des outils accessibles en ligne
}Infographies
Edition d’infographies
►[+++] Easel.ly
►[+++] Piktochart
►Infogr.am
►Venngage
►Visme
►Visua.ly
►Vizualize.me
►Zanifesto
Easel.ly
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 29
30. Des outils accessibles en ligne
}Timelines
Timeline JS3 (modèle à
utiliser aussi dans Google
Drive)
TimeLine Storyteller
(service gratuit en ligne
de Microft disponible en
open source)
Et aussi…
►[+++] TimelineJS
►Frise chronologique
►Line.Do
►MyHisto
►TikiTolki
►TimeGlider
►TimelineSetter
►TimeMapper
►Timetoast
►Tline
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 30
Timeline JS
TimeLine StoryTeller
31. 2e partie
Les outils pour utilisateurs aguerris
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 31
32. Les librairies JavaScript
Intérêt : grand choix de visualisations, compatibles avec un usage
Intranet
Limites : nécessité de « programmer » les visualisations « à la main »
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 32
33. Les librairies JavaScript
[+++] D3JS
► Existe sous forme d’extensions
pour CMS, par exemple : Wp-D3
pour WordPress
► RAWGraphs : interface utilisateur
en ligne (disponible aussi en
version téléchargeable, à
installer sur son propre serveur).
Attention, toutes les
visualisations ne sont pas
« chargées » par défaut. Il faudra
les installer en fonction de ses
besoins.
Charts.js
► Hohli porpose une interface
permettant d’éditer facilement
des visualisations basées sur
Charts.js : Charts Builder.
FusionCharts
HighCharts
Google Charts
Polymaps
Plotly
Vega-Lite
ZingChart
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 33
34. Les générateurs de tableaux de bord
(dashboards)
Intérêt : données internes ou externes, statiques ou dynamiques
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 34
35. Google Data Studio
Google Data Studio
►Service gratuit depuis
le 2 février 2017
►Nombre de sources
de données illimitées
►Sources de données
•Fichiers
•Adwords
•Attribution 360
•BigQuery
•Cloud SQL
•DCM
•Google Analytics
•Google Sheets
•MySQL
•PostgreSQL
•Search Console
•YouTube Analytics
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 35
36. Des dashboards orientés « datastorytelling »
Toucan Toco
►Un service visant à associer
éditorial et datavisualisations.
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 36
37. Autres générateurs de Tableaux de bord en ligne
Infogr.am
Datadeck
DataHero
Looker
Matlo
Slemma
Zohoo Reports
Looker
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 37
38. Générateurs de dashboards logiciels et serveurs
Visualsr
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 38
40. La raison d’être des plateformes intégrées
Extraction ponctuelle
ou dynamique d’informations
issues de…
►fichiers
►bases de données
►services Web
Module de nettoyage
des données
Fonction de filtrage
Fonction de traitement
(par formules de calcul)
Aide au choix et à la conception
de datavisualisations
Data discovery
(aide à l’analyse des données)
Partage personnalisé
des résultats
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 40
41. Comparaison des plateformes
Source : Gartner - Magic Quadrant for
Business Intelligence and Analytics Platforms
(février 2016)
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 41
43. Tableau
L’écosystème
► Tableau Desktop
► Tableau Server
► Tableau Online
► Tableau Public
(logiciel gratuit)
•Le nombre de lignes
de la source de données
est limité à 10 millions
par visualisation
•1000 lignes maximum
•Les visualisations
sauvegardées sont publiques
•L'espace maximum pour
toutes les visualisations (avec
leurs données)
est de 10 Go
► Tableau Reader (lecteur de
visualisations créées par
Tableau, gratuit)
► Analyses intégrées (pour
intégrer les technologies de
Tableau dans d’autres
services)
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 43
45. Microsoft Power BI
L’écosystème
►Power BI Services (Saas)
►Power BI desktop (logiciel)
•Gratuit jusqu’à 1 Go par utilisateur
(pas de collaboration).
•Tarification
►Power BI Mobile (connexion depuis
des mobiles)
►Power BI Publish to Web (partage
de visualisations en ligne)
•Exemple : The EGPAF Data
Dashboard
►Power BI Embedded (pour intégrer
les technologies de Power BI dans
d’autres services)
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 45
49. Un graphe ?
Ensemble de points nommés
nœuds reliés par des traits ou
des flèches nommées arêtes.
Les arêtes (et par extension les
graphes) peuvent être…
►orientées (flèches)
►ou non orientées (traits)
Chaque nœud peut être associé
à plusieurs attributs.
Chaque arête peut être
associée à un poids constituant
ainsi un graphe pondéré
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 49
51. NodeXL
Modèle Excel (Windows)
spécialisé dans l’analyse
des graphes
►NodeXL (open source,
gratuit)
►NodeXL Pro
(de 29 à 749 $/an)
Social Network Importer
for NodeXL : extension
pour NodeXL destinée à
l’analyse des réseaux
sociaux
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 51
53. Gephi
Gephi : outil open source
et gratuit de visualisation
et d’exploration de
graphes et de réseaux.
Analyse des relations entre les personnages du roman
Les Misérables (avec mise en évidence des pro
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 53
56. Générateurs de nuages de mots
[+++] Wordle
►gère notamment des textes en
anglais et en français
►Supprime les mots communs
(articles, conjonctions de
coordination, etc.)
Et aussi
►TagCrowd
•gère notamment des textes en
anglais et en français
►Tagul
►Tagxedo
•Gère exclusivement des textes en
anglais.
►Timdream
•Ne gère que les textes en anglais
•Permet de traiter non seulement des
textes par copier/coller mais aussi
des comptes twitter, Google+,
Tumblr, Worpress, Blogger, etc.
►WordSalad
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 56
Attention, aucune des solutions
ci-contre ne gère
les groupes nominaux
58. Tropes (PC)
58
Accueil – Documentation - Téléchargement
Logiciel gratuit d’analyse de texte. Dernière mise à jour, septembre 2014.
Serge Courrier ►► Dataviz ►► Juillet 2017 ►►
Analyse des relations entre « Charles »
et « Emma » dans le texte de madame Bovary
59. Autres outils de text mining (gratuits)
AntConc
RapidMiner (extension Text Mining)
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 59
60. Autres outils de text mining (payants)
Alceste
Atlas.ti
Eptica Lingway (sémantique)
Hyperbase
Intellixir (brevets)
Le Sphinx
Lexico3
Luxid (Temis)
Matheo Analyser (brevets)
Mondeca (sémantique)
Nvivo
SAS TextMiner
Sinequa (sémantique)
SPAD
WordMapper
60Serge Courrier ►► Dataviz ►► Juillet 2017 ►►
61. Les défis du dataviz
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 61
62. Choisir la bonne représentation
des données
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 62
63. Quel graphe pour quel usage ?
DataVizCatalogue
►Excellent répertoire commenté
de visualisations
Chartopedia
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 63
Pas toujours simple de trouver la bonne représentation pour visualiser au mieux des données.
Les solutions de datavisualisation modernes suggèrent les modèles qui leur semble les plus
adaptées à la structure de données fournies par l’utilisateur. Des sites (voir ci-dessous)
permettent néanmoins d’accroitre sa culture visuelle. Des ouvrages de référence (voir à la fin de
cette présentation) permettront d’accroitre son acuité.
64. Choisir le bon outil
pour une visualisation donnée
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 64
65. Quel outil pour quelle datavisualisation
The Chartmaker Directory
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 65
Un projet intéressant listant les formes
de visualisations proposées par chaque outil
67. Bases de l’entreprise
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 67
Les solutions de datavisualisations évoluées ne s’arrêtent plus
aux seuls fichiers Excel. Elles peuvent se connecter à différents
types de bases de données.
68. Services Web
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 68
Les solutions de datavisualisation évoluées peuvent désormais se connecter
sur des services « cloud » comme ici pour Qlik.
69. Données ouvertes (open data)
Europe
►Portail des données ouvertes
de l’Union européenne
Pays
►Data.gov (Etats-Unis)
►Data.gov.uk (Royaume-Uni)
France
►Data.gouv.fr (France)
►Liste des Collectivités
ouvertes (sur Data.gouv.fr)
Liste de 2600 portails open data
dans le Monde
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 69
Gouvernements et organismes publics mondiaux multiplient la publication de leurs données sous
de multiples formats. Les licences d’exploitation sont de plus en plus souples.
71. Nettoyer les données (outils indépendants)
Gratuit
►OpenRefine
(ex-Google Refine)
►TriFacta : version
logicielle gratuite pour
MaOS et Windows
(ex-Data Wrangler)
Payant
►DataCleaner
►PrepJet (plugin Excel)
►TriFacta : version serveur
(ex-Data Wrangler)
OpenRefine
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 71
Les données mises à disposition sont rarement formatées avec soin. Il faudra souvent passer du
temps à les « nettoyer » pour servir de base à une bonne visualisation.
72. Préparer les données
Alteryx
Common Online Data Analysis
Platform
Dataiku
Datameer
Datawatch
Lavastorm
Platfora
Paxata
RapidMiner Studio
SAP BusinessObjects Lumira
Tamr
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 72
74. Filtres
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 74
Les fichiers de données sont de plus en plus imposants. Il est devenu
indispensable de filtrer leur contenu.
76. Calculer
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 76
Les solutions de visualisation élaborées intègrent
désormais des modules de calcul, qui permettront
de mieux préparer les données.
78. Interpréter
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 78
Défi majeur de certaines datavisualisations… savoir les interpréter !
79. Ne pas faire mentir les données
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 79
80. Ne pas faire mentir les données
Les jeunes britanniques,
majoritairement contre le Brexit ?
En fait, les jeunes sont la tranche
d’âge qui a le moins voté
Source : Brexit : L’arnaque du “vote des jeunes”… (Les-Crises.fr, 28 juin 2016)
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 80
81. Ne pas faire mentir les données
Lettres blanches et grises de
l’association Pénombre
►Analyse critique de l’usage du
nombre dans le débat public
How to lie with statistics
►Darrell Huff, (1954) How to Lie
with Statistics (illust. I. Geis),
Norton, New York, ISBN 0-393-
31072-8
►Darrell Huff, (1991) How to Lie
with Statistics Penguin; New Ed
edition, ISBN 0-14-013629-0
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 81
82. Pour en savoir plus…
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 82
83. Répertoires d’outils
[+++] Datavisualization Tools
►Répertoire interactif de
solutions de datavisualsations
Datavisualization.ch
►Sélection d’outils de
dataviusalisation
Visualising Data – Ressources
BiVi visualisation tool
directory
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 83
84. Autres outils utiles
ColorBrewer2
►Palettes de couleurs utiles pour
réaliser des cartes chroroplèthes
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 84
85. A lire…
Jacques Bertin
►[++] Sémiologie graphique
Edward Tufte
►[+++] The visual display of quantitative information
►[++] Visual explanations
►[+] Envisioning information
Gemignani
►[+++] Data fluency
Egalement…
►Ma bibliothèque Dataviz de Frédéric Martinet
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 85
86. Serge Courrier : consultant et formateur indépendant (ex-journaliste)
Mail : s.courrier@gmail.com
Twitter : @SeCou + @RSSCircus
Linkedin : http://fr.linkedin.com/in/sergecourrier
Scoop.it : www.scoop.it/t/rss
Facebook : www.facebook.com/serge.courrier
Utiliser les fils RSS et Atom (2008)
En savoir plus…
Produire des fils RSS et Atom (2009)
En savoir plus…
Internet pour les journalistes (2004)
En savoir plus…
Le Web 2.0 en bibliothèques
Quels services ? Quels usages ? (2009)
(contribution à un ouvrage collectif dirigé
par Véronique Mesguich et Muriel Amar
En savoir plus…
Serge Courrier ►► Dataviz ►► Juillet 2017 ►► 86