Successfully reported this slideshow.
Your SlideShare is downloading. ×

Prendre la data par le bon sens

Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Loading in …3
×

Check these out next

1 of 10 Ad

Prendre la data par le bon sens

Download to read offline

La data nous concerne tous, et les attentes sont considérables, partout dans l’entreprise. Mais elle n’a pas toujours tenu ses promesses.
Les conditions sont réunies pour généraliser ses usages et son adoption, en répondant à ces trois questions :
- Organisation : centraliser ou décentraliser la gestion des données ?
- Architecture : comment établir des fondations souples et pérennes ?
- Gouvernance : comment encadrer et susciter les usages et collaborations ?

La data nous concerne tous, et les attentes sont considérables, partout dans l’entreprise. Mais elle n’a pas toujours tenu ses promesses.
Les conditions sont réunies pour généraliser ses usages et son adoption, en répondant à ces trois questions :
- Organisation : centraliser ou décentraliser la gestion des données ?
- Architecture : comment établir des fondations souples et pérennes ?
- Gouvernance : comment encadrer et susciter les usages et collaborations ?

Advertisement
Advertisement

More Related Content

More from Jean-Michel Franco (20)

Recently uploaded (20)

Advertisement

Prendre la data par le bon sens

  1. 1. Jean-Michel Franco Consultant indépendant jmfranco@audacity.com
  2. 2. En route vers l’entreprise data-driven… … mais la route est longue 92,1% constatent des retours sur investissement 26,5% considèrent être “data-driven” Source : Data and AI Leadership Executive Survey 2022 – New Vantage Partners 73,7% ont nommé un CDO ou eqt
  3. 3. Définir les règles du jeu et instituer les contrôles pour assurer l’organisation, la protection et l’utilisation Rendre les données facilement accessibles, comprises, échangeables et réutilisables Encourager le partage, briser les silos, mettre la data au cœur de la transformation digitale Faciliter les collaborations et le travail des équipes data et des consommateurs Industrialiser les usages de la data de manière homogène, partout dans l’entreprise Les défis Démocratisation Accessibilité Fiabilité et Confiance Simplification Mise à l’échelle
  4. 4. Organisation/Etape 1 : Instaurer la discipline avec la « Data Office » Valoriser la data et l’analytique Diffuser la culture Définir la stratégie data Innover avec les données Développer les processus, plates-formes et savoir-faire Assurer la gouvernance et la protection de données Le bureau du Chief Data Officer
  5. 5. Organisation/Etape 2 : décentraliser les responsabilités (le data mesh) 65% considèrent que les domaines business n’ont pas de responsabilités sur les data 53% considèrent que les domaines business ont une culture data & IT insuffisantes Responsabilités par domaine Plate-forme self-service Gouvernance de données fédérée et automatisée Data en tant que produit @ Source The future of data architecture 2022 – BARC
  6. 6. L’architecture : privilégier le self-service, la flexibilité et la diversité des usages Sourcing et intégration de données Catalogage, et gestion des données de référence Gouvernanc e, privacy et sécurité Business Intelligence et analytique Qualité et observabilité Data lake Data warehouse Data Management & Opérations Données brutes Données organisées Données de référence Modèles analytiques
  7. 7. Définir un cadre pour la gouvernance et la qualité Objectifs 1 Méthodes Rôles Processus Technologies Culture Ré-utilisation Collaboration Crowdsourcing Communication Partage Ingestion Catalogage Préparation Analyse Supervision Gestion du cgt Qualité Référencement Mesure Impact Sécurité Privacy & conformité Intégration Gestion du patrimoine Consommateur Sponsor Responsable Steward Producteur Intégration Inspiré par « the path to modern data governance » par Dave Wells/Eckerson Gro Best Practices Policies Guides Code de conduite Cartographies 1 1 1 1 1
  8. 8. Que retenir de ces data days ? Retour d’expérience du groupe Latécoère 10:05 Un data catalog au sein du groupe Domofrance 11:00 Une architecture hybride pour Bouygues Construction 11:45 Data Mesh & Logical Data Fabric : l’intérêt des approches décentralisées 10:05 Supply Chain en temps réel pour les containers et wagons connectés 11:00 Illustration de l’Intelligence Active Avec Qlik 11:45
  9. 9. Questions et échanges ? KPC Data Day 2022, Paris
  10. 10. Jean-Michel Franco Consultant indépendant jmfranco@audacity.com

Editor's Notes

  • La data est devenue une discipline à part entière dans l’entreprise, au travers des organisations.
    Mais la route est longue, bien plus longue par exemple que celle qui nous accompagné vers la digitalisation/dématérialisation de nos vies personnelles et professionnelles.
    Car, dans le monde de la data, il n’y a pas eu ces Facebook, ces LinkedIn, ces Google, Zoom ou Slack qui ont imposé des nouvelles manières de travailler ou d’interagir.
    Pourtant, il y a eu une énorme montée en puissance des compétences, à tel point que le métier de consultant data figure dans le top 25 des métiers les plus recherchés en France selon LinkedIn. On a vu s’installer très tôt tout un écosystème de spécialistes, tant du côté des éditeurs que des cabinets de consultants et intégrateurs. L’innovation a été phénoménale, y compris en France et en Europe. D’ailleurs, je me faisais la réflexion en voyant les partenaires de ces data days : Denodo est né à la Corogne, Qlik à Lund, Talend et la dimension analytique de SAP à Puteaux, Data Galaxy à Lyon, et même Snowflake tient ses racines de deux thésards de l’Université Paris VI.
    L’innovation est donc portée de nos mains. Mais, jusqu’à preuve du contraire, il n’y a pas la place pour une solution universelle dans le domaine de la data. Et ce n’est pas souhaitable, car cela reviendrait à créer un nouveau silo, alors que l’on sait que les silos détruisent la valeur de la data.

    Réussir son initiative data c’est donc savoir s’approprier cet écosystème pour mettre en place un système sociotechnique spécifique à votre entreprise. La définition d’un système sociotechnique est un réseau tissé entre acteurs économiques et sociaux autour d’un produit ou d’un service et c’est bien là l’enjeu.
    Mon constat est que beaucoup d’entreprises ont atteint un niveau de maturité suffisante pour la mise en place d’un tel système car il y a cette prise de conscience de sa valeur potentielle. Mais ce qui est beaucoup plus difficile, c’est de le pérenniser : Parce qu’un système socio technique doit être en perpétuelle évolution, doit favoriser les innovations qui sont cohérentes avec son fonctionnement et bloquer celles qui ne s’y intègrent pas.
    Or les innovations sont nombreuses et avec le cloud elles se sont accélérées : dans les 25 dernières années, on a vu se développer les concepts de data warehouse, de Businesss Intelligence, de Big Data, de data gouvernance puis tout s’est accéléré avec le Cloud, la data science, sans parler du tout dernier buzzword dont je reparlerai, le data mesh.
    Tous ces concepts sont de potentiels principes fondateurs mais c’est à vous, si vous faites partie d’une task force data, d’en définir les enjeux, le cadre et les modalités d’adoption
    Prendre la data par le bon sens : c’est cela qui rend notre travail passionnant, mais difficile.
  • La notion d’entreprise data driven n’est pas nouvelle. Depuis 30 ans maintenant, nous percevons la valeur de cet actif immatériel, de plus en plus surabondant, et qui permet à nos entreprises et à nos activités de se différencier ou d’opérer avec plus d’efficacité et de précision. Dans la plupart des entreprises, des projets sont été menés avec succès et il y a eu montée en compétence, souvent avec une petite équipe d’éclaireurs, à la périphérie du cœur du business de l’entreprise. Les vagues d’innovation se sont succédées pour accompagner cette montée en compétence, le plus souvent en mode projet.

    Mais ce que n’est que récemment qu’on peut percevoir un point d’inflexion, cette bascule qui intervient lorsque la direction générale et les différentes activités business ont compris le champ des possibles et en veulent beaucoup plus. C’est à ce moment là ou l’on cherche à créer une organisation pérenne Beaucoup d’entreprises ont atteint ou atteignent actuellement cette point d’inflexion, avec des niveaux de maturité différents

    J’ai pris des chiffres d’une étude de New Vantage Partner, filiale de Wavestone, que je recommande fortement, même si les chiffres sont forcément biaisés, car l’étude a été adressé à des grands comptes, essentiellement aux Etats Unis, et donc à priori ayant un niveau de maturité élevé sur la data. Donc ils montrent une tendance.
    L’étude indique clairement cette prise de conscience sur les enjeux business, avec plus de 90% des participent qui mettent en avant les retours sur investissements de leurs initiatives data. Elle indique que presque ¾ des participants ont nommé un chief data officer ou équivalent. Ce qui est surtout à retenir est que ce taux était de 12% il y a dix ans.
    Une autre étude de Strategy& indique qu’en Europe, 26% des entreprises ont nommé un CDO. Les secteurs de la banque, de l’assurance et des médias étant en pole position.
    Donc, on voit bien le cap visé qui vise à rapprocher la data du business et des comités de direction, à lui donner plus d’envergure et la pérenniser
    Mais, l’étude montre aussi que la route est longue. 60% des entreprises considèrent que le CDO doit encore démontrer son succès et sa pérennité dans l’organisation. Seul ¼ de ces grandes entreprises considèrent qu’elles sont data-driven et 20% qu’elles ont acquis une culture de la data.

    73.7% vs 12% EN 2012
    59,8% de ces organisations considèrent néanmoins que le rôle de Chief Data and Analytics Officer est encore naissant et 44,2% d’entre elles ont dû faire face à un turnover important sur ce poste.

    #3 / Les entreprises continuent de lutter pour devenir « data-driven » puisque seulement 26,5% d’entre elles déclarent avoir atteint cet objectif.
    #4 / Les obstacles culturels demeurent les plus critiques pour la mise en place d’une gestion stratégique de l’entreprise par la donnée, 91,9% des répondants estimant qu’il s’agit du principal défi à relever.
  • Quels sont les défis ?
    Le premier est celui de la démocratisation. On a vécu une vague massive de professionnalisation : même s’ils restent difficiles à trouver, on a des data analysts, des data engineers, des data scientists, et on en trouvera de plus en plus. Ce qu’il reste à faire, c’est rendre la data aussi facile à consommer que le contenu sur Internet ; surtout de faire en sorte que tout un chacun ait le réflexe d’aller chercher des data points pour planifier, mesurer, améliorer, alerter, etc.

    D’un point de vue technique et organisationnel, cela signifie qu’il faut rendre les données plus facilement accessibles, les documenter, faciliter leur utilisation, leur partage et leur réutilisation sous des formes diverses. C’est tout l’enjeu du self-service. Répondre à cet enjeu est devenu plus compliqué en raison de la diversification des usages. Un data scientist aura des besoins différents qu’un opérationnel, un développeur d’application ou un client. J’évoquerai d’ailleurs tout à l’heure ce concept de data product qui vise à packager la data de manière à la rendre consommable. Personnellement, j’aime bien cette l’idée, car par le passé, nous avons à mon avis échoué en nous nous en remettant à des outils. Des outils de business intelligence, de MDM, des catalogues. Bien sûr qu’on a besoin d’outils, mais ça ne suffit pas ; il faut consacrer plus de temps à documenter, catégoriser la donnée, la rendre plus facile à consommer.

    Le troisième défi, c’est celui de la fiabilité et de la confiance. La qualité, c’est le tendon d'Achille des projets data, et pour être honnête, c’est un peu notre faute, car on n’a pas été assez exigeants sur ce point au départ. Par le passé, on a plutôt privilégié l’innovation, le design, les nouveaux projets, au détriment des opérations, on s’est dit qu’on verra ça après. Et donc c’est un gros point de vigilance, on a besoin de plus de rigueur, de mettre en place des règles du jeu, des SLA, des systèmes de surveillance. C’est un point essentiel, un exercice difficile, mais un facteur clé de succès. On a a parlé en préparant cette journée avec Nicolas à propos d’un de leur plus gros client et de cette étape difficile à franchir mais essentiel pour leur succès.

    Il y aussi un besoin de simplification. C’est à mon sens un retour du bâton de la période initiale du big data. Parce qu’on souhaitait de diversité dans les données et dans les usages, et qu’on voulait aller vite, on est un peu revenu en arrière en partageant des données brutes et en mettant à disposition des outils très techniques pour les exploiter. J’ai l’impression qu’on revient à des choses plus simples. Par exemple, j’entends de plus en plus souvent parler de minimisation de la données, une idée qui est au cœur de RGPD. Mais cette idée de sobriété numérique est en train de vers son chemin,

    Enfin, et ça s’applique surtout quand vos initiatives data ont déjà fait leur preuve, il y a cet enjeu de mise à l’échelle. On a vu aujourd’hui la diversité des cas d’usage, des contextes d’entreprise. Souvent la réussite des projets data passe par une équipe de choc qui crée la dynamique. Et il est aussi fréquent que le leader de cette équipe choc quitte l’entreprise, tout retombe comme un soufflé. Le point d’inflexion dont je parlais en intro impose de passer cette étape, d’’ou l’importance de l’organisation data dont je vais parler par la suite


  • Du côté de l’organisation, beaucoup d’entreprises choisissent de passer par la création d’une data office centralisé. 
    Son rôle est d’abord de définir la stratégie et la feuille de route, ce que la data peut apporter dans l’entreprise face à ses enjeux business et comment s’organiser pour rendre cela effectif. Le but est aussi de progresser dans l’échelle de maturité en identifiant les faiblesses et les axes souhaités d’amélioration
    Il doit mettre en place les mécanismes pour permettre de valoriser la data, prioriser les initiatives et créer la task force sur l’analytique, en s’appuyant sur des équipes pluridisciplinaires, qui ne lui reportent pas nécessairement et qui embarque les utilisateurs le plus tôt possible
    Il est clairement en charge de la gouvernance, c’est le rôle le plus compliqué car il faut à la fois être un agent du changement et un contrôleur, voire un empêcheur de tourner en rond. Et le paradoxe c’est que pendant ces dernière années, le rôle défensif sur les données a eu tendance a augmenter, il faut sabvoir faire des compromis entre protéger les données et les exploiter
    Il doit développer les savoir faire sur la data, les plates formes, les méthodes.
    Il est aussi en charge d’innovation, au travers d’un data lab qui est le lieu où l’on peut expérimenter de nouvelles idée ou de nouveaux cas d’usage en mode « try and fail »
    Enfin , le rôle est de diffuser la culture data dans l’entreprise. Dans le digital, on a vu l’émergence du rôle de Chief Digital Officer. Mais le paradoxe, c’est que beaucoup ont disparu parce qu’ils avait bien fait leur boulot : on a considéré que la transformation numérique avait réussi et que chacun se l’était approprié dans l’entreprise.
    Pour la data, la transformation est plus longue, mais il y a des signes qui indiquent que les entreprises les plus avancées penchent vers plus de décentralisation



  • Et c’est pourquoi on entend beaucoup parler de data mesh en ce moment : pas seulement parler, du reste, il y a de belles réussites en la matière. Le concept a été introduit en 2019 par une consultante, qui a mis un coup de pied dans la fourmilière de l’écosystème data avec l’idée de remettre le métier au centre des initiatives data, et donc de décentraliser, d’amener les équipes data vers le business plutôt que le contraire. Car c’est souvent là que la bas blesse. Je cite ici une étude de BARC qui indiquent que les responsalbiités sur le data sont restées très

    Donc l’idée c’est de déléguer les responsabilités aux grands domaines fonctionnels en s’inspirant de démarche utilisée dans le software.
    Autre idée force emprunté au monde du software, celle de packager les data comme des packages unitaires et standards réutilisables gérer des products, c’est avec un roadmap, un documentation, des service level agreements, etc.

    Ca ce sont les deux idées empruntées aux architecture software qui amènent une rupture. Et pour les appliquer au monde de la data il faut tout d’abord que ces data products soient accessible en mode libre service, donc on revient à la démocratisation et l’accessibilité dont j’ai déjà parlé et qui n’est pas nouveau en soit mais qui est d’autant plus nécessaire si les data products sont créés de manière plus décentralisée
    Et puis, il y a toujours, et même encore plus un besoin de gouvernance puisque plus on décentralise les responsabilité plus on a besoin de contrôle et de supervision. Don on parle de gouvernance fédérée et aussi automatisée.

    Voilà les bases sont là, c’est un peu comme au début du data warehouse quand Bill Inmon et Ralph Kimball ont posé des principes fondateurs qu’il n’a pas fallu prendre comme argent comptant mais qui on permis d’avancer et de donner un cadre à tout un écosystème.
    Un point très important à considérer c’est d’avoir la masse critique. Amener les équipes data vers le business dans une organisation par domaine, c’est pas si simple parce qu’ils ne sont pas forcément, c’est aussi que ça. Donc est ce que votre organisation est prête pour metrre en œuvre ce type de concept, ce n’est pas sur. Et il ya aussi ce principe indispensable de gouvernance fédérée et automatisée qui aussi est plus facile à énoncer qu’à mettre en pratique. Donc c’est pour ça que je considère que le data mesh, c’est un concept très intéressant, mais c’est pas du tout une mode, c’est une façon de s’organiser vers lequel on va progressivement s’orienter au fur et à mesure que la discipline data s’est installé dans l’entreprise. Ne commencez pas ça si votre niveau de maturité est faible


  • L’architecture est le deuxième facteur clé de succès que j’ai voulu souligner. Il faut un socle pour le data management et la gestion des opération
    Ca ne veut pas forcément dire une plate-forme unique et centralisée, ce qui est important c’est de pouvoir accéder aux données, les modéliser, les référencer, les catégoriser… et aussi de répondre aux différents cas d’usage autour de la business intelligence et de l’IA.
    Le cloud s’est imposé car il a apporté beaucoup de souplesse et de flexibilité. Prenez l’exemple de Traxens, une start up d’e moins de cent personnes qui grâce au cloud peut s’appuyer sur une plate-forme haut de gamme, potentiellement partager ses données avec ses clients, etc. Ca n’interdit pas les architectures hybrides, mais il faut avoir de sérieux arguments pour prendre l’exploitation de ce type de plate-forme à sa charge. La plate-forme doit permettre de partager différents types de data, certaines très packagées et dédiés à des cas d’usage précis, d’autres très standardisées pour être réutilisées au travers des use case, d’autres plus brutes pour de la découverte.
    La plate-forme doit permettre le sourcing et l’intégration de données, qui reste en général une fonction de back office, pour les équipes de DataOps. En aval elle permet une accès en libre service avec des outils de business intelligence et pour de l’analyse plus sophistiquée
    Mais la dimension souvent manquante, celle sur lequelle il conviendra de plus en plus de miser, c’est celle qui apparait dans le trois ronds du milieu au milieu. c’est à ce niveau que l’on voit le plus d’innovation technologique. Les fonctions de gestion d’accès, de provisioning de data, de masking, de référencement des données personnelles. Le catalogue de données est un composant crucial pour l’accessibilité, mais aussi pour la gouvernance, car il assure la traçabilité des données.
  • Le troisième facteur clé de succès, c’est la gouvernance, j’en ai d’ailleurs déjà pas mal parlé.
    Quand le numérique n’a pas de règle, on sait que ça peut très mal se passer, il suffit de regarder ce qui est en train de se passer avec Twitter.
    Comment par définir les objectifs : pourquoi dout on gouverner les données
    Puis définir les méthodes utilisées




  • 🎯 Atelier Denodo - Data Mesh & Logical Data Fabric : L’intérêt des approches décentralisées pour faciliter et accélérer les usages et le Data Management. 🎯 Atelier SAP - Retour d’expérience du groupe Latécoère sur l’implémentation de la solution SAP Analytics Cloud. 🎯 Atelier Snowflake - Présentation de la solution Snowflake et retour d’expérience de Traxens sur le processus de Supply Chain en temps réel pour les containers et wagons connectés. 🎯 Atelier DataGalaxy - Témoignage de Domofrance sur la mise en place d’une nouvelle stratégie de datacatalog au sein du groupe. 🎯 Atelier Talend - Retour d’expérience de Bouygues Construction sur la gestion des données de son architecture hybride avec la solution Talend. 🎯 Atelier Qlik - Illustration de l’Intelligence Active à travers une présentation et une démo Qlik.
  • Drive Industry Innovation
    Advanced Intelligence to transform customer engagement
    Brings together multichannel engagement, commercial content, customer data, and artificial intelligence to drive smarter, compliant interactions with all customers across all channels

    Leverage community
    Network with your peers
    Share best practices with global customers with users in 165 countries
    Develop new industry partnerships across sponsors, CROs, and sites.
    Opportunities: annual Commercial & Medical Summit – June 8-10, 2020 and a series of local community meetings in Boston, Philadelphia, Chicago, New Jersey in September 2019

    Leverage expertise
    Enhance value through robust ecosystem of partners
    Implementation, managed services, and best practices with team of global subject matter experts
  • La data est devenu une discipline à part entière dans l’entreprise, au travers des organisations.
    Mais la route est longue, bien plus longue par exemple sde celle qui nous amené à la digitalisation/dématérialisation de nos vies personnelles et professionnelles.
    Car, il n’y a pas eu de Facebook, de Linkedin, de Google, de Zoom ou de Slack qui ont imposé des nouvelles manières de travailler ou d’interagir.
    Il y a pourtant eu une très forte montée des compétences, à tel point que le métier de consultant data figure dans le top 25 des métiers les plus recherchés en France selon Linkedin. On a vu tout un écosystème de spécialistes se créer, tant du côté des éditeurs et des cabinets de consultants et intégrateurs. L’innovation a été phénoménale, y compris en Europe. D’ailleurs, je me faisais la réflexion en voyant les partenaires de ces data days : Denodo est né à la Corogne, Qlik à Lund, Talend et la dimension analytique de SAP à Puteaux, Data Galaxy à Lyon, et même Snowflake tient ses racines de deux thésards de l’Université Paris VI.
    L’innovation est à portée de nos mains. Mais, jusqu’à preuve du contraire, il n’y a pas la place pour une solution universelle dans le domaine de la data car cela reviendrait à créer un silo, alors que l’on sait que les silos détruisent la valeur de la data

    Réussir son initiative data c’est donc savoir s’approprier cet écosystème pour mettre en place un système socio-technique spécifique à votre entreprise. Mon constat est que beaucoup d’entreprises ont atteint un niveau de maturité suffisante pour la mise en place d’un tel système car il y a cette prise de conscience de sa valeur potentiel. Mais ce qui est beaucoup plus difficile, c’est de le pérenniser : la définition d’un système socio technique est qu’il doit doit favoriser les innovations qui sont cohérentes avec son fonctionnement et bloquer celles qui ne s’y intègrent pas.
    Or les innovations sont nombreuses: dans les 25 dernières années, on a vu se développer les concepts de data warehouse, de Businesss Intelligence, de Big Data, de data gouvernance puis tout s’est accéléré avec le Cloud, la data science, sans parler du tout dernier buzzword dont je reparlerais, le data mesh.
    Tous ces concepts sont de potentiels principes fondateurs mais c’est à vous, si vous vous partie de la task force data, d’en définir les enjeux, le cadre et les modalités d’adoption
    Prendre la data par la le bon sens : c’est cela qui rend notre travail passionnant, mais difficile



    --------------

×