Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

5,952 views
5,844 views

Published on

Slides corporate de la société Talend (Oct08) et ses 4 plateformes Open Source :
-Talend Open Studio
-Talend Integration Suite
-Talend Open Profiler
-Talend Data Quality

Plus d'info à http://www.talend.com

Published in: Technology
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
5,952
On SlideShare
0
From Embeds
0
Number of Embeds
26
Actions
Shares
0
Downloads
320
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Talend, Leading Open Source DataIntegration plateform. Cedric Carbone

  1. 1. Présentation Société Cédric Carbone Talend CTO ccarbone (at) talend. com
  2. 2. Agenda <ul><li>Introduction </li></ul><ul><li>Le marché et ses drivers </li></ul><ul><li>Présentation des solutions </li></ul><ul><li>Produits & services </li></ul><ul><li>Clients et partenaires </li></ul>
  3. 3. Talend en Quelques Mots <ul><li>Principal éditeur open source d’intégration de données </li></ul><ul><ul><li>Offre aux entreprises de toutes tailles des solutions d’intégration de données répondant à l’ensemble de leurs besoins </li></ul></ul><ul><li>Financé par des fonds de capital risque </li></ul><ul><ul><li>Galileo Partners et Allianz Private Equity Partners </li></ul></ul><ul><li>Opérations et utilisateurs dans le monde entier </li></ul>
  4. 4. Résumé des Tendances <ul><li>Un taux élevé d’adoption </li></ul><ul><ul><li>500 000 téléchargements du &quot;core product&quot; </li></ul></ul><ul><ul><li>2,5 millions de &quot;lifetime downloads&quot; </li></ul></ul><ul><ul><li>20% s’enregistrent comme utilisateurs </li></ul></ul><ul><ul><li>30% acceptent les mises à jour automatiques </li></ul></ul>1 download de Talend Open Studio chaque minute 1 nouveau client chaque jour
  5. 5. Historique <ul><li>Premier éditeur open source spécialisé dans l’intégration </li></ul><ul><ul><li>Créé en 2005 après 3 ans de R&D </li></ul></ul>Second tour de table 2005 2006 2007 2008 Talend Open Studio Beta 1 Talend Open Studio v1.0 Premier tour de table: Allianz Private Equity and Galileo Partners Lancement des opérations US avec bureau à Los Altos, CA Data Quality Talend Integration Suite Talend On Demand / SaaS Opérations Produits 2,5 millions de lifetime downloads
  6. 6. L’Open Source et l’Intégration de Données Création de l’Open Source Accès libre au code « Free Software Foundation »(Richard Stallman) Lancement de la GPL et de GNU Création de l’Open Source Initiative Mise en œuvre d’une politique répondant aux réalités économiques et techniques Émergence des solutions Open Source Apache… Apparition des premiers éditeurs MySQL, JBoss, SugarCRM… Les principaux acteurs de l’Open Source deviennent des leaders JBoss, SugarCRM… Apparition d’acteurs de plus en plus mûrs Red Hat, Jaspersoft, Talend… 1970 1984 1998 2000 2003 2005 2007
  7. 7. L’Etat du Marché <ul><li>Situation </li></ul><ul><ul><li>Croissance exponentielle des volumes de données </li></ul></ul><ul><ul><li>Diversité, hétérogénéité et mauvaise qualité des sources de données (internes & externes) </li></ul></ul><ul><ul><li>Upgrades par ajout de couches successives </li></ul></ul><ul><li>Contraintes </li></ul><ul><ul><li>Réglementaires (Sarbanes-Oxley, Bâle II, HIPAA, etc.) </li></ul></ul><ul><ul><li>Opérationnelles (“just-in-time”) </li></ul></ul><ul><li>Conséquences </li></ul><ul><ul><li>Raccourcissement continuel des délais d’intégration de données </li></ul></ul><ul><ul><li>Demande d’amélioration de la qualité des données </li></ul></ul><ul><ul><li>Besoin d’une vue unique sur les données afin de mieux les contrôler </li></ul></ul>
  8. 8. Positionnement de Talend Décisionnel (ETL) Intégration Opérationnelle Duplication & synchronisation des données Migration d’applications Migration & chargement de données Chargement des systèmes décisionnels Solutions de Talend Profiling & nettoyage de données Qualité de Données
  9. 9. Solution <ul><li>Simple à télécharger, evaluer et utiliser </li></ul><ul><li>Faible coût </li></ul><ul><li>Facile à utiliser et à maintenir </li></ul><ul><li>Prix et technologie scalables et flexibles </li></ul><ul><li>Fonctionnalités et performances supérieures </li></ul><ul><li>Développement accéléré de nouvelles fonctionnalités grâce à la communauté </li></ul><ul><li>Une solution d’intégration de données fiable, reposant sur des technologies récentes et disponible en Open Source </li></ul>
  10. 10. L’Offre de Talend <ul><li>Talend Data Quality Enterprise Edition </li></ul><ul><li>Teamwork </li></ul><ul><li>Enterprise Deployment </li></ul><ul><li>Production Monitoring </li></ul><ul><li>Talend Data Quality Personal Edition </li></ul><ul><li>Data Profiler Advanced </li></ul><ul><li>Data Cleanser </li></ul><ul><li>Talend Integration Suite </li></ul><ul><li>Advanced Studio </li></ul><ul><li>Teamwork </li></ul><ul><li>Enterprise Deployment </li></ul><ul><li>Production Monitoring </li></ul><ul><li>Talend On Demand </li></ul><ul><li>Hosted Repository </li></ul>Activity Monitoring Console /PE Intégration de Données Qualité de Données <ul><li>Talend Open Profiler </li></ul><ul><li>Data Profiler </li></ul><ul><li>Metadata Manager </li></ul>Data Quality Option Talend Open Studio <ul><li>Talend Open Studio </li></ul><ul><li>Business Modeler </li></ul><ul><li>Job Designer </li></ul><ul><li>Metadata Manager </li></ul>Souscription GPL Open Source Entreprise Individuel
  11. 11. Talend Open Studio <ul><li>Fonctionnalités Clés </li></ul><ul><ul><li>Modélisation de processus orientés métier </li></ul></ul><ul><ul><li>Développement graphique </li></ul></ul><ul><ul><li>Performance, fiabilité et montée en charge </li></ul></ul><ul><ul><li>Connectivité élargie et universelle </li></ul></ul><ul><ul><li>Design et exécution reposant sur un référentiel unique </li></ul></ul><ul><ul><li>Debugging en temps réel </li></ul></ul>
  12. 12. Talend Integration Suite <ul><li>Bénéfices clés </li></ul><ul><ul><li>Augmentation de la productivité des développements </li></ul></ul><ul><ul><li>Collaboration et promotion des standards de développement </li></ul></ul><ul><ul><li>Gestion des déploiements entreprise </li></ul></ul><ul><ul><li>Centralisation de la surveillance des processus d’intégration </li></ul></ul><ul><li>Modules </li></ul><ul><ul><li>Advanced Studio </li></ul></ul><ul><ul><li>Shared Repository </li></ul></ul><ul><ul><li>Job Conductor & Job Conductor Advanced </li></ul></ul><ul><ul><li>Grid Conductor </li></ul></ul><ul><ul><li>CPU Balancer </li></ul></ul><ul><ul><li>Distant Run </li></ul></ul><ul><ul><li>Activity Monitoring Console & Dashboard </li></ul></ul>
  13. 13. Talend On Demand <ul><li>Première plateforme ouverte d’intégration de données en mode Software as a Service (SaaS) </li></ul><ul><ul><li>Référentiel en ligne partagé, hébergé par Talend </li></ul></ul><ul><ul><li>Consolidation des métadonnées et des informations projet </li></ul></ul><ul><li>Bénéfices </li></ul><ul><ul><li>Consolidation du travail des équipes </li></ul></ul><ul><ul><ul><li>Facilite collaboration, réutilisation d’objets et de code </li></ul></ul></ul><ul><ul><ul><li>Promeut les standards de développement </li></ul></ul></ul><ul><ul><li>Facile à mettre en œuvre </li></ul></ul><ul><ul><ul><li>Pas d’installation, de configuration ou d’administration </li></ul></ul></ul><ul><ul><ul><li>Utilisation de Talend Open Studio pour la conception et l’exécution </li></ul></ul></ul><ul><li>Sécurité </li></ul><ul><ul><li>Accès sécurisé </li></ul></ul><ul><ul><li>Comptes séparés </li></ul></ul><ul><ul><li>Seules les métadonnées sont stockées en central </li></ul></ul><ul><ul><ul><li>Les données des applications restent à l’intérieur du SI </li></ul></ul></ul>
  14. 14. Talend Open Profiler <ul><li>Profiling de Données </li></ul><ul><ul><li>Examiner les données contenues dans les sources </li></ul></ul><ul><ul><li>Collecter des informations et des statistiques sur ces données </li></ul></ul><ul><li>Fonctionnalités </li></ul><ul><ul><li>Découverte des métadonnées </li></ul></ul><ul><ul><li>Définition des statistiques </li></ul></ul><ul><ul><li>Résultats & graphiques </li></ul></ul><ul><li>Bénéfices </li></ul><ul><ul><li>Découverte de la qualité </li></ul></ul><ul><ul><li>Compréhension des caractéristiques des données </li></ul></ul><ul><ul><li>Identification des problèmes potentiels </li></ul></ul><ul><ul><li>Réduction du temps et des ressources pour identifier des données problématiques </li></ul></ul><ul><ul><li>Plus de contrôle pour les fonctionnels </li></ul></ul>
  15. 15. Talend Data Quality <ul><li>Solution complète de gestion de la qualité des données </li></ul><ul><ul><li>Data Profiler </li></ul></ul><ul><ul><ul><li>Découverte et évaluation de la qualité des données </li></ul></ul></ul><ul><ul><ul><li>Traçage de l’historique de la qualité des données </li></ul></ul></ul><ul><ul><li>Data Cleanser </li></ul></ul><ul><ul><ul><li>Transformation des données pour améliorer leur qualité </li></ul></ul></ul><ul><ul><ul><li>Élimination ou recyclage des enregistrements erronés </li></ul></ul></ul><ul><ul><ul><li>Correction des mauvaises données </li></ul></ul></ul><ul><ul><ul><li>Interfaces avec : </li></ul></ul></ul><ul><ul><ul><ul><li>Bases de validation de noms, adresses & téléphones </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Tables de synonymes et données de référence </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Routines externes de nettoyage des données </li></ul></ul></ul></ul><ul><ul><ul><li>Types de traitement : </li></ul></ul></ul><ul><ul><ul><ul><li>Filtrage & identification </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Correction </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Enrichissement </li></ul></ul></ul></ul>
  16. 16. Talend Data Quality <ul><li>Bénéfices </li></ul><ul><ul><li>Suite intégrée pour diagnostiquer et corriger les données erronées </li></ul></ul><ul><ul><ul><li>Data profiling </li></ul></ul></ul><ul><ul><ul><ul><li>Mesure et trace le niveau de qualité </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Préserve l’historique pour mesure l’amélioration ou la dégradation </li></ul></ul></ul></ul><ul><ul><ul><li>Data cleansing </li></ul></ul></ul><ul><ul><ul><ul><li>Élimine les incohérences, les doublons, etc. </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Produit des données augmentées/enrichies </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Standardise les données </li></ul></ul></ul></ul><ul><ul><li>Gestion complète du cycle de vie de la qualité des données </li></ul></ul><ul><li>Intégration native avec l’intégration de données </li></ul><ul><ul><li>Implémente un &quot;Data Quality Firewall&quot; dans les processus d’intégration de données </li></ul></ul>
  17. 17. Services et Support <ul><li>Formation </li></ul><ul><ul><li>2 niveaux de formation : Foundation et Advanced </li></ul></ul><ul><ul><li>Une bonne connaissance des solutions de Talend maximise l’efficacité de l’implémentation </li></ul></ul><ul><li>Support </li></ul><ul><ul><li>Garantit une version stable maintenue par l’équipe R&D de Talend </li></ul></ul><ul><ul><li>Niveaux Gold, Silver et Platinum </li></ul></ul><ul><li>Consulting </li></ul><ul><ul><li>Une équipe de consultants, experts en intégration de données, dédiée aux clients et partenaires de Talend </li></ul></ul>
  18. 18. Quelques Clients Finance & Assurance Services Industrie & Distribution Secteur Public & Éducation
  19. 19. Partenariats (Exemples) Technologiques Intégrateurs OEM Powered by Talend Alliances
  20. 20. Principaux Differentiateurs Techniques <ul><li>Générateur de code </li></ul><ul><ul><li>Code exécuté totalement visible </li></ul></ul><ul><ul><li>Pas de surcoût d’interprétation lors de l’exécution </li></ul></ul><ul><ul><li>Exploite les serveurs existants </li></ul></ul><ul><ul><li>Déploiement des jobs d’intégration sur multiples serveurs (grid) </li></ul></ul><ul><li>Utilisation des standards (Eclipse, Java, Perl, SQL) </li></ul><ul><ul><li>Exploite les compétences existantes </li></ul></ul><ul><ul><li>Abaisse les coûts de formation </li></ul></ul><ul><li>Facilement extensible </li></ul><ul><ul><li>Incorporation de routines Perl ou Java existantes </li></ul></ul><ul><ul><li>Création de vos propres composants – ou utilisation de ceux développés par la communauté </li></ul></ul><ul><li>Métadonnées et monitoring centralisés </li></ul><ul><ul><li>Tous les jobs, dépendances, documentation sont stockés et versionnés en central </li></ul></ul><ul><ul><li>Monitoring global </li></ul></ul>
  21. 21. Merci

×