Valtech - Big Data : Détails d’une mise en œuvre
Upcoming SlideShare
Loading in...5
×
 

Valtech - Big Data : Détails d’une mise en œuvre

on

  • 1,946 views

Big Data : Détails d’une mise en œuvre ...

Big Data : Détails d’une mise en œuvre

Construction d’une solution d’analyse d’e-reputation
Collecter et stocker les données : Quelle infrastructure ?
Corréler et agréger les données : Quelle analyse ?
Restituer et exploiter : Quels résultats ?

Présentation animée par Hervé Desaunois, Responsable Technique, Valtech
herve.desaunois@valtech.fr


Evénement - Big Data : ne dormez pas sur vos données !
Valtech - 29/11

Statistics

Views

Total Views
1,946
Views on SlideShare
1,770
Embed Views
176

Actions

Likes
1
Downloads
65
Comments
0

8 Embeds 176

http://www.valtech.fr 101
http://www.scoop.it 45
http://elbacilon.wordpress.com 15
http://www.webmarketing-referencement.com 7
http://sd-rd-medi01 3
http://www.paperblog.fr 2
http://fr.slideshare.net 2
http://wiki 1
More...

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Valtech - Big Data : Détails d’une mise en œuvre Valtech - Big Data : Détails d’une mise en œuvre Presentation Transcript

  • Big Data Détails d’une mise en œuvreHervé Desaunois Responsable IT
  • Méthodologie Cas d’utilisation ValtechArchitecture! Tendance Big Data
  • SommaireMéthodologie Ò  Présentation Ò  Cas d’utilisation Ò  Architecture Ò  Cas Pratique Ò  Conclusion Ò  Références Ò  Annexes 3
  • Big Data / MéthodologieLa mise en place d’une démarche Big Data est toujourscomposée de trois étapes : Ò  Collecter, stocker les données. Ò  Analyser, explorer, corréler, agréger les données. Ò  Visualiser, exploiter.
  • Architecture
  • Architecture Big Data BUSINESS LES DONNEES COLLECTER Audio, Docs, Social, Capteurs, Web logs, Spatial, Vidéo, Texte, Graphs, Graphs, Autres Clicks, GPS Image XML RSS, RSS, STOCKAGE & ORGANISATION Base de données Distributed File Orientée colonne Base de System NoSQL données SQL EXTRACTION Map Reduce SQLVISUALISERANALYSER Analytiques , Business Intelligent &
  • Architecture Big Data BUSINESS LES DONNEES COLLECTER Audio, Docs, Social, Capteurs, Web logs, Spatial, Vidéo, Texte, Graphs, Graphs, Autres Clicks, GPS Image XML RSS, RSS, STOCKAGE & ORGANISATION HBase, Big Table, HDFS, GFS, S3, Cassandra, Oracle, DB2, … DynamoDB, … MySQL, … EXTRACTION SQLVISUALISERANALYSER &
  • Cas d’utilisation Valtech eReputation
  • SommaireItération I Ò  Présentation Ò  Cas d’utilisation Ò  Architecture Ò  Cas Pratique Ò  Conclusion Ò  Références Ò  Annexes 9
  • Cas d’utilisation Valtech eReputation ERM MapReduce S3 DynamoDB eReputation Server Histogramme Client RIA GWT
  • Collecter les données Connecteurs Web Service Web Service / Rest Web Service / Rest Web Service / RestGoogle Custom Search API Twitter Search API Facebook Search API
  • Stockage Base de données Orientée Colonne
  • Organisation Modèle de données – Attributs, éléments et tables
  • Organisation Modèle de données – Attributs, éléments et tables
  • Extraction Amazon Elastic MapReduce
  • Analyser Stocker les réponses sur S3
  • Analyser Visualisation du résultat sur S3
  • Visualiser Client RIA GWT
  • Démo eReputation Valtech
  • BIG DATA Complexité Big Data Big Data Self Intelligent ? Data Scientist Big Data + Business Intelligent = ROI
  • SommaireItération II Ò  Présentation Ò  Cas d’utilisation Ò  Architecture Ò  Cas Pratique Ò  Conclusion Ò  Références Ò  Annexes 21
  • Cas d’utilisation Valtech eReputation MapReduce New SaaS S3 DynamoDB New eReputation ServerNew New
  • Aujourdhui• Volumes de données importants (Tera, Peta, ..)• De l’infiniment petit (génomique) à l’infiniment grand (astrophysique)• Du plus quotidien (reconnaissance de l’écriture manuscrite sur les enveloppes) aumoins quotidien (aide au pilotage aéronautique)• Du plus ouvert (e-commerce) au plus sécuritaire (détection de la fraude dans latéléphonie mobile ou les cartes bancaires)• Du plus industriel (contrôle qualité…) au plus théorique (sciences humaines,biologie…)• Du plus alimentaire (agronomie et agroalimentaire) au plus divertissant (prévisionsd’audience TV)• Systèmes d’aide à la décision plus ou moins automatiques © Stéphane Tufféry
  • Machine Learning Lapprentissage automatique (machine learning en anglais), un des champs détude de lintelligence artificielle, est la discipline scientifique concernée par le développement, lanalyse et limplémentation de méthodes automatisables qui permettent à une machine (au sens large) dévoluer grâce à un processus dapprentissage, et ainsi de remplir des tâches quil est difficile ou impossible de remplir par des moyens algorithmiques plus classiques.
  • Analyse - Algorithme Machine Learning Recommandation Classification Cluster
  • Analyse sémantique Natural Language Processing Utilisation d’une solution de ”Catégorisation de document – Machine learning”
  • Analyse sémantique Natural Language ProcessingCatégorisation : Expertise javaÒ  26 mai 2008 – Grâce à son expertise Java, Valtech Technology sassocie avec Talend pour améliorer lagilité des systèmes dinformation de ses clients.Ò  Cédric Bertrand, Consultant confirmé JAVA/J2EE, Valtech de Paris (Ile-de-France).Ò  Valtech Agency propose une triple maîtrise dans les domaines du conseil, ... Des compétences de développement Java, ..Ò  Valtech: conseil en management, en technologies. Conseil et projets ebusiness, agence web, Offshore, Formation nouvelles technologies, objet, Java EEÒ  Au travers du déroulement itératif dun projet, vous utiliserez des techniques moins connues de programmation Java comme la gestion poussée des Threads
  • Analyser Algorithme de clusters K-Means
  • Data Scientist L’intelligence des données Web Mining & Text Mining
  • Analyser - Algorithme Data Mining
  • Tendance Big Data
  • Gartner talk« Dici 2015, 4,4 millions demplois informatiques seront créés dansle monde pour soutenir le Big Data, dont 1,9 millions aux Etat-Unis », a déclaré Peter Sondergaard, senior vice-président etresponsable mondial de la recherche chez Gartner. Wanted « Data Scientist » 100 000 to 500 000 $
  • Valtech Web Scientiste L’intelligence des données Web Mining & Text Mining
  • Big Data tendance Cloud
  • Big Data full solution
  • Thank you
  • Tarification!Ò  ERM : http://aws.amazon.com/fr/elasticmapreduce/#pricingÒ  DynamoDB : http://aws.amazon.com/fr/dynamodb/#pricingÒ  S3 : http://aws.amazon.com/fr/s3/pricing/Ò  EC2 : http://aws.amazon.com/fr/ec2/pricing/