Your SlideShare is downloading. ×
0
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Watson
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Watson

1,338

Published on

Présentation Watson de Jean-Claude Jesionka - Smarter Analytics Live - 5 juin 2012

Présentation Watson de Jean-Claude Jesionka - Smarter Analytics Live - 5 juin 2012

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,338
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
31
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. vers un ordinateur sachant raisonner… Jean-Claude Jesionka Architecte Secteur Finance jcjesionka@fr.ibm.com 06 08 74 03 231 © 2012 IBM Corporation
  • 2. En Février 2011, 14 ans après avoir battu Kasparov aux échecs, un nouvel ordinateur IBM remportait une série de 3 parties qui l’opposait aux 2 champions de tous les temps du jeu télévisé américain « Jeopardy ».2 © 2012 IBM Corporation
  • 3. Qu’est-ce que Watson ? Principe du jeu « Jeopardy » Les principes et technologies mises en œuvre pour Watson Les évolutions de Watson Les applications potentielles de Watson • Exemples dans le domaine de la finance • la démarche « Ready for Watson » Annexe : Le futur3 © 2012 IBM Corporation
  • 4. Qu’est-ce que Watson ? Le 1er ordinateur candidat à un jeu télévisé (Jeopardy) qui a battu les 2 meilleurs candidats de toute l’histoire du jeu (depuis le 30 mars 1964). Un ordinateur conçu par une équipe d’IBM Research capable de rivaliser avec les humains en répondant à des questions posées en langage naturel avec rapidité et précision. Un système capable de comprendre la signification et le contexte du langage humain pour traiter l’information rapidement et trouver des réponses précises à des questions complexes.4 © 2012 IBM Corporation
  • 5. Le principe du jeu Technologie Classique Grands Citations TECHNOLOGIE Savoir Avant et 6 Catégories Espaces de Dickens vivre Après $200 $200 $200 LES $200 TOUS POLICIERS $200 $200 $400 $400 PEUVENT REMERCIER$400 $400 $400 $400 STEPHANIE KWOLEK POUR 5 degrés de $600 $600 $600 $600 $600 L’INVENTION DE CETTE FIBRE $600 Difficulté POLYMERE, 5 FOIS PLUS $800 $800 RESISTANTE $800 $800 $800 QUE L’ACIER $800 $1000 $1000 $1000 $1000 $1000 $1000 Si la réponse est bonne L’un des 3 joueurschoisit une case Le joueur gagne le montant de la case L’animateur lit Qu’est-cel’énigme à voix haute que le KEVLAR ? choisit une autre case Et Le 1er joueur qui “buzz” Si la réponse est faussepeut répondre Le joueur perd le 2 manches par jeu + une Question finale montant de la case Les autres joueurs Une règle de doublement des points peuvent “buzzer”IBM Corporation 5 © 2012
  • 6. Les Catégories ne sont pas toujours aussi simples qu’elles paraissent ! Elles donnent peu d’indices pour trouver la réponse. VILLES U.S. Auteurs St. Petersburg est la ville de Archibald MacLeish a Florida du tournoi annuel de basé sa pièce en vers ce jeu populaire sur les "J.B." sur ce livre de la pontons de bateaux Bible (Le Palet) (Job) Rochester, New York doit In 1928 Elie Wiesel est né sa croissance à sa à Sighet, village localisation près de cet Transylvanien de ce pays endroit (Roumanie) (le Canal Erie)6 © 2012 IBM Corporation
  • 7. Du jeu d’échec au langage Jeu d’échec – Un espace de solutions fini et totalement structuré – Un nombre limité de mouvements et d’états – Des règles mathématiques qui s’appliquent à des symboles finis Langage humain • Les mots n’ont pas de signification par eux-mêmes • Ils sont associés à une expérience humaine • Les mots véhiculent et transmettent un espace infini de significations possibles ou supposées • Les ordinateurs ne savent pas associer les mots à des expériences humaines pour en déduire une signification 7 © 2012 IBM Corporation
  • 8. La correspondance de mots-clés n’est pas suffisante En Mai, Georges est arrivé En Mai 1898 le Portugal a célébré le en Inde après avoir célébré 400eme anniversaire de l’arrivée de son anniversaire au cet explorateur en Inde. Portugal. Est arrivé A célébré Correspondance Correspondance A célébré En Mai Correspondance Correspondance En Mai 1898 400eme Correspondance anniversaire Correspondance anniversaire “Georges” est la Portugal Correspondance Correspondance au Portugal réponse évidente par correspondance des L’arrivée mots-clés cependant l’ordinateur ne doit Correspondance Inde Correspondance Inde pas accorder une grande confiance à 8 cette réponse. © 2012 IBM Corporation explorateur Georges
  • 9. Des correspondances plus probables En Mai 1898 le Portugal a célébré Le 27 Mai 1498, Vasco da Gama le 400eme anniversaire de a débarqué à Kappad Beach l’arrivée de cet explorateur en Inde. Recherche élargie Explorer de nombreuses hypothèses A célébré Peser les réponses A débarqué Portugal Différents algorithmes 400eme Raisonnement 27 Mai 1498 Mai 1898 anniversaire temporel Date Math Paraphrase L’arrivée statistique Para- phrases Un résultat Raisonnement Inde Kappad Beach plus probable GeoSpatial n’est pas Geo-KB toujours simple explorateur Vasco da Gama à obtenir 9 Le résultat n’est toujours pas certain à © 2012 IBM Corporation 100%.
  • 10. Le moteur d’analyse de Watson est plus qu’un outil de recherche Une recherche sur le Web retourne une liste de résultats possibles contenant la réponse • Les résultats sont basés sur leur Vasco da Gama popularité et leur référencement Magellan Georges • L’utilisateur doit encore analyser le résultat pour trouver la meilleure réponse Le moteur d’analyse de Watson comprend la structure et le libellé de la question posée • Il trouve une réponse spécifique NAVIGATEURS Vasco da Gama PORTUGAIS • Il classe les réponses en donnant en “degré de confiance” basé sur En Mai 1898 le Magellan l’expérience Portugal a célébré le 400eme anniversaire Henri le Navigateur de l’arrivée de cet Watson répond à des questions en explorateur en Inde. “langage naturel” • Qui peut inclure des jeux de mots, de l’argot, du jargon et des acronymes qui doivent être évalués 10 © 2012 IBM Corporation
  • 11. DeepQA : La Technologie de Watson Architecture Massivement Parallèle ; Système probabiliste à base de “preuves” Modèles appris pour combiner et peser les “preuves” Sources Balance Preuves & Combine Sources Models Models Réponses Eval Question Eval. Recherche Models Models Réponses preuve Preuves 100,000’s Scores from Recherche Génération forte many Deep Analysis 1000’s of Models Models primaire Pieces of Evidence Algorithms Réponse 100’s Possible Answers Multiple 100’s Interpretations sources Analyse Evaluation des Classement Décomposition Génération Question & Hypothèses et des Synthèse assemblage des De la Question Hypothèse sujet “preuves” réponses Génération Hypothèses et évaluation Réponse et degré de Hypothèse des réponses confiance 11 © 2012 IBM Corporation
  • 12. La Performance humaine comparée à celle de DeepQA et Watson Chaque point représente les performances d’un joueur à Jeopardy Performance des Performance des gagnants gagnants Performance des Performance des grands champions grands champions 2007 QA Computer System 2007 QA Computer System 12 © 2012 IBM Corporation
  • 13. DeepQA - Les progrès de la précision de la réponse (12/2006-11/2010) IBM Watson joue dans le domaine des gagnants v0.8 11/10 V0.7 04/10 v0.6 10/09 v0.5 05/09 v0.4 12/08 v0.3 08/08 v0.2 05/08 v0.1 12/07 Baseline 12/0613 © 2012 IBM Corporation
  • 14. Architecture Watson Decomposition Hypothesis Hypothesis & Generation Evidence Scoring Question & Final Confidence Topic Analysis Synthesis Merging & Ranking Workload Optimized Source: John Kelly, SVP IBM Research, Investor Briefing Spring 2011Unstructured Information Management Architecture Industry standard for content analytics. 14 © 2012 IBM Corporation
  • 15. Matériel de Watson - Une question de Jeopardy! demande 2 heures de traitement d’un processeur (core) 2.6Ghz - Le traitement a été optimisé et porté sur 2,880-Core Power750 pour une réponse en 2 à 6 secondes.Le système se compose de … Performance et dispositifs • 10 racks (10 nodes/rack, et 1 rack avec switch, contrôleurs & cluster disque système) – Puissance de 80 teraflops par seconde (80 trillion • 90 HV32 nodes (60 avec 128GB RAM, et 30 avec 256GB RAM) d’opérations/sec) • Chaque node a 4 puces Atlas P7, et chaque puce a 8 CPU cores – Le processeur P7 est désigné pour les charges de (32 cores/node) pour un total de 2,880 cores traitement massivement parallèle (comme celles de • Interconnection a 10gigE (réseau ethernet) Watson) – Le Power 750 comprend des dispositifs de gestion de l’énergie, en faisant le 1er système à 4 processeurs qualifié “ENERGY STAR” – Watson requiert 25 tonnes d’air conditionné et Power7 consomme 80 kW IBM Content Analytics (UIMA) InfoSphere BigInsights (Hadoop, UIMA) 15 © 2012 IBM Corporation
  • 16. La spécificité d’IBM Watson est d’intégrer un ensemble detechnologies de transformation Génération et évaluation Compréhension d’hypothèses pour de l’expression l’amélioration des humaine en résultats langage naturel Adaptation et …construit sur un système de Apprentissage à traitement massivement partir des réponses retenues parallèle et une architecture probabiliste à base de preuves16 © 2012 IBM Corporation
  • 17. Les Applications potentielles (*) Evolutions de Watson Domaine Médical Domaine Financier IBM a créé en août 2011 une division pour initier et développer les projets Watson en apportant des solutions métiers(*) sujets à l’étude susceptibles d’évoluer17 © 2012 IBM Corporation
  • 18. Evolution de Watson après Jeopardy! Understanding Interacting Explaining Learning Precise Answers Specific Questions Question-In/Answer-Out Batch Training Process & Accurate Confidences The type of murmur associated with this condition is harsh, systolic, and increases in intensity with Valsalva From specific Evidence Move from Scale domain questions analysis and quality answers learning and to rich, incomplete look-ahead, to quality adaptation rate problem drive interactive answers and scenarios and efficiency dialog to refine evidence (e.g. EHR) answers and evidence Input, Responses Answers, Corrections, Judgements Entire Dialog Medical Record Refined Answers, Follow-up Responses, Learning Questions Questions Rich Problem Interactive Dialog Comparative Continuous Training Scenarios Teach Watson Evidence Profiles & Learning Process18 © 2012 IBM Corporation 18
  • 19. DeepQA : Diagnostic en continu Traite et synthétise une grande quantité de preuves pour améliorer le diagnostic Sym Me Symptômes Fam Find Hist Diagnosis Models Confidence ds p PB Renal Antécédents Familiaux Histoire du Patient Traitements UTI Diabetes Tests/Résultats Notes/Hypothèses Influenza Ipokalemie Grands Volumes de Isophogities textes, publications, références, DBs etc.en Most Confident Diagnosis: UTIDiabetes Most Confident Diagnosis: Diabetes and Esophogitis Most Confident Diagnosis: Rhume langage naturel 19 © 2012 IBM Corporation
  • 20. Le Cedars Sinai Hospital à Los Angeles intègrelIBM Watson à son équipe de médecins Edition du 26/12/2011 Le supercalculateur Watson dIBM doit commencer son travail dévaluation en matière de traitement du cancer, à lhôpital Cedars-Sinai de Los Angeles. Il pourra suggérer aux médecins les traitements les plus adaptés en quelques secondes. IBM et WellPoint, le plus grand programme de santé du Blue Cross Blue Shield, ont mis au point des applications qui vont transformer le supercalculateur Watson en conseiller spécialisé, au service des oncologues du département Samuel Oschin Comprehensive Cancer Institute de lhôpital Cedars-Sinai de Los Angeles.20 © 2012 IBM Corporation
  • 21. Assistant for institutional investment decision support Exemple à l’étude : Assistance aux Investisseurs Institutionnels Investisseur Institutionnel Support Analytique Recherche SourcesAujourd’hui Research Content Analyst 1 2 team 3 providers 6 Analytical 5 Content 4 Primary tools processors sources Delay Delay Delay 1 1 1 Research Content AnalystAvec Watson team providers Analytical Content tools processors 2 Primary sources 3 3 3 4 • Des temps de réponse plus rapides qui permettent des itérations • Traitement de gros volumes d’information • Un Processus consolidé et des réponses pertinentes • Degré de confiance de la réponse • Connaissance et apprentissage retenus et partagés 21 © 2012 IBM Corporation Source: Expert interviews (IBM / BCG / external SMEs); MI; SCIP; BCG analysis
  • 22. Il existe de nombreux facteurs qui influent sur le cours d’une action et sonrendement Lease Obligations Purchasing Power Customer Labor Inventory Tax Turns Cash Acctg. Factors Rates Interest Reserves Consumer Rates Sentiment Off-balance Demo- graphics Gov’t Sheet Financial Policy Economic Factors Pension Factors Plan Earnings Exchange Rates Funding Quality Product Competition Pipeline Industry Firm Factors Foreign Operation M&A M&A Invest. Activity Activity Factors Litigation New Entrants Regulation Patents / Growth IP Product Rates Customer M&A22 Recalls Activity © 2012 IBM Corporation Churn
  • 23. Putting the proper pieces together at point of impact makes for better bottom-line decisions Client requests that trader evaluate Pharma companies with cholesterylester transfer protein (CETP) drugs in pipeline Scenario23 © 2012 IBM Corporation
  • 24. Putting the proper pieces together at point of impact makes for better bottom-line decisions CE Market Data TP CETP Drug Studies Dru Trader explains that CETP News CETP studies are Regulatory Environment gStu just one factor in Earnings d earnings quality ies Quality Acme Pharma Pharma, Inc. Pharma United Pharma USA Top Confidence: Pharma Inc. Acme: Stage 2 failure; start new stage 1 CETP Drug Pharma Inc: Started Phase 3 trial; 7 completed studies Studies Pharma United: Phase 2 trials started; 3 completed studies; recruiting for 4th Pharma USA: Phase 1 trials complete24 © 2012 IBM Corporation
  • 25. Putting the proper pieces together at point of impact makes for better bottom-line decisions One P Drug CE Market Data T Trader knows that CETP Drug Studies Tim earnings CETP News e E tudies sustainability may Regulatory Environment xpe yield insight into Earnings Sustainability S Earnings n se long term stability Operating Margin Excess Cash Margin Quality s Accuracy of Earnings Forecast One Time Revenue Acme Pharma One Time Expenses Leadership/Exec Turnover Pharma, Inc. Pharma United Pharma USA One Time Top Confidence: Pharma USA Acme: Class action suit is going away Expenses which should eliminate one-time expense Pharma Inc: Setting aside fund for patent infringement claim25 © 2012 IBM Corporation
  • 26. Putting the proper pieces together at point of impact makes for better bottom-line decisions One P Drug CE Market Data T CETP Drug Studies Tim Hum xpen Client has expressed CETP News e E tudies interest in learning Regulatory Environment an more about earnings Earnings Sustainability S Cap es growth impact on Operating Margin Earnings s ital company upside Excess Cash Margin Quality Accuracy of Earnings Forecast One Time Revenue Acme Pharma One Time Expenses Leadership/Exec Turnover Pharma, Inc. Earnings Growth Time Series Sales Trend Pharma United Change in Receivables minus Change in Sales Pharma USA Change in Inventory minus Change in Sales Human Capital Top Confidence: Acme Human Capital Acme: 260 jobs listed on their website, up 30 from last quarter Pharma United: Minor layoffs Pharma , USA: Major layoffs26 © 2012 IBM Corporation
  • 27. Putting the proper pieces together at point of impact makes for better bottom-line decisions One P Drug CE Market Data T CETP Drug Studies Tim Hum xpen Infrastructure Infr CETP News e E tudies changes factor Regulatory Environment an a st into both current Earnings Sustainability S Cap es ruc l cash flows and Operating Margin Earnings ture s ita production Excess Cash Margin Quality Accuracy of Earnings Forecast One Time Revenue Acme Pharma One Time Expenses Leadership/Exec Turnover Pharma, Inc. Earnings Growth Time Series Sales Trend Pharma United Change in Receivables minus Change in Sales Pharma, USA Change in Inventory minus Change in Sales Human Capital Top Confidence: Acme Infrastructure Infrastructure Acme: New plant opening Pharma United: Infrastructure outsourcing27 © 2012 IBM Corporation
  • 28. Putting the proper pieces together at point of impact makes for better bottom-line decisions One P Drug CE Market Data T CETP Drug Studies Tim Hum xpen Go to market Go Infr CETP News e E tudies models can Regulatory Environment an To ture a st materially affect Earnings Sustainability S Cap es ruc l Ma downstream Operating Margin Earnings rke s ita revenues Excess Cash Margin Quality t Accuracy of Earnings Forecast One Time Revenue Acme Pharma One Time Expenses Leadership/Exec Turnover Pharma, Inc. Earnings Growth Time Series Sales Trend Pharma United Change in Receivables minus Change in Sales Pharma, USA Change in Inventory minus Change in Sales Human Capital Top Confidence: Acme Infrastructure Go To Market Go To Market Pharma Inc: Partnership with distributor dissolved Pharma USA: Alliance with major HMO28 © 2012 IBM Corporation
  • 29. Les organisations financières doivent gérer une quantitéd’informations complexes sans précédent Reuters publie l’équivalent de 9000 pages d’informations financières chaque jour1 5 nouveaux documents de recherche sont produits par Wall Street chaque minute1 Les gestionnaires d’actif peuvent recevoir jusqu’à 1 000 e-mails par jour1 “Le volume du flux d’information rend la prise de décision en confiance difficile” Sources: 1 - www.financial-domain.info/integrating-qualitative-and-quantitative-information/ -Adam Margolis, Citi trader 2- IBM Client experience with ForEx traders29 3 – Derived from NYSE data © 2012 IBM Corporation
  • 30. IBM Watson va travailler pour Wall Street What if … financial institutions had the information it needed to make informed client decisions every time? Citi is doing it! • Deep content analysis to improve and simplify the banking experience • Enhance the accuracy and speed of organizational decision making • More informed recommendations about new client opportunities • First-of-a-kind deployment for IBM Watson in financial services “We will collaborate with IBM to explore how we can use the Watson technology to provide our customers with new, secure services designed around their increasingly digital and mobile lives.” - Don Callahan, CAO & CIO30 © 2012 IBM Corporation
  • 31. Citigroup va évaluer de possibles usages dusuperordinateur Watson d’IBM Edition du 06/03/2012 Technologie - L’accord prévoit que l’institution financière examine les possibilités offertes par Watson pour améliorer le service clients. IBM et Citigroup ont annoncé la conclusion d’un partenariat qui vise à explorer les opportunités offertes par le superordinateur Watson grâce à ses capacités en matière d’analyse approfondie de contenus et d’apprentissage par la preuve. L’objectif est de voir comment Watson pourrait contribuer à améliorer les services bancaires de Citigroup et notamment les transactions des clients investisseurs en analysant leur besoin tout en compulsant à la volée une grande quantité d’informations financières, économiques et contextuelles les concernant. « Nous travaillons à repenser les multiples manières dont nos clients interagissent avec l’argent », explique Citigroup. Nous collaborerons avec IBM pour explorer comment nous pouvons utiliser Watson pour fournir à nos clients de nouveaux services sécurisés adaptés à leur pratique toujours plus numérique et mobile.»31 © 2012 IBM Corporation
  • 32. IBM a mis les technologies Watson au service du secteur de la Finance Quality of Institutional Financial Earnings Credit Risk Planning Challenge Challenge Challenge Evaluating earnings is Credit provisioning decisions Financial Advisors are complex, time-consuming and bond investments are challenged to provide and often incomplete often made without a complete personalized advice to assessment clients Solution Solution Solution IBM Watson can leverage IBM Ready for Watson IBM Ready for Watson unstructured data, products can create a products can aggregate evaluate hypothesis, single view of the bond for and analyze bank and respond with confidence, a complete risk profile social data to and align and learn as it goes – drawing numerous sources "best" advice options to improving valuations of unstructured information investment goals Outcomes Outcomes Outcomes Insights into earnings can Improved credit decisions Informed advice and enhance investor and bond investments personalized actions confidence improving generate significant returns improve customer loyalty return on investments & revenue32 © 2012 IBM Corporation
  • 33. IBM Watson Progression Path L’offre “Ready for Watson” permet de définir la courbe de progression de Watson Manage the volume, Generate actionable insight Transform results by variety and velocity of that will drive your business integrating insights data that fuels your forward into business actions businessBusiness Value Outcome 3 Optimize Outcomes 2 Analyze Patterns 1 Manage Data Infosphere BigInsights, Streams Cognos Business Intelligence Smarter Customer Interaction Master Data Mgmt ICPA (ICA / SPSS modeler) Advanced Case Management Identity Manager G2 Sensemaking WBR (ILOG), Decision Mgmt 33 Use of Smarter Planet capabilities © 2012 IBM Corporation
  • 34. Evolution de l’expérience analytique avec IBM Next Generation Analytics: Reasoning & Learning Enterprise Analytics Personal Analytics34 © 2012 IBM Corporation
  • 35. ANNEXE Le Futur35 © 2012 IBM Corporation
  • 36. Evolution de la puissance des processeurs Single thread performance is slowing dramatically Dans 12 ans, Watson sera de la taille Power is limiting Compute Power 1969 and 2007 practical performance d’un portable Multicore architectures will commoditize 80 TFlops supercomputing Transistor performance scaling continues, butComputer Apollo Guidance at iPhone a slower rate 72K Read only Memory 1/2 8K of RAM X 2 million 16GB RAM 0.5 2010 TFlops 2MHz X 600 1.2GHz, 1440 1MIPS 32 Kg /200 2 2013 135 g 4 10’000 61cm x 32cm x 15cm /350 115mmx61mmx11.6mm 80 Watt /130 8 2016 Cray 1s 600mW 16 Sources: 32 287 Pentium 4s One 2019 AGC: http://www.ddj.com/184404139 64 One iPhone: http://www.apple.com/iphone/specs.html ARM11: http://www.physorg.com/newsh5139.html 128 2023 Teraflop Teraflop is equivalent to: is equivalent to: 5’000 iPods 1 Game Console 36 © 2012 IBM Corporation
  • 37. Une nouvelle génération d’ordinateurs : “apprendre et raisonner” Feuille de Route Technique Watson Static Learning Autonomous Dynamic Learning Systems Systems Learning Systems Watson Medical Security Call Centers Revenue Maximization Systems Fraud Prevention Medical Investisseurs for Retail Product Launch Data Data (dynamic) Policy Creativity Hypothesis Hypothesis (multi-domain) Intuition Engines Scoring Scoring (multi-modal) + Verification Abstraction Decision Decision (deeper reasoning) Outcome … Digitized Information Crowd-Sourcing Crawlers Domain adaptation software tools Bio-InspiredTechnologies Machine Learning Deep Learning Algorithms Computation Compute Power Hardware accelerators (von & non-von) Biological Inspiration: Cognitive Process Understanding 2010 2015 >2020 37 37 © 2012 IBM Corporation
  • 38. www.ibmwatson.com. www.facebook.com/ibmwatson. www.twitter.com/ibmwatson (Tweet #ibmwatson ) www.youtube.com/ibm MERCI38 © 2012 IBM Corporation

×