• Save
Jean Rohmer
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
1,335
On Slideshare
1,335
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
0
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. De l’Intelligence Artificielle au Calcul Littéraire: Pourquoi j’ai zappé le Web Sémantique Jean Rohmer Ecole Supérieure d’Ingénieurs Léonard de Vinci « Les Rencontres du Web des Données » 14 Octobre 2011 Salle Triangle Musée Pompidou Organisées par Alexandre Monnin et Gautier Poupeau
  • 2. Coordonnées: jean.rohmer@devinci.fr Blog: « PLEXUS LOGOS CALX »Quelques publications: SLIDESHARE JEAN ROHMER
  • 3. Je parle en tant que chercheur, programmeur et utilisateur de mes développements Je fais de l’informatique depuis 44 ans Je suis déçu par l’évolution de l’informatique Depuis 40 ans on n’a presque rien trouvé de neuf en logiciel Le logiciel n’est pas réductible à de l’ingénierieJ’essaie de programmer des Amplificateurs d’IntelligenceJ’écris du contenu sémantique chaque jour depuis 1997 Le nœud du problème est le langage: langage de programmation et langage naturel
  • 4. Etymologiquement, programmer veut dire « écrire à l’avance » Le futur n’est pas écrit, donc la programmation n’a pas de futur La programmation n’a pas de passé: on a oublié les meilleurslangages (Lisp, APL, Prolog) et l’Intelligence Artificielle des années 80.Il est très difficile de développer des applications intelligentes avec les langages à la mode On a oublié ce qu’était une application intelligente « Software Engineering » est une contradiction dans les termes Il y a deux sortes de langages de programmation: ceux faits pour programmer les machines (à la mode), ceux faits pour résoudre des problèmes difficiles (oubliés)
  • 5. Le langage naturel est très structuréSeul les humains comprennent le langage naturelComprendre le langage naturel demande un effort personnel dont n’a idée aucune machineNous ne savons pas comment nous comprenons la structure complexe du langage naturel Nous ne savons pas expliquer à une machine comment comprendre le langage naturel L’homme essaie depuis toujours d’inventer des langages calculables
  • 6. Ce qu’une machine sait représenter, elle ne sait pas le comprendreUne connaissance hors de la tête de quelqu’un, ça ne veut rien direNous ne sommes pas assez intelligents pour fabriquer une machine aussi intelligente que nous
  • 7. MESOPOTAMIE V1
  • 8. MESOPOTAMIE V2
  • 9. Mésopotamies• On ne sait pas mieux faire d’applications intelligentes qu’il y a 20 ans ( 5300 ans ?)• On a moins de temps et moins d’argent• En pratique, des organismes très haut de gamme et très cruciaux pour la collectivité ne font que du Excel « à la main ». Voici un exemple sur la vue suivante.
  • 10. HISTOIRE Antiquité Moyen-âge Descartes et Leibniz Logique Mathématique Intelligence Artificielle des années 80-95 Idéliance dans les année 95-05Grands Projets Défense / Renseignement / Sécurité Calcul Littéraire
  • 11. Les hiéroglyphes introduisent la notion de type sémantique, qui combiné àun autre signe, en précise l’interprétation.
  • 12. PAOLO ROSSI: «I filosofi e le macchine» (Feltrinelli, 2002) «La nascita della scienza moderna» (Laterza, 1997) Editi o riediti con il Mulino: «Clavis universalis» (1983), «Il passato, la memoria, l’oblio» (1991, premio Viareggio 1992), «Un altro presente» (1999), «Francesco Bacone» (2004), «Speranze» (2008).Voir également: Frances A. Yates: TheArt of Memory (disponible aussi enfrançais)
  • 13. (Peter Matussek:) GiulioCamillo (1480 - 1544) was aswell-known in his era as BillGates is now. Just like Gateshe cherished a vision of auniversal Storage andRetrieval System, and justlike Microsoft Windows, hisTheatre of the Memory was,despite constant revision,never completed. Camilloslegendary Theatre of Memoryremained only a fragment, itsbenefits only an option for thefuture. When it was finished,the user - so he predicted -would have access to theknowledge of the wholeuniverse
  • 14. Arbor Scientiae: Ontologies Universelles RAMON LLUL (1232 -1316) Combinatoires« une lecture directe de l’alphabet que le Créateur a gravé dans les choses »
  • 15. RESEAU SEMANTIQUE ET LOGIQUE DU 16 EME SIECLE DANS LACATHEDRALE DE GRENADE MODELISANT LA SAINTE TRINITE
  • 16. IDEE D’UNE CONTINUITE ENTRE MÉMOIRE /CONNAISSANCE / LOGIQUE / RAISONNEMENT AUTOMATIQUE BRUNO (1548-1600) BACON (1561-1626) COMENIUS (1592-1670) DESCARTES (1596 -1650) LEIBNIZ (1646-1716)
  • 17. DESCARTES ET LEIBNIZ• PROJET D’UNE LANGUE UNIVERSELLE CALCULABLE• ETROITEMENT ASSOCIEE A DES ONTOLOGIES UNIVERSELLES• AVEC DES MECANISMES « COMBINATOIRES »• VOIR AUSSI LE CONTEMPORAIN PIERRE LEVY AVEC LE LANGAGE IEML
  • 18. Descartes• « établir un ordre entre toutes les pensées, … de même qu ’il y en a un établi entre les nombres »• « cette langue aiderait au jugement , lui représentant si distinctement les choses qu ’il lui serait presque impossible de se tromper »• « je tiens que cette langue est possible … mais n ’espérez jamais la voir en usage … sauf au Paradis Terrestre … »
  • 19. Leibniz• « quoique cette langue dépende de la vraie philosophie, elle ne dépend pas de sa perfection »• « à mesure que la science des hommes croîtra, cette langue croîtra aussi »• « alors raisonner et calculer sera la même chose »
  • 20. GRANDES REALISATIONS IA DES ANNEES 1980-1995 Programmation en LISP et PROLOG Systèmes Experts Ingénieurs de la Connaissance Méthode KADS Tous les projets en « K » Plan« 5 ème Génération » JaponaisInterrogation des bases de données en langage naturel Programmation par contraintes S’est terminé par l’ « AI Winter » Assez différent de l’IA d’aujourd’hui (statistiques, apprentissage automatique, optimisation combinatoire, business rules)
  • 21. LANGAGES LISP (1962) ETPROLOG (1972)STUPIDEMENT IGNORESAUJOURD’HUI
  • 22. LES SYSTEMES A BASE DE CONNAISSANCES DES ANNES 1980LA DERNIERE TENTATIVE REUSSIE DE FAIRE DES APPLICATIONS « INTELLIGENTES »
  • 23. METAPEDIA (1988-1992)150 000 ARTICLES ENCYCLOPEDIQUES MODELISES EN RESEAUX SEMANTIQUES MULTIUTILISATEURS
  • 24. METAPEDIA:70 STATIONS DE TRAVAIL EN RESEAU POUR EXPERTS ET COGNITICIENS
  • 25. OPEN KADS (1990)ATELIER DE GESTION DECONNAISSANCESBIEN PLUS PUISSANT QUEPELLETPROTEGERACERAnd CO
  • 26. CORAIL: INTERROGATION DEBASES DE DONNEES ENLANGAGE NATUREL (1990)
  • 27. RAMSES: GESTION DE CRISE DESJO ALBERTVILLE 1992 /MODELISATION DESCONNAISSANCES / SYSTÈMEEXPERT / LANGAGE NATUREL /PLANIFICATION
  • 28. SACHEM (1989-1995)• Conduite des Hauts-Fourneaux• Le plus grand système expert au monde• 25 Millions d’Euros• Modélisation Objet des Connaissances• Méthode de modélisations des connaissances: KADS (origine de OWL)• Une approche encyclopédique de la Sidérurgie (« le Savoir Fer »)
  • 29. AI WINTER• Sur les rasons de l’AI Winter, voir• http://www.dfki.uni-kl.de/~sauermann/2006/05/17_talkjeanrhomer/rohmer-ai-pastpresentandfuture.PDF• Je me réchauffe avec IDELIANCE• 1993 …• Conçu par Sylvie Le Bars (www.arkandis.com) et Jean Rohmer• Implémenté principalement par Jean Rohmer, Stéphane Jean, Denis Poisson• Actuellement propriété de Thales, qui en permet l’utilisation non commerciale sur simple demande
  • 30. IDELIANCE (1993 - …) S’est d’abord appelé:ORCCA : « Online Resources for Corporate Citizens Action » Et aussi: IDECRITURE MÉMOIRE PERSONNELLE
  • 31. IDELIANCE 1993 …
  • 32. IDELIANCE PAS DE DEFINITION DE MODELE A PRIORIMAIS EMERGENCE DES STRUCTURES SEMANTIQUESPAR UN OUTIL DE DECOUVERTE / APPRENTISSAGE A PARTIR D’ENONCES SUJET / VERBE / COMPLEMENT INVERSES / CATEGORIES ENTRES A LA MAINOU IMPORTES DEPUIS DES DONNEES STRUCTUREES
  • 33. IDELIANCENOMBREUX OUTILS D’EXPLOITATION DE L’INFORMATION:•GRAPHES•OPERATIONS SUR LES GRAPHES•TABLEAUX DE BORD• REQUETES•IMPORT: EXCEL, RELATIONNEL, XML•EXPORT: EXCEL, WORD, XML, SIG•LIAISON AVEC LE SYSTEME D’INFORMATION GEOGRAPHIQUEGEOCONCEPT
  • 34. GRAPHE« QUOI-ENTRE »
  • 35. EXTRACTIONSEMANTIQUE ASSISTEE
  • 36. FORMAT SVC
  • 37. FORMAT SVCI
  • 38. Format SVC Format SVC: triplet:Pierre / habite à / MarseilleMarie / travaille à / SNCM
  • 39. Format SVCI: quadruplet (Dès l’origine dans IDELIANCE) Pierre / habite à / Marseille / E45 Marie / travaille à / SNCM / E657 E45 / parce que / E657 / E10 Max / dit que / E10 / E 123Max dit que Pierre habite à Marseille parce que Marie travaille à SNCM
  • 40. GRANDS PROJETS Défense / Sécurité / RenseignementUNE DOUCE ILLUSION PARTAGEE DESPHYSICIENS AUXDECIDEURS VIA LESCHARLATANS
  • 41. Exemple d’un système sémantique de veille
  • 42. VISION GENERALE D’UN SYSTÈME SEMANTIQUE CAPTURE AND MERGE DEDUCTION, HETEROGENEOUS ANALOGY, SOURCES OF INFORMATION CLASSIFICATION, INTO AN UNIFIED DISCOVERY, HUMAN READABLE FORMAT WEAK SIGNS DETECTION SEMANTIC NETS SEMANTIC NETS SEMANTIC NETS PRODUCTION MANAGEMENT ANALYSIS ASK MORE NAVIGATE, QUERY ENRICHINFORMATIONS VISUALIZE, UPDATE, SEMANTIC NETSFROM SOURCES WITH ANALYSIS DESIGN, RESULTS RESTRUCTURE, PUBLISH A AA Continuous Collective Process From Data to Knowledge
  • 43. CONSTATS• AI WINTER• 1% des gens acceptent IDELIANCE• Illusions• Charlatans• Que faire ?• Sortir de l’immédiateté• Réfléchir• Théorie Des Deux Trous Noirs
  • 44. IT COSMOLOGY: DICTATURE OF TWO BLACKHOLES LBH: LITTERATUS Black Hole« dispute » Realm of DOCUMENTS PLAIDEURS KM WEB 2.0 Forbidden zone! A.I. Blasted Out! Object Oriented Languages Semantic WEB SQL COMPTABLES XML Realm of PROGRAMS « compute » CBH: CALCULUS Black Hole
  • 45. Moins de critique littéraire, moins de calcul scientifiquePlus de critique scientifique, plus de calcul littéraire Fabriquer un Excel Littéraire Fabriquer un PowerPoint Sémantique Faire faire du calcul aux gens d’en haut Donner de la matière littéraire aux gens d’en basRêver un Foucault programmeur de « l’Archéologie du Savoir » Rêver un Spinoza programmeur Rêver un Wittgenstein programmeur
  • 46. SOFTWARE CRISIS The major cause of the software crisis is that themachines have become several orders of magnitude more powerful! As long as there were no machines, programming was no problem at allWhen we had a few weak computers, programming became a mild problemNow we have gigantic computers, programming has become an equally gigantic problem Edsger Dijkstra 1968
  • 47. L’informatique technique est un mélange d’académisme, de bricolage, de marketing, de mode, de religions, de sectesLe management méprise l’informatique, les jeunes s’en détournent Les professionnels se barricadent dans un jargon techniquerepoussant et font du racket « payez, et nous nous occupons de tout » (intégration, externalisation, cloud computing)On n’arrive pas à utiliser la puissance du hardware pour rendre le software plus simple« L’interconnexion des silos d’information par des Web Servicesconduit à des systèmes cauchemardesques » (Pierre Col, 11/10/ 2011) L’INFORMATIQUE TECHNIQUE EST UNE TARTE AU CITRON MERINGUEE: DEFINITIVEMENT FIGEE
  • 48. ESSAYONS AUTRE CHOSE!PAS DE DOCUMENTS PAS DE BASES DE DONNEESPAS DE PROGRAMMES PAS D’ONTOLOGIESPAS DE MODELES PAS DE LOGIQUE FORMELLEPAS DE GRAMMAIRES PAS DE FORMATS LANGAGE NATUREL EMERGENCE DISCIPLINE GEOMETRIE ALTERITE ANALOGIE INTERACTION RESPONSABILITE LOCALITE EDUCATION MOINS D’INGENIERIE INCULTE PLUS D’UTILISATION RESPONSABLE
  • 49. CLAIM• Natural Language is the Ultimate Open Source Standard.• Natural language exists for « more than » 100000 years• Natural Language will exist in 2120• Which Computer Format (like XML) will exist in 2120 ?
  • 50. • De la PRO-grammation• À l’IM-PRO-grammation• Feriez-vous confiance à un accompagnateur de voyage qui ne saurait pas IM-PRO-viser ?
  • 51. Tim Berners-Lee: The Web is now philosophical engineering Staline: Les écrivains sont les ingénieurs de l’âmeLes ontologies sont produites par les ingénieurs du sens Les ingénieurs ne doivent pas fabriquer du sensLes ingénieurs doivent fabriquer des instruments de mise en contact / osmose avec l’informationLe Web Sémantique, c’est l’Intelligence Artificielle sans les applications Le grand mérite du Web Sémantique à la W3C est de poser la question « Pourquoi ça ne marche pas »
  • 52. Tim Berners-Lee a commencé le Web car il savait le faireTim Berners-Lee a commencé le Web Sémantique car il ne savait pas le faire
  • 53. FREE LIBREOPEN OUVERT
  • 54. NET = NEXUS = NŒUD = NASSE = RETS = RESEAU = FILET
  • 55. Triplet RDF URI
  • 56. MY NAME IS TIM !
  • 57. A quoi bon LIBERER les données si c’est pour les LINKER à des URI dès leur sortie de prison ? LIBRE OU LIE, il faut choisir! N’échangeons pas une prison locale contre une prison mondiale Les URI ne sont pas des identifiants, mais desadresses, des lieux (donc des URL) dans l’unique mémoire mondiale Les URI sont dans l’orbite du Trou Noir du CalculUne information est un énoncé et non un identifiant Un énoncé a physiquement une adresseL’atome de sens c’est l’énoncé et non l’identifiant
  • 58. On ne peut pas faire de systèmes ouverts avec des technologies ferméesOn ne peut modéliser des données libres avec des à-priori d’ingénierie technique Par définition, l’intelligence artificielle ne peut être invisible Il ne faut pas cacher la technologie, il faut faire des technologies visibles Le seules données vraiment structurées sont celles liées à l’argent, aux chiffres Les chiffres se passent très bien d’URI Les chiffres sont leurs propres URI Les données les mieux structurées se passent d’URIToutes les données non structurées sont très richement structurées (PPT, EXCEL, Langage Naturel, Document) Toutes les données structurées sont très pauvrement structurées (triplets)
  • 59. LES SEULES DONNEES LIBRESSONT LES DONNEES SOUS FORME NATURELLE
  • 60. Au commencement sont les énoncésLes (id) entités émergent des énoncés et non l’inverseOn ne peut pas porter une entité à la connaissance de quelqu’un sans faire au moins deux énoncés Si l’atome est l’énoncé, on pourra se passer des documents dans le futurSi l’on n’a plus de documents, on n’a plus besoin de métadonnéesLes métadonnées sont des énoncés comme les autresNon au monde carcéral des documents enserrés dans des rets de métadonnées enchaînées à des URI !
  • 61. Dans un ordinateur, ne mettons que des énoncés Information is the System Usage is the Architect Practice alterity to alter IT Le Web 1.0 permet de lire facilement des choses écrites difficilement Le Web 2.0 permet d’écrire facilement des choses difficiles à lireQuand il s’agit de travailler, on retourne à Excel et à PowerPoint Faire un Web qui facilite et amplifie l’écriture, la lecture et le TRAVAIL / LA REFLEXION = Web 3.0!
  • 62. Les ordinateurs ont besoin de formats et de modèles Les humains détestent les formats et les modèles Le Software Engineering et la Programmation sont des bureaucraties de gestion de formats et modèles Les formats et modèles informatique ne sont pas biodégradables; ils s’accumulent et polluentLes formats sont manipulés en cachette du public par des travailleurs spécialisés appelés programmeurs Il est difficile et couteux de démanteler les centrales à formats ( = les applications), et de recycler les formats Des organisations mondiales essaient d’imposer des formats et modèles standard J’ai choisi le langage naturel comme format standard
  • 63. Une ontologie est un ensemble d’énoncés comme les autresUn dictionnaire, un tableau Excel, un thésaurus … sont des ensembles d’énoncés comme les autresOn a le droit de vouloir faire des ontologies au sens du W3C à condition de savoir que c’est impossibleFaites les ontologies qui vous sont utiles sous la forme humaine que vous préférezTraduisez ces ontologies en énoncés en langage naturel Mélangez cette ontologie avec d’autres énoncés en langage naturel Faites du calcul littéraire sur les ensemble d’énoncés
  • 64. Seule l’altérité, et non l’ontologie peut résoudre le problème de l’identité
  • 65. Ne mettez pas d’ingénieurs dans la boucleFaites vous-même tout le travail sur le sens et le contenuIl ne faut pas informatiser les sciences humaines, il faut humaniser l’informatique C’est aux ingénieurs de construire l’appareil C’est aux autres de l’utiliser
  • 66. DEMOGRAPHY, REPRESENTATION, COMPUTERSuser acceptance natural language formal logic computer capabilities
  • 67. Ne pas dire: « faire une machine humanoïde qui comprend le sens » Dire: « mettre dans les machines des informations humaines» (cf injecter des cellules saines dans un organisme malade)Programmer la machine pour en faire un instrument qui met l’utilisateur en osmose avec les informations humainesAugmenter la surface de contact entre les gens et les formes naturelles Enaction ?
  • 68. Calcul sur des Réseaux Sémantiques
  • 69. MERGE MANY SOURCES INTO AN UNIQUE SEMANTIC NETWORK OF MEETINGS, PEOPLE, PLACES, DATES ... From web mining Fred L. From Humint Marco L. Oct 17 London MEETING AHans X. Jamel B. Kees C. MEETING CMunich MEETING B Paris MEETING D John A. From database Theo Z. Sept 23 Sven F. From Jane ’s files
  • 70. Mapping of an Organisation via a Journey from Informations to Intelligence Intelligence Report About Organisation XXX Raw Informations AboutOrganisation XXX
  • 71. LITTERATUS CALCULUS FUNDAMENTALS INFERON:minimal and autonomous sentence in natural language INTERLOGOS: set intersection (words) of two INFERONS ARGOS: a subgraph of INFERONS and their INTERLOGOS
  • 72. EXAMPLEThere are two national airlines havingThere are two national airlines having airlines airlines scheduled flights to airport of Tivat scheduled flights to airport of Tivat Montenegro Airlines opens an Montenegro Airlines opens an flights tivat airport airlines Agency in Kotor Agency in Kotor flights tivat airport airlines Montenegro Airlines has regular flights Montenegro Airlines has regular flights montenegro airlines montenegro airlines serving Tivat Airport serving Tivat Airport
  • 73. OUR GOAL IS TO REPLACEINFORMATION SYSTEMS, DOCUMENTS, DATABASES BY USERS INTERACTION(WRITE, READ, QUERY, REUSE, ANALYSE, VISUALIZE, NAVIGATE, COMPUTE …) WITH INFERONS
  • 74. IDELIANCE « IN-BETWEEN »
  • 75. AZIMUTS Inventé en 1996 par J. Rohmer et Sylvie le BarsPuissante généralisation de la « navigation par facettes » introduite bien plus tard Donner les manettes à l’utilisateur L’utilisateur va « IM-PRO-grammer Construction interactive de graphes d’ensembles de Sujets / Verbes / Compléments
  • 76. Construction dynamique de Azimut avec circuits:graphes d’ensembles de S,V,C « Les personnes qui travaillentTout nœud du graphe peut dans des sociétés dont leurservir de point d’expansion / conjoint est actionnaire »restriction / coloriage de l’azimut
  • 77. AZIMUTS: Une implémentation de 1996 en IDELIANCE
  • 78. « QUOI-ENTRE » EN CALCUL LITTERAIRE
  • 79. Réponse à une question complexe par un azimut de calcul littéraire What are the domains of expertise of Laure which are also known of Polytechnique students?
  • 80. AZIMUTS: la voie de la liberté pour l’utilisateur qui dessine sa problématiquePremière tentative pour donner aux gens le pouvoir de faire du calcul littéraire sans « ingénieurs » Supprimer les applications : App-Killer User is the ArchitectL’ontologie est définie dynamiquement par l’utilisation de l’information (Karima Rafes, Bordercloud)C’est l’utilisateur (et non les logiciels ou les données) qui devient libre
  • 81. SI ON REMPLACE LES ENONCES PAR DES IMAGES ? SI ON REMPLACE LES INTERLOGOS PAR DES INTERSECTIONS D’IMAGES ? SI ON REPRESENTE UNE VIDEO COMME UN LIGNED’IMAGES, CHACUNE PARTAGEANT DES INTERLOGOSAVEC D’AUTRES IMAGES APPARTENANT A D’AUTRES LIGNES ? VERS DES AZIMUTS SPATIO-TEMPORELS
  • 82. Exemple de Calcul Littéraire: géométrie et symétrie A: chien means dog B: chat means cat C: dog signifie chien D: cat signifie xxx Find xxx
  • 83. Power of Symmetry chien - dog cat A: chien means dogmeans signifie B: chat means cat C: dog signifie chien D: cat signifie xxx chat xxx xxx est symétrique de chat cat signifie chat !
  • 84. Pratiquer le Calcul Littéraire• C’est prendre ses notes sous forme d’inférons (cf Idécriture)• En attendant que des outils les exploitent (cryosémantique).
  • 85. Altérité « Alter IT » = « changer l’informatique• Le système d’information dépend de la qualité de ses utilisateurs• Chaque utilisateur est responsable de ce qu’il dépose en langage naturel dans la machine• L’altérité remplace l’ingénierie• S’entrainer, s’améliorer au calcul littéraire• S’entrainer, s’améliorer à l’Idécriture
  • 86. ALTERITE ET CHARITE BIEN ORDONNEE … CONSTRUIRE, CULTIVER SA PROPRE COLLECTION D’ENONCES RESTER MAITRE DES ENONCES ENTRANTS ANGE GARDIEN SEMANTIQUE MÉMOIRE PERSONNELLE PERSONET (Pierre Berger)
  • 87. Pour conclure ENTRE INFORMATIQUE ET SCIENCES HUMAINES CONSTRUISONS ENSEMBLELA THEORIE DE L’INFORMATION QUI NOUS MANQUE