1. De l’Intelligence Artificielle au Calcul Littéraire:
Pourquoi j’ai zappé le Web Sémantique
Jean Rohmer
Ecole Supérieure d’Ingénieurs Léonard de Vinci
« Les Rencontres du Web des Données »
14 Octobre 2011 Salle Triangle Musée Pompidou
Organisées par Alexandre Monnin et Gautier Poupeau
2. Coordonnées:
jean.rohmer@devinci.fr
Blog: « PLEXUS LOGOS CALX »
Quelques publications: SLIDESHARE JEAN
ROHMER
3. Je parle en tant que chercheur, programmeur et utilisateur
de mes développements
Je fais de l’informatique depuis 44 ans
Je suis déçu par l’évolution de l’informatique
Depuis 40 ans on n’a presque rien trouvé de neuf en
logiciel
Le logiciel n’est pas réductible à de l’ingénierie
J’essaie de programmer des Amplificateurs d’Intelligence
J’écris du contenu sémantique chaque jour depuis 1997
Le nœud du problème est le langage: langage de
programmation et langage naturel
4. Etymologiquement, programmer veut dire « écrire à l’avance »
Le futur n’est pas écrit, donc la programmation n’a pas de futur
La programmation n’a pas de passé: on a oublié les meilleurs
langages (Lisp, APL, Prolog) et l’Intelligence Artificielle des années 80.
Il est très difficile de développer des applications intelligentes avec les
langages à la mode
On a oublié ce qu’était une application intelligente
« Software Engineering » est une contradiction dans les termes
Il y a deux sortes de langages de programmation: ceux faits pour
programmer les machines (à la mode), ceux faits pour résoudre des
problèmes difficiles (oubliés)
5. Le langage naturel est très structuré
Seul les humains comprennent le langage naturel
Comprendre le langage naturel demande un effort
personnel dont n’a idée aucune machine
Nous ne savons pas comment nous comprenons la
structure complexe du langage naturel
Nous ne savons pas expliquer à une machine
comment comprendre le langage naturel
L’homme essaie depuis toujours d’inventer des
langages calculables
6. Ce qu’une machine sait représenter, elle ne sait pas le
comprendre
Une connaissance hors de la tête de quelqu’un, ça ne
veut rien dire
Nous ne sommes pas assez intelligents pour fabriquer
une machine aussi intelligente que nous
9. Mésopotamies
• On ne sait pas mieux faire d’applications
intelligentes qu’il y a 20 ans ( 5300 ans ?)
• On a moins de temps et moins d’argent
• En pratique, des organismes très haut de
gamme et très cruciaux pour la collectivité
ne font que du Excel « à la main ». Voici
un exemple sur la vue suivante.
10.
11. HISTOIRE
Antiquité
Moyen-âge
Descartes et Leibniz
Logique Mathématique
Intelligence Artificielle des années 80-95
Idéliance dans les année 95-05
Grands Projets Défense / Renseignement / Sécurité
Calcul Littéraire
12. Les hiéroglyphes introduisent la notion de type sémantique, qui combiné à
un autre signe, en précise l’interprétation.
13. PAOLO ROSSI:
«I filosofi e le macchine» (Feltrinelli, 2002)
«La nascita della scienza moderna»
(Laterza, 1997)
Editi o riediti con il Mulino:
«Clavis universalis» (1983),
«Il passato, la memoria, l’oblio» (1991,
premio Viareggio 1992),
«Un altro presente» (1999),
«Francesco Bacone» (2004),
«Speranze» (2008).
Voir également: Frances A. Yates: The
Art of Memory (disponible aussi en
français)
14. (Peter Matussek:) Giulio
Camillo (1480 - 1544) was as
well-known in his era as Bill
Gates is now. Just like Gates
he cherished a vision of a
universal Storage and
Retrieval System, and just
like Microsoft Windows, his
'Theatre of the Memory' was,
despite constant revision,
never completed. Camillo's
legendary Theatre of Memory
remained only a fragment, its
benefits only an option for the
future. When it was finished,
the user - so he predicted -
would have access to the
knowledge of the whole
universe
15. Arbor Scientiae:
Ontologies Universelles
RAMON LLUL (1232 -1316)
Combinatoires
« une lecture directe de l’alphabet que le Créateur a gravé dans les choses »
16.
17. RESEAU SEMANTIQUE ET LOGIQUE DU 16 EME SIECLE DANS LA
CATHEDRALE DE GRENADE MODELISANT LA SAINTE TRINITE
18. IDEE D’UNE CONTINUITE ENTRE MÉMOIRE /
CONNAISSANCE / LOGIQUE / RAISONNEMENT
AUTOMATIQUE
BRUNO (1548-1600)
BACON (1561-1626)
COMENIUS (1592-1670)
DESCARTES (1596 -1650)
LEIBNIZ (1646-1716)
19. DESCARTES ET LEIBNIZ
• PROJET D’UNE LANGUE UNIVERSELLE
CALCULABLE
• ETROITEMENT ASSOCIEE A DES
ONTOLOGIES UNIVERSELLES
• AVEC DES MECANISMES
« COMBINATOIRES »
• VOIR AUSSI LE CONTEMPORAIN
PIERRE LEVY AVEC LE LANGAGE IEML
20. Descartes
• « établir un ordre entre toutes les pensées, … de
même qu ’il y en a un établi entre les nombres »
• « cette langue aiderait au jugement , lui représentant si
distinctement les choses qu ’il lui serait presque
impossible de se tromper »
• « je tiens que cette langue est possible … mais
n ’espérez jamais la voir en usage … sauf au Paradis
Terrestre … »
21. Leibniz
• « quoique cette langue dépende de la
vraie philosophie, elle ne dépend pas de
sa perfection »
• « à mesure que la science des hommes
croîtra, cette langue croîtra aussi »
• « alors raisonner et calculer sera la
même chose »
22. GRANDES REALISATIONS IA
DES ANNEES 1980-1995
Programmation en LISP et PROLOG
Systèmes Experts
Ingénieurs de la Connaissance
Méthode KADS
Tous les projets en « K »
Plan« 5 ème Génération » Japonais
Interrogation des bases de données en langage naturel
Programmation par contraintes
S’est terminé par l’ « AI Winter »
Assez différent de l’IA d’aujourd’hui (statistiques,
apprentissage automatique, optimisation combinatoire,
business rules)
29. RAMSES: GESTION DE CRISE DES
JO ALBERTVILLE 1992 /
MODELISATION DES
CONNAISSANCES / SYSTÈME
EXPERT / LANGAGE NATUREL /
PLANIFICATION
30. SACHEM (1989-1995)
• Conduite des Hauts-Fourneaux
• Le plus grand système expert au monde
• 25 Millions d’Euros
• Modélisation Objet des Connaissances
• Méthode de modélisations des
connaissances: KADS (origine de OWL)
• Une approche encyclopédique de la
Sidérurgie (« le Savoir Fer »)
31.
32.
33. AI WINTER
• Sur les rasons de l’AI Winter, voir
• http://www.dfki.uni-kl.de/~sauermann/2006/05/17_talkjeanrhomer/rohmer-ai-pastpresentandfuture.PDF
• Je me réchauffe avec IDELIANCE
• 1993 …
• Conçu par Sylvie Le Bars (www.arkandis.com)
et Jean Rohmer
• Implémenté principalement par Jean Rohmer,
Stéphane Jean, Denis Poisson
• Actuellement propriété de Thales, qui en permet
l’utilisation non commerciale sur simple
demande
36. IDELIANCE
PAS DE DEFINITION DE MODELE A PRIORI
MAIS EMERGENCE DES STRUCTURES SEMANTIQUES
PAR UN OUTIL DE DECOUVERTE / APPRENTISSAGE
A PARTIR D’ENONCES
SUJET / VERBE / COMPLEMENT
INVERSES / CATEGORIES
ENTRES A LA MAIN
OU IMPORTES DEPUIS DES DONNEES STRUCTUREES
37. IDELIANCE
NOMBREUX OUTILS D’EXPLOITATION DE L’INFORMATION:
•GRAPHES
•OPERATIONS SUR LES GRAPHES
•TABLEAUX DE BORD
• REQUETES
•IMPORT: EXCEL, RELATIONNEL, XML
•EXPORT: EXCEL, WORD, XML, SIG
•LIAISON AVEC LE SYSTEME D’INFORMATION GEOGRAPHIQUE
GEOCONCEPT
46. Format SVC
Format SVC: triplet:
Pierre / habite à / Marseille
Marie / travaille à / SNCM
47. Format SVCI: quadruplet
(Dès l’origine dans IDELIANCE)
Pierre / habite à / Marseille / E45
Marie / travaille à / SNCM / E657
E45 / parce que / E657 / E10
Max / dit que / E10 / E 123
Max dit que Pierre habite à Marseille parce que Marie
travaille à SNCM
48. GRANDS PROJETS
Défense / Sécurité / Renseignement
UNE DOUCE
ILLUSION
PARTAGEE
DES
PHYSICIENS
AUX
DECIDEURS
VIA LES
CHARLATANS
50. VISION GENERALE D’UN SYSTÈME SEMANTIQUE
CAPTURE AND MERGE DEDUCTION,
HETEROGENEOUS ANALOGY,
SOURCES OF INFORMATION CLASSIFICATION,
INTO AN UNIFIED DISCOVERY,
HUMAN READABLE FORMAT WEAK SIGNS DETECTION
SEMANTIC NETS SEMANTIC NETS SEMANTIC NETS
PRODUCTION MANAGEMENT ANALYSIS
ASK MORE NAVIGATE, QUERY ENRICH
INFORMATIONS VISUALIZE, UPDATE, SEMANTIC NETS
FROM SOURCES WITH ANALYSIS
DESIGN, RESULTS
RESTRUCTURE,
PUBLISH
A AA Continuous Collective Process From Data to Knowledge
51. CONSTATS
• AI WINTER
• 1% des gens acceptent IDELIANCE
• Illusions
• Charlatans
• Que faire ?
• Sortir de l’immédiateté
• Réfléchir
• Théorie Des Deux Trous Noirs
52. IT COSMOLOGY: DICTATURE OF TWO BLACKHOLES
LBH: LITTERATUS Black Hole
« dispute »
Realm of DOCUMENTS
PLAIDEURS
KM
WEB 2.0
Forbidden zone! A.I. Blasted Out!
Object Oriented
Languages
Semantic WEB SQL
COMPTABLES XML
Realm of PROGRAMS
« compute » CBH: CALCULUS Black Hole
53. Moins de critique littéraire, moins de calcul
scientifique
Plus de critique scientifique, plus de calcul littéraire
Fabriquer un Excel Littéraire
Fabriquer un PowerPoint Sémantique
Faire faire du calcul aux gens d’en haut
Donner de la matière littéraire aux gens d’en bas
Rêver un Foucault programmeur de « l’Archéologie
du Savoir »
Rêver un Spinoza programmeur
Rêver un Wittgenstein programmeur
54. SOFTWARE CRISIS
The major cause of the software crisis is that the
machines have become several orders of magnitude
more powerful!
As long as there were no machines, programming
was no problem at all
When we had a few weak computers, programming
became a mild problem
Now we have gigantic computers, programming has
become an equally gigantic problem
Edsger Dijkstra 1968
55. L’informatique technique est un mélange d’académisme, de
bricolage, de marketing, de mode, de religions, de sectes
Le management méprise l’informatique, les jeunes s’en détournent
Les professionnels se barricadent dans un jargon technique
repoussant et font du racket « payez, et nous nous occupons de
tout » (intégration, externalisation, cloud computing)
On n’arrive pas à utiliser la puissance du hardware pour rendre le
software plus simple
« L’interconnexion des silos d’information par des Web Services
conduit à des systèmes cauchemardesques » (Pierre Col, 11/10/
2011)
L’INFORMATIQUE
TECHNIQUE EST UNE TARTE
AU CITRON MERINGUEE:
DEFINITIVEMENT FIGEE
56. ESSAYONS AUTRE CHOSE!
PAS DE DOCUMENTS PAS DE BASES DE DONNEES
PAS DE PROGRAMMES PAS D’ONTOLOGIES
PAS DE MODELES PAS DE LOGIQUE FORMELLE
PAS DE GRAMMAIRES PAS DE FORMATS
LANGAGE NATUREL EMERGENCE
DISCIPLINE GEOMETRIE
ALTERITE ANALOGIE
INTERACTION RESPONSABILITE
LOCALITE EDUCATION
MOINS D’INGENIERIE INCULTE
PLUS D’UTILISATION RESPONSABLE
57. CLAIM
• Natural Language is the Ultimate
Open Source Standard.
• Natural language exists for « more
than » 100000 years
• Natural Language will exist in 2120
• Which Computer Format (like XML)
will exist in 2120 ?
58. • De la PRO-grammation
• À l’IM-PRO-grammation
• Feriez-vous confiance à un
accompagnateur de voyage qui ne saurait
pas IM-PRO-viser ?
59. Tim Berners-Lee: The Web is now philosophical
engineering
Staline: Les écrivains sont les ingénieurs de l’âme
Les ontologies sont produites par les ingénieurs du sens
Les ingénieurs ne doivent pas fabriquer du sens
Les ingénieurs doivent fabriquer des instruments de mise
en contact / osmose avec l’information
Le Web Sémantique, c’est l’Intelligence Artificielle sans les
applications
Le grand mérite du Web Sémantique à la W3C est de
poser la question « Pourquoi ça ne marche pas »
60. Tim Berners-Lee a commencé le Web car il savait le faire
Tim Berners-Lee a commencé le Web Sémantique car il ne
savait pas le faire
65. A quoi bon LIBERER les données si c’est pour les
LINKER à des URI dès leur sortie de prison ?
LIBRE OU LIE, il faut choisir!
N’échangeons pas une prison locale contre une
prison mondiale
Les URI ne sont pas des identifiants, mais des
adresses, des lieux (donc des URL) dans l’unique
mémoire mondiale
Les URI sont dans l’orbite du Trou Noir du Calcul
Une information est un énoncé et non un identifiant
Un énoncé a physiquement une adresse
L’atome de sens c’est l’énoncé et non l’identifiant
66. On ne peut pas faire de systèmes ouverts avec des technologies fermées
On ne peut modéliser des données libres avec des à-priori d’ingénierie technique
Par définition, l’intelligence artificielle ne peut être invisible
Il ne faut pas cacher la technologie, il faut faire des technologies visibles
Le seules données vraiment structurées sont celles liées à l’argent, aux chiffres
Les chiffres se passent très bien d’URI
Les chiffres sont leurs propres URI
Les données les mieux structurées se passent d’URI
Toutes les données non structurées sont très richement structurées (PPT, EXCEL,
Langage Naturel, Document)
Toutes les données structurées sont très pauvrement structurées (triplets)
68. Au commencement sont les énoncés
Les (id) entités émergent des énoncés et non l’inverse
On ne peut pas porter une entité à la connaissance de
quelqu’un sans faire au moins deux énoncés
Si l’atome est l’énoncé, on pourra se passer des
documents dans le futur
Si l’on n’a plus de documents, on n’a plus besoin de
métadonnées
Les métadonnées sont des énoncés comme les autres
Non au monde carcéral des documents enserrés dans
des rets de métadonnées enchaînées à des URI !
69. Dans un ordinateur, ne mettons que des énoncés
Information is the System
Usage is the Architect
Practice alterity to alter IT
Le Web 1.0 permet de lire facilement des choses
écrites difficilement
Le Web 2.0 permet d’écrire facilement des choses
difficiles à lire
Quand il s’agit de travailler, on retourne à Excel et à
PowerPoint
Faire un Web qui facilite et amplifie l’écriture, la
lecture et le TRAVAIL / LA REFLEXION = Web 3.0!
70. Les ordinateurs ont besoin de formats et de modèles
Les humains détestent les formats et les modèles
Le Software Engineering et la Programmation sont des
bureaucraties de gestion de formats et modèles
Les formats et modèles informatique ne sont pas
biodégradables; ils s’accumulent et polluent
Les formats sont manipulés en cachette du public par des
travailleurs spécialisés appelés programmeurs
Il est difficile et couteux de démanteler les centrales à
formats ( = les applications), et de recycler les formats
Des organisations mondiales essaient d’imposer des
formats et modèles standard
J’ai choisi le langage naturel comme format standard
71. Une ontologie est un ensemble d’énoncés comme les
autres
Un dictionnaire, un tableau Excel, un thésaurus … sont
des ensembles d’énoncés comme les autres
On a le droit de vouloir faire des ontologies au sens du
W3C à condition de savoir que c’est impossible
Faites les ontologies qui vous sont utiles sous la forme
humaine que vous préférez
Traduisez ces ontologies en énoncés en langage naturel
Mélangez cette ontologie avec d’autres énoncés en
langage naturel
Faites du calcul littéraire sur les ensemble d’énoncés
73. Ne mettez pas d’ingénieurs dans la boucle
Faites vous-même tout le travail sur le sens et le contenu
Il ne faut pas informatiser les sciences humaines, il faut
humaniser l’informatique
C’est aux ingénieurs de construire l’appareil
C’est aux autres de l’utiliser
75. Ne pas dire: « faire une machine humanoïde qui
comprend le sens »
Dire: « mettre dans les machines des informations
humaines» (cf injecter des cellules saines dans un
organisme malade)
Programmer la machine pour en faire un instrument
qui met l’utilisateur en osmose avec les
informations humaines
Augmenter la surface de contact entre les gens et les
formes naturelles
Enaction ?
78. MERGE MANY SOURCES INTO AN UNIQUE SEMANTIC NETWORK
OF MEETINGS, PEOPLE, PLACES, DATES ...
From web mining Fred L. From Humint
Marco L.
Oct 17 London
MEETING A
Hans X.
Jamel B.
Kees C. MEETING C
Munich MEETING B
Paris MEETING D
John A.
From database Theo Z.
Sept 23
Sven F.
From Jane ’s files
79. Mapping of an Organisation
via a Journey from Informations to Intelligence
Intelligence
Report
About
Organisation XXX
Raw
Informations
About
Organisation XXX
80. LITTERATUS CALCULUS
FUNDAMENTALS
INFERON:
minimal and autonomous sentence in natural language
INTERLOGOS:
set intersection (words) of two INFERONS
ARGOS:
a subgraph of INFERONS and their INTERLOGOS
81. EXAMPLE
There are two national airlines having
There are two national airlines having airlines
airlines
scheduled flights to airport of Tivat
scheduled flights to airport of Tivat
Montenegro Airlines opens an
Montenegro Airlines opens an
flights tivat airport airlines Agency in Kotor
Agency in Kotor
flights tivat airport airlines
Montenegro Airlines has regular flights
Montenegro Airlines has regular flights montenegro airlines
montenegro airlines
serving Tivat Airport
serving Tivat Airport
82. OUR GOAL IS TO REPLACE
INFORMATION SYSTEMS, DOCUMENTS, DATABASES
BY USERS INTERACTION
(WRITE, READ, QUERY, REUSE, ANALYSE, VISUALIZE,
NAVIGATE, COMPUTE …)
WITH INFERONS
86. AZIMUTS
Inventé en 1996 par J. Rohmer et Sylvie le Bars
Puissante généralisation de la « navigation par facettes »
introduite bien plus tard
Donner les manettes à l’utilisateur
L’utilisateur va « IM-PRO-grammer
Construction interactive de graphes
d’ensembles de Sujets / Verbes / Compléments
87. Construction dynamique de Azimut avec circuits:
graphes d’ensembles de S,V,C
« Les personnes qui travaillent
Tout nœud du graphe peut dans des sociétés dont leur
servir de point d’expansion / conjoint est actionnaire »
restriction / coloriage de l’azimut
90. Réponse à une question complexe par un azimut de calcul littéraire
What are the domains of expertise of Laure which are also known
of Polytechnique students?
91. AZIMUTS: la voie de la liberté pour l’utilisateur qui
dessine sa problématique
Première tentative pour donner aux gens le pouvoir de
faire du calcul littéraire sans « ingénieurs »
Supprimer les applications : App-Killer
User is the Architect
L’ontologie est définie dynamiquement par l’utilisation
de l’information (Karima Rafes, Bordercloud)
C’est l’utilisateur (et non les logiciels ou les données)
qui devient libre
92. SI ON REMPLACE LES ENONCES PAR DES IMAGES ?
SI ON REMPLACE LES INTERLOGOS PAR DES
INTERSECTIONS D’IMAGES ?
SI ON REPRESENTE UNE VIDEO COMME UN LIGNE
D’IMAGES, CHACUNE PARTAGEANT DES INTERLOGOS
AVEC D’AUTRES IMAGES APPARTENANT A D’AUTRES
LIGNES ?
VERS DES AZIMUTS SPATIO-TEMPORELS
93. Exemple de Calcul Littéraire:
géométrie et symétrie
A: chien means dog
B: chat means cat
C: dog signifie chien
D: cat signifie xxx
Find xxx
94. Power of Symmetry
chien - dog
cat A: chien means dog
means signifie B: chat means cat
C: dog signifie chien
D: cat signifie xxx
chat xxx
xxx est symétrique de chat
cat signifie chat !
95. Pratiquer le Calcul Littéraire
• C’est prendre ses notes sous forme
d’inférons (cf Idécriture)
• En attendant que des outils les exploitent
(cryosémantique).
96. Altérité
« Alter IT » = « changer l’informatique
• Le système d’information dépend de la qualité de ses
utilisateurs
• Chaque utilisateur est responsable de ce qu’il dépose en
langage naturel dans la machine
• L’altérité remplace l’ingénierie
• S’entrainer, s’améliorer au calcul littéraire
• S’entrainer, s’améliorer à l’Idécriture
97. ALTERITE ET CHARITE BIEN ORDONNEE …
CONSTRUIRE, CULTIVER SA
PROPRE COLLECTION
D’ENONCES
RESTER MAITRE DES
ENONCES ENTRANTS
ANGE GARDIEN SEMANTIQUE
MÉMOIRE PERSONNELLE
PERSONET (Pierre Berger)
98. Pour conclure
ENTRE INFORMATIQUE
ET SCIENCES HUMAINES
CONSTRUISONS ENSEMBLE
LA THEORIE DE L’INFORMATION
QUI NOUS MANQUE