Una visione generale e un'analisi di una specifica applicazione: True Knowledge
(2010)
Topic: Modelli di Rappresentazione della Conoscenza (Semantic Web)
1. Una visione generale e un’analisi di
una specifica applicazione:
True Knowledge
LS in Net-Economy Corso di Modelli di Rappresentazione Docente: Dott. Paolo Bouquet
A.A. 2009-2010 della Conoscenza Studente: Nicola Cerami
2. Breve Introduzione
Obiettivo
Analizzare le tecnologie web semantiche per il
Knowledge Management (KM)
Breve classificazione sui sistemi di KM del Web
Analisi sistemi di knowledge Retrieval del Web
Confronto tra Search Engine e Semantic
Search Engine
02/11/2010 2
3. Cenni sul KM- 1
La disciplina del KM iniziò a svilupparsi dal 1991
(Nonaka) e comprende una serie di strategie e
pratiche utilizzate in un’organizzazione per:
Identificare
Creare
Rappresentare
CONOSCENZA
Distribuire
Consentire l’adozione di intuizioni
e di esperienze
02/11/2010 3
4. Cenni sul KM - 2
Oggi la conoscenza è considerata l’asset
organizzativo e strategico più importante che
un’azienda ha a disposizione per acquisire:
Vantaggio competitivo
Superiori performance aziendali
Tecnologie dell’informazione
02/11/2010 4
5. Descrizione dell’ambito di
applicazione
Gli strumenti software di KM sono un’insieme
di tecnologie non necessariamente raccolte in
un’unica soluzione software
Permettono di migliorare i processi
comunicativi e la gestione delle informazioni
Permettono di mettere in collegamento coloro
che ricercano informazioni con coloro che le
possiedono
02/11/2010 5
6. Classificazione tecnologie di KM
Le tecnologie di KM si possono classificare a
seconda del tipo di processo supportato in cinque
categorie
Rendono l’informazione fruibile, migliorano i processi
comunicativi e la gestione della conoscenza.
02/11/2010 6
7. Tecnologie di Knowledge
Retrieval - 1
Alcuni dati (OTO Research, 2009)
La quasi totalità degli italiani online utilizza almeno un
motore di ricerca e l’89% li usa su base quotidiana;
Il 93% degli italiani online ritiene i motori di ricerca lo
strumento più efficace per cercare informazioni, prodotti e
servizi;
L’87% degli italiani online utilizza i motori di ricerca per
trovare informazioni decisive per un acquisto;
L’88% di questi, una o più volte, ha deciso l’acquisto del
prodotto o di un servizio basandosi sulle informazioni
ottenute attraverso i motori di ricerca.
02/11/2010 7
8. Tecnologie di Knowledge
Retrieval - 2
Il motore di ricerca più utilizzato a livello
mondiale è Google:
85,78% a livello mondiale e 91% in Italia
7,2 miliardi di visite al giorno
3,9 miliardi di ricerche al giorno
Circa 620 milioni di utenti al giorno
Circa 20 PB di traffico dati al giorno
02/11/2010 8
9. Tecnologie di Knowledge
Retrieval - 3
Un progetto focalizzato sul Knowledge Space Aziendale
non può prescindere dall’inserimento di sistemi per la
ricerca di informazioni.
02/11/2010 9
10. Search Engines (Google)- 1
Sistemi Automatici
Analizzano un insieme di dati
Restituiscono un indice dei contenuti disponibili
Classifica l’indice dei contenuti in base a formule
statistico-matematiche
Queste formule indicano il grado di rilevanza data una
determinata chiave di ricerca (keyword)
Campo di utilizzo
Information Retrieval
Web
02/11/2010 10
11. Search Engines - 2
Permettono di condividere conoscenza e sono
rappresentati, generalmente, da un’interfaccia
minimalista
Cataloga e indicizza il World Wide Web
Si occupa anche di immagini, foto,
newsgroup, notizie, mappe, video, etc
Mantiene una copia cache di tutte le pagine
che conosce
02/11/2010 11
12. Anatomia di Google
Il lavoro di un motore di
ricerca si divide principalmente
in 3 fasi:
1. Analisi del campo d’azione
2. Catalogazione del materiale ottenuto
3. Risposte alle richieste dell’utente
02/11/2010 12
13. Limiti - 1
Gestione ambiguità dell’informazione
Informazione rinchiusa all’interno di rigidi schemi
relazionali troppo strutturata e poco accessibile
I dati non sono interoperabili con l’interno del Web e le
sue caratteristiche
Informazione non direttamente elaborabile dalle
macchine (es. risorse multimediali)
Interrogazioni semplici e poco flessibili tramite una o
più keyword in form standard e predefinite (schemi
poco usabili dagli utenti)
02/11/2010 13
14. Limiti - 2
Bassa precision e recall
Granularità non appropriata
Necessità di aggregare i risultati “spezzettati” tramite
pagine riassuntive/report
Non è possibile rappresentare tutte le possibili
richieste degli utenti
Lunga e faticosa ricerca manuale di tutte le
informazioni e dei dati necessari
Cercare quindi ha un COSTO
02/11/2010 14
15. Semantic Search Engine - 1
Necessità crescente delle imprese di avere a
disposizione sistemi “intelligenti” ricchi di informazioni e
funzionalità
Semantic Web: “insegnare” alle macchine ad estrarre
informazioni dalle risorse tramite tecniche di Text/Audio
processing, Image/Video processing, etc.
Un Semantic Serarch Engine è in grado di trattare sia
aspetti linguistici (livello terminologia) sia aspetti legati
alla conoscenza di dominio (livello modello concettuale)
02/11/2010 15
18. Limiti e Vantaggi
Limiti Vantaggi
Fattore costo: richiedono Permette la formazione
un investimento ingente di più sofisticati contesti
per giungere a messa a di ricerca
punto (per garantire una Maggior precision e recall
qualità media del senza peggiorare le
servizio accettabile) prestazioni
Facilitano il “merging”
Informazione più
accessibile, fruibile,
scambiabile, riutilizzabile
e personalizzabile
Possibilità di derivare
02/11/2010 nuova K 18
19. True Knowledge - 1
True Knowledge Ltd (W. Tunstall-Pedoe)
società inglese specializzata nelle basi di conoscenza e nei
motori di ricerca semantici.
Sistema avviato in versione beta privata il 7 Novembre 2007
Si tratta di un esclusiva tecnologia semantica in
grado di:
Comprendere le domande poste dagli utenti in linguaggio
naturale (NLP)
Rappresentare la conoscenza, combinando le conoscenze
esistenti in moto tale da inferire nuovi fatti e rispondere a
domande che non ha mai visto prima
02/11/2010 19
20. True Knowledge - 2
Obiettivo
Alimentare un nuovo tipo di esperienza di ricerca
Metodo
Il linguaggio naturale viene processato nell’ambito di
intere frasi grazia ad una tecnologia semantica propria
Utilizza i microformati
Migliora sulla base di feedback e grazie alla
collaborazione degli utenti
Configura un indice dei contenuti come una vera e
propria mappa concettuale
Interpretabile dalla macchina
02/11/2010 20
22. Il ruolo del Semantic Web
Il “cuore” di TrueKnowledge è l’ontologia, la
quale:
Descrive una struttura ad albero delle varie classi
Ogni entità si inserisce in questa struttura
02/11/2010 22
24. La conoscenza immagazzinata e
la verifica
True Knowledge raccoglie informazioni per il suo
DB in due modi:
1. Importazione da database eterni “credibili” (es.
Wikipedia);
2. Contributo da parte degli utenti (previa registrazione
gratuita e tramite apposite form)
Attualmente i fatti inseriti sono circa 319 milioni
di fatti su 9,5 milioni di argomenti
02/11/2010 24
25. Aggiungere conoscenza
Fondamentale è l’interazione degli utenti
• Possono contribuire ad editare la Knowledge Base
• Possono confermare o smentire singoli “fatti”
• Possono aggiungere contenuti di ogni tipo
02/11/2010 25
26. Sviluppare con True KM - 1
Ogni utente può iniziare a sviluppare in tre
semplici passi:
Registrarsi sul portale per ottenere un account API;
Scaricare il manuale API;
Scaricare la biblioteca PHP.
Esistono vari design model per le API
consentono agli sviluppatori di utilizzare le funzionalità
di True KM in applicazioni provenienti da terze parti.
02/11/2010 26
27. Sviluppare con True KM - 2
La piattaforma fornisce i seguenti servizi API:
Direct Answer API: espone la domanda in linguaggio
naturale (NLP);
Query API: consente agli utenti di bypassare l’attuale
sistema di traduzione di lingua e interrogare
direttamente la Knowledge Base utilizzando un
linguaggio semplice (query).
Tali servizi API sono composti da richieste e
risposte HTTP XML.
02/11/2010 27
37. Analisi SWOT- 2
Opportunities Threats
Finanziamenti ingenti da Competitors leader nel
parte di altre società settore (Google, Yahoo!,
(circa 6,2 mln di euro) etc)
Incremento del
personale R&D
Creazione di nuove
soluzioni tecnologiche e
per l’implementazione
definitiva del sistema
02/11/2010 37
38. Conclusioni - 1
Implicazione per gli utenti
Velocità di reperimento delle informazioni
Maggiore Precision e Recall
Risparmio di tempo
Maggiore condivisione della conoscenza (accessibile)
Portata Rivoluzionaria del Semantic
Web per l’utente
02/11/2010 38
39. Conclusioni - 2
Implicazioni per le aziende
Le tecnologie di KM per il Semantic Web
migliorano la condivisione e la ricerca del
patrimonio informativo aziendale, ottimizzando:
La categorizzazione automatica
L’estrazione dei dati
La fruizione dei documenti indipendentemente dalla
natura dei “testi” (file word, pdf, pagine web, etc).
02/11/2010 39
40. Conclusioni - 3
Circa l’80% delle informazioni aziendali sono
di tipo non strutturato
Dati memorizzati sotto diverse tipologie di
formati i quali contengono testi e dati di
difficile reperibilità
Valore inestimabile per la comprensione delle
dinamiche interne ed esterne all’impresa
02/11/2010 40
41. Conclusioni - 4
Le aziende DEVONO essere in grado di sfruttare al
meglio le tecnologie di KM semantiche producendo e
diffondendo sapere al proprio interno per:
Non perdere opportunità di business
e acquisire maggiori benefici
Migliore capacità di adattamento nel mercato
Monitoraggio e miglioramento continuto
Migliore gestione degli imprevisti
Arricchire il patrimonio di K in modo da Capitalizzarlo
Innovazione e nuove opportunità di Business
02/11/2010 41
42. Riflessioni personali
Mancanza di stimolo da parte delle aziende ad
adottare soluzioni tecnologiche di KM semantiche
Restie all’innovazione tecnologica
A favore del contenimento dei costi
Incentivare le aziende all’innovazione tecnologica
Opportuni incentivi
Altre attività (es. conferenze, meeting, etc sulla
portata rivoluzionaria del Semantic Web)
Integrazione tra Semantic Web e Semantic Intelligence
02/11/2010 42
44. Bibliografia
Della Valle E., Celino I. & Cerizza D., Semantic
Web: Modellare e condividere per innovare.
Ed. Pearson Addison Wesley, Milano 2008.
Cuel R., Ponte D., Dispensa del corso di
Knowledge Management, Trento, 2007-2008.
Bouquet P., Slide corso Modelli di
Rappresentazione della Conoscenza, Trento,
2009-2010.
02/11/2010 44