Tecnologie semantiche per il knowledge Management

Una visione generale e un’analisi di
una specifica applicazione:
True Knowledge

LS in Net-Economy Corso di Modelli di Rappresentazione Docente: Dott. Paolo Bouquet
A.A. 2009-2010 della Conoscenza Studente: Nicola Cerami

Breve Introduzione
Obiettivo

 Analizzare le tecnologie web semantiche per il
Knowledge Management (KM)
 Breve classificazione sui sistemi di KM del Web
 Analisi sistemi di knowledge Retrieval del Web
 Confronto tra Search Engine e Semantic
Search Engine

02/11/2010 2

Cenni sul KM- 1
La disciplina del KM iniziò a svilupparsi dal 1991
(Nonaka) e comprende una serie di strategie e
pratiche utilizzate in un’organizzazione per:

 Identificare
 Creare
 Rappresentare
CONOSCENZA
 Distribuire
 Consentire l’adozione di intuizioni
e di esperienze

02/11/2010 3

Cenni sul KM - 2
Oggi la conoscenza è considerata l’asset
organizzativo e strategico più importante che
un’azienda ha a disposizione per acquisire:

 Vantaggio competitivo
 Superiori performance aziendali

Tecnologie dell’informazione
02/11/2010 4

Descrizione dell’ambito di
applicazione
 Gli strumenti software di KM sono un’insieme
di tecnologie non necessariamente raccolte in
un’unica soluzione software
 Permettono di migliorare i processi
comunicativi e la gestione delle informazioni
 Permettono di mettere in collegamento coloro
che ricercano informazioni con coloro che le
possiedono

02/11/2010 5

Classificazione tecnologie di KM
Le tecnologie di KM si possono classificare a
seconda del tipo di processo supportato in cinque
categorie

Rendono l’informazione fruibile, migliorano i processi
comunicativi e la gestione della conoscenza.
02/11/2010 6

Tecnologie di Knowledge
Retrieval - 1
Alcuni dati (OTO Research, 2009)

 La quasi totalità degli italiani online utilizza almeno un
motore di ricerca e l’89% li usa su base quotidiana;
 Il 93% degli italiani online ritiene i motori di ricerca lo
strumento più efficace per cercare informazioni, prodotti e
servizi;
 L’87% degli italiani online utilizza i motori di ricerca per
trovare informazioni decisive per un acquisto;
 L’88% di questi, una o più volte, ha deciso l’acquisto del
prodotto o di un servizio basandosi sulle informazioni
ottenute attraverso i motori di ricerca.
02/11/2010 7

Retrieval - 2
Il motore di ricerca più utilizzato a livello
mondiale è Google:

 85,78% a livello mondiale e 91% in Italia
 7,2 miliardi di visite al giorno
 3,9 miliardi di ricerche al giorno
 Circa 620 milioni di utenti al giorno
 Circa 20 PB di traffico dati al giorno

02/11/2010 8

Retrieval - 3

Un progetto focalizzato sul Knowledge Space Aziendale
non può prescindere dall’inserimento di sistemi per la
ricerca di informazioni.
02/11/2010 9

Search Engines (Google)- 1
Sistemi Automatici
 Analizzano un insieme di dati
 Restituiscono un indice dei contenuti disponibili
 Classifica l’indice dei contenuti in base a formule
statistico-matematiche
 Queste formule indicano il grado di rilevanza data una
determinata chiave di ricerca (keyword)

Campo di utilizzo
 Information Retrieval
 Web

02/11/2010 10

Search Engines - 2
 Permettono di condividere conoscenza e sono
rappresentati, generalmente, da un’interfaccia
minimalista
 Cataloga e indicizza il World Wide Web
 Si occupa anche di immagini, foto,
newsgroup, notizie, mappe, video, etc
 Mantiene una copia cache di tutte le pagine
che conosce

02/11/2010 11

Anatomia di Google
Il lavoro di un motore di
ricerca si divide principalmente
in 3 fasi:

1. Analisi del campo d’azione
2. Catalogazione del materiale ottenuto
3. Risposte alle richieste dell’utente

02/11/2010 12

Limiti - 1

Gestione ambiguità dell’informazione

 Informazione rinchiusa all’interno di rigidi schemi
relazionali  troppo strutturata e poco accessibile
 I dati non sono interoperabili con l’interno del Web e le
sue caratteristiche
 Informazione non direttamente elaborabile dalle
macchine (es. risorse multimediali)
 Interrogazioni semplici e poco flessibili tramite una o
più keyword in form standard e predefinite (schemi
poco usabili dagli utenti)
02/11/2010 13

Limiti - 2
 Bassa precision e recall
 Granularità non appropriata
 Necessità di aggregare i risultati “spezzettati” tramite
pagine riassuntive/report
 Non è possibile rappresentare tutte le possibili
richieste degli utenti
 Lunga e faticosa ricerca manuale di tutte le
informazioni e dei dati necessari

Cercare quindi ha un COSTO
02/11/2010 14

Semantic Search Engine - 1
Necessità crescente delle imprese di avere a
disposizione sistemi “intelligenti” ricchi di informazioni e
funzionalità

Semantic Web: “insegnare” alle macchine ad estrarre
informazioni dalle risorse tramite tecniche di Text/Audio
processing, Image/Video processing, etc.

Un Semantic Serarch Engine è in grado di trattare sia
aspetti linguistici (livello terminologia) sia aspetti legati
alla conoscenza di dominio (livello modello concettuale)

02/11/2010 15

Anatomia di un Semantic
Search Engine

02/11/2010 16

Applicazioni
 Exalead
 Autonomy (Enterprise Search)
 Polyspot enterprise Search
 Omnifind Enterprise (IBM)
 Bing (Microsoft)
 Yahoo Search Monkey
 Piattaforma Cogito (Expert System)
 True Knowledge
 Etc.

02/11/2010 17

Limiti e Vantaggi
Limiti Vantaggi
 Fattore costo: richiedono  Permette la formazione
un investimento ingente di più sofisticati contesti
per giungere a messa a di ricerca
punto (per garantire una  Maggior precision e recall
qualità media del senza peggiorare le
servizio accettabile) prestazioni
 Facilitano il “merging”
 Informazione più
accessibile, fruibile,
scambiabile, riutilizzabile
e personalizzabile
 Possibilità di derivare
02/11/2010 nuova K 18

True Knowledge - 1
True Knowledge Ltd (W. Tunstall-Pedoe)
 società inglese specializzata nelle basi di conoscenza e nei
motori di ricerca semantici.
 Sistema avviato in versione beta privata il 7 Novembre 2007

Si tratta di un esclusiva tecnologia semantica in
grado di:
 Comprendere le domande poste dagli utenti in linguaggio
naturale (NLP)
 Rappresentare la conoscenza, combinando le conoscenze
esistenti in moto tale da inferire nuovi fatti e rispondere a
domande che non ha mai visto prima

02/11/2010 19

True Knowledge - 2
Obiettivo
 Alimentare un nuovo tipo di esperienza di ricerca

Metodo
 Il linguaggio naturale viene processato nell’ambito di
intere frasi grazia ad una tecnologia semantica propria
 Utilizza i microformati
 Migliora sulla base di feedback e grazie alla
collaborazione degli utenti
 Configura un indice dei contenuti come una vera e
propria mappa concettuale
 Interpretabile dalla macchina
02/11/2010 20

Architettura

02/11/2010 21

Il ruolo del Semantic Web
Il “cuore” di TrueKnowledge è l’ontologia, la
quale:
 Descrive una struttura ad albero delle varie classi
 Ogni entità si inserisce in questa struttura

02/11/2010 22

Il ruolo del Semantic Web -2

02/11/2010 23

La conoscenza immagazzinata e
la verifica
True Knowledge raccoglie informazioni per il suo
DB in due modi:

1. Importazione da database eterni “credibili” (es.
Wikipedia);
2. Contributo da parte degli utenti (previa registrazione
gratuita e tramite apposite form)

Attualmente i fatti inseriti sono circa 319 milioni
di fatti su 9,5 milioni di argomenti
02/11/2010 24

Aggiungere conoscenza
Fondamentale è l’interazione degli utenti

• Possono contribuire ad editare la Knowledge Base
• Possono confermare o smentire singoli “fatti”
• Possono aggiungere contenuti di ogni tipo

02/11/2010 25

Sviluppare con True KM - 1
Ogni utente può iniziare a sviluppare in tre
semplici passi:

 Registrarsi sul portale per ottenere un account API;
 Scaricare il manuale API;
 Scaricare la biblioteca PHP.

Esistono vari design model per le API

 consentono agli sviluppatori di utilizzare le funzionalità
di True KM in applicazioni provenienti da terze parti.
02/11/2010 26

Sviluppare con True KM - 2
La piattaforma fornisce i seguenti servizi API:

 Direct Answer API: espone la domanda in linguaggio
naturale (NLP);
 Query API: consente agli utenti di bypassare l’attuale
sistema di traduzione di lingua e interrogare
direttamente la Knowledge Base utilizzando un
linguaggio semplice (query).

Tali servizi API sono composti da richieste e
risposte HTTP XML.
02/11/2010 27

Direct Answer Service (ex)
How old is Tim Berners Lee?

XML Response

02/11/2010 28

Query Service (ex)
Query  “+44 1223 323382”

XML Response

02/11/2010 29

Alcuni esempi di
interazione con True
Knowledge

02/11/2010 30

Analisi SWOT - 1
Strenghts

Weakness

02/11/2010 36

Analisi SWOT- 2
Opportunities Threats

 Finanziamenti ingenti da  Competitors leader nel
parte di altre società settore (Google, Yahoo!,
(circa 6,2 mln di euro) etc)
 Incremento del
personale R&D
 Creazione di nuove
soluzioni tecnologiche e
per l’implementazione
definitiva del sistema

02/11/2010 37

Conclusioni - 1
Implicazione per gli utenti

 Velocità di reperimento delle informazioni
 Maggiore Precision e Recall
 Risparmio di tempo
 Maggiore condivisione della conoscenza (accessibile)

Portata Rivoluzionaria del Semantic
Web per l’utente

02/11/2010 38

Conclusioni - 2
Implicazioni per le aziende

 Le tecnologie di KM per il Semantic Web
migliorano la condivisione e la ricerca del
patrimonio informativo aziendale, ottimizzando:

 La categorizzazione automatica
 L’estrazione dei dati
 La fruizione dei documenti indipendentemente dalla
natura dei “testi” (file word, pdf, pagine web, etc).

02/11/2010 39

Conclusioni - 3
 Circa l’80% delle informazioni aziendali sono
di tipo non strutturato
 Dati memorizzati sotto diverse tipologie di
formati i quali contengono testi e dati di
difficile reperibilità

Valore inestimabile per la comprensione delle
dinamiche interne ed esterne all’impresa

02/11/2010 40

Conclusioni - 4
Le aziende DEVONO essere in grado di sfruttare al
meglio le tecnologie di KM semantiche producendo e
diffondendo sapere al proprio interno per:

 Non perdere opportunità di business
e acquisire maggiori benefici
 Migliore capacità di adattamento nel mercato
 Monitoraggio e miglioramento continuto
 Migliore gestione degli imprevisti
 Arricchire il patrimonio di K in modo da Capitalizzarlo

Innovazione e nuove opportunità di Business
02/11/2010 41

Riflessioni personali
Mancanza di stimolo da parte delle aziende ad
adottare soluzioni tecnologiche di KM semantiche
 Restie all’innovazione tecnologica
 A favore del contenimento dei costi

Incentivare le aziende all’innovazione tecnologica
 Opportuni incentivi
 Altre attività (es. conferenze, meeting, etc sulla
portata rivoluzionaria del Semantic Web)
 Integrazione tra Semantic Web e Semantic Intelligence
02/11/2010 42

Sitografia
[1] http://www.semantic-web.at/
[2] http://blog.semantic-web.at/
[3] http://www.victorgodot.com/blog/?p=113
[4] http://en.wikipedia.org/
[5] http://www.audiweb.it/
[6] http://punto-informatico.it/
[7] http://www.trueknowledge.com/
[8] http://www.youtube.com/watch?v=IONdWQwcmxA
[9] http://www.exalead.com/software/
[10] http://www.autonomy.com/
[11] http://www.polyspot.com/
[12] http://www-01.ibm.com/software/data/enterprise-search/omnifind-
enterprise/
[13] http://www.expertsystem.it/index.asp
[14]http://www.i-dome.com/flash-news/pagina.phtml?_id_articolo=11656-I-
vantaggi-della- Semantic-Intelligence-per-il-Semantic-Web.html
02/11/2010 43

Bibliografia
 Della Valle E., Celino I. & Cerizza D., Semantic
Web: Modellare e condividere per innovare.
Ed. Pearson Addison Wesley, Milano 2008.
 Cuel R., Ponte D., Dispensa del corso di
Knowledge Management, Trento, 2007-2008.
 Bouquet P., Slide corso Modelli di
Rappresentazione della Conoscenza, Trento,
2009-2010.

02/11/2010 44

Tecnologie semantiche per il knowledge Management

Tecnologie semantiche per il knowledge Management

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (9)

Similar to Tecnologie semantiche per il knowledge Management

Similar to Tecnologie semantiche per il knowledge Management (20)

Tecnologie semantiche per il knowledge Management