Tecnologie semantiche per il knowledge Management

1,078 views

Published on

Una visione generale e un'analisi di una specifica applicazione: True Knowledge
(2010)

Topic: Modelli di Rappresentazione della Conoscenza (Semantic Web)

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,078
On SlideShare
0
From Embeds
0
Number of Embeds
101
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Tecnologie semantiche per il knowledge Management

  1. 1. Una visione generale e un’analisi di una specifica applicazione: True KnowledgeLS in Net-Economy Corso di Modelli di Rappresentazione Docente: Dott. Paolo BouquetA.A. 2009-2010 della Conoscenza Studente: Nicola Cerami
  2. 2. Breve Introduzione Obiettivo  Analizzare le tecnologie web semantiche per il Knowledge Management (KM)  Breve classificazione sui sistemi di KM del Web  Analisi sistemi di knowledge Retrieval del Web  Confronto tra Search Engine e Semantic Search Engine02/11/2010 2
  3. 3. Cenni sul KM- 1 La disciplina del KM iniziò a svilupparsi dal 1991 (Nonaka) e comprende una serie di strategie e pratiche utilizzate in un’organizzazione per:  Identificare  Creare  Rappresentare CONOSCENZA  Distribuire  Consentire l’adozione di intuizioni e di esperienze02/11/2010 3
  4. 4. Cenni sul KM - 2 Oggi la conoscenza è considerata l’asset organizzativo e strategico più importante che un’azienda ha a disposizione per acquisire:  Vantaggio competitivo  Superiori performance aziendali Tecnologie dell’informazione02/11/2010 4
  5. 5. Descrizione dell’ambito di applicazione  Gli strumenti software di KM sono un’insieme di tecnologie non necessariamente raccolte in un’unica soluzione software  Permettono di migliorare i processi comunicativi e la gestione delle informazioni  Permettono di mettere in collegamento coloro che ricercano informazioni con coloro che le possiedono02/11/2010 5
  6. 6. Classificazione tecnologie di KM Le tecnologie di KM si possono classificare a seconda del tipo di processo supportato in cinque categorie Rendono l’informazione fruibile, migliorano i processi comunicativi e la gestione della conoscenza. 02/11/2010 6
  7. 7. Tecnologie di Knowledge Retrieval - 1 Alcuni dati (OTO Research, 2009)  La quasi totalità degli italiani online utilizza almeno un motore di ricerca e l’89% li usa su base quotidiana;  Il 93% degli italiani online ritiene i motori di ricerca lo strumento più efficace per cercare informazioni, prodotti e servizi;  L’87% degli italiani online utilizza i motori di ricerca per trovare informazioni decisive per un acquisto;  L’88% di questi, una o più volte, ha deciso l’acquisto del prodotto o di un servizio basandosi sulle informazioni ottenute attraverso i motori di ricerca.02/11/2010 7
  8. 8. Tecnologie di Knowledge Retrieval - 2 Il motore di ricerca più utilizzato a livello mondiale è Google:  85,78% a livello mondiale e 91% in Italia  7,2 miliardi di visite al giorno  3,9 miliardi di ricerche al giorno  Circa 620 milioni di utenti al giorno  Circa 20 PB di traffico dati al giorno02/11/2010 8
  9. 9. Tecnologie di Knowledge Retrieval - 3 Un progetto focalizzato sul Knowledge Space Aziendale non può prescindere dall’inserimento di sistemi per la ricerca di informazioni.02/11/2010 9
  10. 10. Search Engines (Google)- 1 Sistemi Automatici  Analizzano un insieme di dati  Restituiscono un indice dei contenuti disponibili  Classifica l’indice dei contenuti in base a formule statistico-matematiche  Queste formule indicano il grado di rilevanza data una determinata chiave di ricerca (keyword) Campo di utilizzo  Information Retrieval  Web02/11/2010 10
  11. 11. Search Engines - 2  Permettono di condividere conoscenza e sono rappresentati, generalmente, da un’interfaccia minimalista  Cataloga e indicizza il World Wide Web  Si occupa anche di immagini, foto, newsgroup, notizie, mappe, video, etc  Mantiene una copia cache di tutte le pagine che conosce02/11/2010 11
  12. 12. Anatomia di GoogleIl lavoro di un motore diricerca si divide principalmentein 3 fasi:1. Analisi del campo d’azione2. Catalogazione del materiale ottenuto3. Risposte alle richieste dell’utente 02/11/2010 12
  13. 13. Limiti - 1 Gestione ambiguità dell’informazione  Informazione rinchiusa all’interno di rigidi schemi relazionali  troppo strutturata e poco accessibile  I dati non sono interoperabili con l’interno del Web e le sue caratteristiche  Informazione non direttamente elaborabile dalle macchine (es. risorse multimediali)  Interrogazioni semplici e poco flessibili tramite una o più keyword in form standard e predefinite (schemi poco usabili dagli utenti)02/11/2010 13
  14. 14. Limiti - 2  Bassa precision e recall  Granularità non appropriata  Necessità di aggregare i risultati “spezzettati” tramite pagine riassuntive/report  Non è possibile rappresentare tutte le possibili richieste degli utenti  Lunga e faticosa ricerca manuale di tutte le informazioni e dei dati necessari Cercare quindi ha un COSTO02/11/2010 14
  15. 15. Semantic Search Engine - 1 Necessità crescente delle imprese di avere a disposizione sistemi “intelligenti” ricchi di informazioni e funzionalità Semantic Web: “insegnare” alle macchine ad estrarre informazioni dalle risorse tramite tecniche di Text/Audio processing, Image/Video processing, etc. Un Semantic Serarch Engine è in grado di trattare sia aspetti linguistici (livello terminologia) sia aspetti legati alla conoscenza di dominio (livello modello concettuale)02/11/2010 15
  16. 16. Anatomia di un Semantic Search Engine02/11/2010 16
  17. 17. Applicazioni  Exalead  Autonomy (Enterprise Search)  Polyspot enterprise Search  Omnifind Enterprise (IBM)  Bing (Microsoft)  Yahoo Search Monkey  Piattaforma Cogito (Expert System)  True Knowledge  Etc.02/11/2010 17
  18. 18. Limiti e Vantaggi Limiti Vantaggi  Fattore costo: richiedono  Permette la formazione un investimento ingente di più sofisticati contesti per giungere a messa a di ricerca punto (per garantire una  Maggior precision e recall qualità media del senza peggiorare le servizio accettabile) prestazioni  Facilitano il “merging”  Informazione più accessibile, fruibile, scambiabile, riutilizzabile e personalizzabile  Possibilità di derivare02/11/2010 nuova K 18
  19. 19. True Knowledge - 1True Knowledge Ltd (W. Tunstall-Pedoe) società inglese specializzata nelle basi di conoscenza e nei motori di ricerca semantici. Sistema avviato in versione beta privata il 7 Novembre 2007Si tratta di un esclusiva tecnologia semantica ingrado di: Comprendere le domande poste dagli utenti in linguaggio naturale (NLP) Rappresentare la conoscenza, combinando le conoscenze esistenti in moto tale da inferire nuovi fatti e rispondere a domande che non ha mai visto prima02/11/2010 19
  20. 20. True Knowledge - 2 Obiettivo  Alimentare un nuovo tipo di esperienza di ricerca Metodo  Il linguaggio naturale viene processato nell’ambito di intere frasi grazia ad una tecnologia semantica propria  Utilizza i microformati  Migliora sulla base di feedback e grazie alla collaborazione degli utenti  Configura un indice dei contenuti come una vera e propria mappa concettuale  Interpretabile dalla macchina02/11/2010 20
  21. 21. Architettura02/11/2010 21
  22. 22. Il ruolo del Semantic Web Il “cuore” di TrueKnowledge è l’ontologia, la quale:  Descrive una struttura ad albero delle varie classi  Ogni entità si inserisce in questa struttura02/11/2010 22
  23. 23. Il ruolo del Semantic Web -202/11/2010 23
  24. 24. La conoscenza immagazzinata e la verifica True Knowledge raccoglie informazioni per il suo DB in due modi: 1. Importazione da database eterni “credibili” (es. Wikipedia); 2. Contributo da parte degli utenti (previa registrazione gratuita e tramite apposite form) Attualmente i fatti inseriti sono circa 319 milioni di fatti su 9,5 milioni di argomenti 02/11/2010 24
  25. 25. Aggiungere conoscenzaFondamentale è l’interazione degli utenti• Possono contribuire ad editare la Knowledge Base• Possono confermare o smentire singoli “fatti”• Possono aggiungere contenuti di ogni tipo02/11/2010 25
  26. 26. Sviluppare con True KM - 1 Ogni utente può iniziare a sviluppare in tre semplici passi:  Registrarsi sul portale per ottenere un account API;  Scaricare il manuale API;  Scaricare la biblioteca PHP. Esistono vari design model per le API  consentono agli sviluppatori di utilizzare le funzionalità di True KM in applicazioni provenienti da terze parti.02/11/2010 26
  27. 27. Sviluppare con True KM - 2 La piattaforma fornisce i seguenti servizi API:  Direct Answer API: espone la domanda in linguaggio naturale (NLP);  Query API: consente agli utenti di bypassare l’attuale sistema di traduzione di lingua e interrogare direttamente la Knowledge Base utilizzando un linguaggio semplice (query). Tali servizi API sono composti da richieste e risposte HTTP XML.02/11/2010 27
  28. 28. Direct Answer Service (ex) How old is Tim Berners Lee? XML Response02/11/2010 28
  29. 29. Query Service (ex) Query  “+44 1223 323382”XML Response02/11/2010 29
  30. 30. Alcuni esempi di interazione con True Knowledge02/11/2010 30
  31. 31. 02/11/2010 31
  32. 32. 02/11/2010 32
  33. 33. 02/11/2010 33
  34. 34. 02/11/2010 34
  35. 35. 02/11/2010 35
  36. 36. Analisi SWOT - 1 Strenghts Weakness02/11/2010 36
  37. 37. Analisi SWOT- 2 Opportunities Threats  Finanziamenti ingenti da  Competitors leader nel parte di altre società settore (Google, Yahoo!, (circa 6,2 mln di euro) etc)  Incremento del personale R&D  Creazione di nuove soluzioni tecnologiche e per l’implementazione definitiva del sistema02/11/2010 37
  38. 38. Conclusioni - 1 Implicazione per gli utenti  Velocità di reperimento delle informazioni  Maggiore Precision e Recall  Risparmio di tempo  Maggiore condivisione della conoscenza (accessibile) Portata Rivoluzionaria del Semantic Web per l’utente02/11/2010 38
  39. 39. Conclusioni - 2 Implicazioni per le aziende  Le tecnologie di KM per il Semantic Web migliorano la condivisione e la ricerca del patrimonio informativo aziendale, ottimizzando:  La categorizzazione automatica  L’estrazione dei dati  La fruizione dei documenti indipendentemente dalla natura dei “testi” (file word, pdf, pagine web, etc).02/11/2010 39
  40. 40. Conclusioni - 3  Circa l’80% delle informazioni aziendali sono di tipo non strutturato  Dati memorizzati sotto diverse tipologie di formati i quali contengono testi e dati di difficile reperibilità Valore inestimabile per la comprensione delle dinamiche interne ed esterne all’impresa02/11/2010 40
  41. 41. Conclusioni - 4 Le aziende DEVONO essere in grado di sfruttare al meglio le tecnologie di KM semantiche producendo e diffondendo sapere al proprio interno per:  Non perdere opportunità di business e acquisire maggiori benefici  Migliore capacità di adattamento nel mercato  Monitoraggio e miglioramento continuto  Migliore gestione degli imprevisti  Arricchire il patrimonio di K in modo da CapitalizzarloInnovazione e nuove opportunità di Business02/11/2010 41
  42. 42. Riflessioni personali Mancanza di stimolo da parte delle aziende ad adottare soluzioni tecnologiche di KM semantiche  Restie all’innovazione tecnologica  A favore del contenimento dei costi Incentivare le aziende all’innovazione tecnologica  Opportuni incentivi  Altre attività (es. conferenze, meeting, etc sulla portata rivoluzionaria del Semantic Web)  Integrazione tra Semantic Web e Semantic Intelligence02/11/2010 42
  43. 43. Sitografia [1] http://www.semantic-web.at/ [2] http://blog.semantic-web.at/ [3] http://www.victorgodot.com/blog/?p=113 [4] http://en.wikipedia.org/ [5] http://www.audiweb.it/ [6] http://punto-informatico.it/ [7] http://www.trueknowledge.com/ [8] http://www.youtube.com/watch?v=IONdWQwcmxA [9] http://www.exalead.com/software/ [10] http://www.autonomy.com/ [11] http://www.polyspot.com/ [12] http://www-01.ibm.com/software/data/enterprise-search/omnifind- enterprise/ [13] http://www.expertsystem.it/index.asp [14]http://www.i-dome.com/flash-news/pagina.phtml?_id_articolo=11656-I- vantaggi-della- Semantic-Intelligence-per-il-Semantic-Web.html02/11/2010 43
  44. 44. Bibliografia  Della Valle E., Celino I. & Cerizza D., Semantic Web: Modellare e condividere per innovare. Ed. Pearson Addison Wesley, Milano 2008.  Cuel R., Ponte D., Dispensa del corso di Knowledge Management, Trento, 2007-2008.  Bouquet P., Slide corso Modelli di Rappresentazione della Conoscenza, Trento, 2009-2010.02/11/2010 44

×