WebExpo2009 - Semantic Web - Presentation Transcript
Sémantický Web,
Stromy a My
Josef Holý
Social Network Designer
Sun Microsystems
1
1968
2
9.prosinec 1968: 'Mother of All Demos'
• Fall Joint Computer
Conference v SF
• Doug Engelbart a tým
• Prezentace
'oNLine System' (NLS)
• Projekt pro 'vylepšení
lidského intelektu'
• Představení revolučních konceptů, které
používáme dodnes
> V podstatě nezměněné
3
Základní Desktop...
4
Myš...
“X-Y position indicator for a display system”
5
Hypertext...
6
Videoconferencing...
7
Cut/Copy/Paste
• Implemented in 2009 ;)
8
Strom...
9
Stromy a informace
• Stromy jsou přirozené
> Používané od nepaměti
• Vyjádření hierarchie, vnoření
> Vztah podřízenosti/nadřízenosti
> Vztah následnosti
> atd.
• Hierarchické kategorizace
> Kategorie, podkategorie, položky
10
Genealogický strom
11
Organizační struktura firmy
• Divide and conquer
12
Kategorie produktů - e-shop
13
tzv. “Můj počítač”
14
Browser History
15
Problémy kategorizace pomocí stromů
• Objekty patří pouze na jedno místo
> → k němu vede pouze jedna cesta
> Symbolic link není řešení
– ln -s / export/ space/ common/ archive / archive
• Statické – nevyvíjejí se s uživatelem
> s jeho myšlenkovým modelem
> “Kam jsem to jenom dal?”
16
Jak vylepšit
(browser) history?
17
User Stories pro (browser) history
• Uživatel chce znovu najít:
> To video co mu včera přišlo od Rudy na
facebooku
– “jak tam skáčou ten bungee”
> Týden starý blog post o Lisabonské smlouvě
– “myslím, že to bylo na aktualne.cz, ale nejsem si
jistý”
> Všechny design dokumenty k našemu
startupu www.xyz.cz
– “hlavně ty, které se týkají business
developmentu”
18
User Stories pro (browser) history
• Uživatel chce znovu najít:
> To video co mu včera přišlo od Rudy na
facebooku
– “jak tam skáčou ten bungee”
> Asi týden starý blog post o Lisabonské smlouvě
– “myslím, že to bylo na aktualne.cz, ale nejsem si
jistý”
> Všechny design dokumenty k našemu
projektu www.xyz.cz
– “hlavně ty, které se týkají business
developmentu”
19
Problém: Počítače nám nerozumí
20
“Porozumění” blog postu počítačem
21
Potřebujeme lepší metadata
• Metadata = data o datech
> Popis významů
• Příklad:
> Dato:
– youtube.com stránka (URL)
> Metadata:
– je to video
– je o bungee, je funny
– kdo ho nahrál
– kolik má hvězdiček
– Atd.
• Popis Věcí a Vztahů mezi nimi
22
Věci + Vztahy = Semantic Web
• Další evoluční stádium Webu (Web3.0)
• Základem je dobře strukturovaný Social
Mesh
• Social Mesh = Lidé + Obsah + Komunity
a vztahy mezi nimi
• Využívá W3C standardů
• Kontinuální process – záleží na kvalitě
metadat
> Vlastně 'už tam jsme' – viz. Tagování a
folksonomies
23
Web Významů
(Semantic Web)
je
soubor technologií
pro
vytváření a sdílení
metadat na Webu.
24
Věci a vztahy mezi nimi
• Základní kámen Webu významů
• Trojice (triple) = 2 “věci” a jejich vztah
zná
zná
Pavel Petr
Subject Predicate Object
25
Všechno má své URL
• Jsme přeci na Webu! ;)
• Všechno znamená Věci, i Vztahy
> URL = unikátní identifikátor
foaf:knows
foaf:knows
http://www.facebook.com/Pavel http://www.facebook.com/Petr
26
Věci jsou popsány atributy
“Pavel” “Petr”
foaf:knows
foaf:name
foaf:name
foaf:knows
http://www.facebook.com/Pavel http://www.facebook.com/Petr
27
Věci mohou být nějakého “druhu”
foaf:Person foaf:Person
“Pavel” “Petr”
je foaf:knows je
foaf:name
foaf:name
foaf:knows
http://www.facebook.com/Pavel http://www.facebook.com/Petr
Tohle celé je RDF = Resource Description Framework
28
Web dnes: Dokumenty
29
Web zítra: Graf “Věcí” a vztahů
30
Kde vzít definice
druhů, atributů a
věcí?
(Buď vymyslet, nebo převzít)
31
Přebírání: Linked Data Cloud
http://linkeddata.org/
32
Linked Data Cloud
• Neustále se rozšiřující množina
sémantických slovníků (ontologií)
> Public, reusable, užitím linked data principles
• FOAF – Friend Of A Friend
– Popis lidí a jejich vztahů
– http://foaf-project.org
• DBPedia = Kompletní export
Wikipedia.org do RDF
– http://dbpedia.org
• Dublin Core = Vše co potřebujete pro
CMS
– http://dublincore.org
33
Vymýšlení: Linked Data Principles
• Věci jsou pojmenovány URL
– http://www.facebook.com/Petr
– URL která existují!! - můžu se na 'ně dostat' přes
HTTP
• URL 'vrací' důležité informace o 'věci':
> Definici věci
> Linky na další věci
> Záleží, kdo se ptá:
– Počítač/Bot/Agent? → RDF machine-readable
metadata
– Člověk? → Slovní popis
34
Case Study: BBC Music Online
http://www.bbc.co.uk/music
35
Kde vzít metadata?
Intro do RDFa
36
Kde vzít metadata
• Top-Down přístup: Informační analýza,
Web Scraping, Natural Language
Processing
> Stále nedokonalé
> Složitá údržba
> Copyright
• Bottom-Up přístup: anotace dat
> RDFa a microformats
37
RDFa intro
• W3C Recommendation
> http://www.w3.org/TR/rdfa-syntax/
> http://www.rdfa.info
• Mechanismus pro vkládání RDF do HTML
kódu stránek
• Rozšíření XHTML
• Podobné jako microformats, ale bohatší
vyjadřovací schopnost
38
Příklad: Anotace Blog Postu
39
Příklad: Kontaktní údaje
40
Příklad: Anotace seznamu přátel
41
May 2009: Google podporuje RDFa
• Zatím omezená podpora pro anotaci
firem a produktů
– viz. http://data-vocabulary.org
42
Yahoo's RDFa support
• Video
• Documents
• Games
• Products
• Local Businesses
• Events
• Discussions
• News
43
Yahoo's RDFa support example
44
Semantic Web
Browser
45
Semantic Web Browser a RDFa
46
Semantic Web Browser už dnes:
Firefox + GreaseMonkey + RDFa
47
Díky za pozornost!
Dotazy?
Josef Holý
josef.holy@sun.com
twitter.com/holyj
48
0 comments
Post a comment