2. MIKS JUST SELLEST?
• infohulga pidev kasv
• idee üle kümne aasta vana
• töötavad lahendused – vaikne hiilimine
• ülevaade
• vaatame lõpetuseks mõned näited
3. Sir Tim Berners-Lee
Hypertext, CERN (1989)
I have a dream for the Web . . . (1999)
Tsiteerides: Ma unistan veebist, kus arvutid
suudavad kogu veebis olevat infot analüüsida.
Semantic Web: "a web of data that can be
processed directly and indirectly by machines."
4. HTML
<div class=„text inline“>puhkamiseks soe koht</div>
Google: „“, OR, -, ..,
site:, inurl:, allintitle:, jne.
5. TÖÖD TEEVAD ARVUTID
• analüüsib sisendit
• filtreerib väljundit
• ikkagi ainult mõisted
6. MIDA TEHA?
• anda tähendus veebilehel asuvale infole
• suhtlevate masinate võrk
• omavahel seotud metaandmed
7. ONTOLOOGIA ja AGENDID
• hierarhiline mõistete süsteem teadmiste
esitamiseks
• teadmiste kasutamine
Where is
Dr. No
8. KUST LEIDA?
• DBpedia
• New York Times
• Twitter
• Flickr
• Facebook
• …
13. FOAF
• Friend of a Friend – apps.facebook.com/foaf-me
• põhineb RDF skeemil
• kirjeldab isikuid
• ja nende sotsiaalseid võrgustike
[[name::Kalle Suur]] has the homepage [[foaf:homepage::http://n2ide.ee]]. His best friend is
[[foaf:knows::Peeter Suur]]. [[Category:Person]]
<Foaf:name rdf:datatype=„schema:string">Kalle Suur</foaf:name>
<Foaf:homepage rdf:resource="http://n2ide.ee"/>
<Foaf:knows rdf:resource="http://wiki.ontoworld.org/index.php/Peeter_Suur"/>
<rdf:type rdf:resource="http://xmlns.com/foaf/0.1/Person"/>
14. SPARQL
• Protocol and RDF QUERY Language (Sparkle)
• “Trying to use the Semantic Web without SPARQL is like trying
to use a relational database without SQL,” explained Tim
Berners-Lee
• ?subjekt ?predikaat ?objekt
• SELECT * WHERE (?parent <http://n2ide.ee/#hasSon> ?son)
Huvitas, sest 1999 aastal juba defineeriti, sellest on 13 aastat möödas ja ei ole laialt kasutuses.Teoreetilisi materjale palju, kuid üksikud töötavad lahendused.Vaikselt liigutakse edasi.
SirTimothy John Berners-Lee 1989. aastal pakkus koos oma kolleegidega Euroopa tuumafüüsika laboratooriumist (CERN) välja uue infovahetuseks hüpertekst protokolli (hypertext, tekst kus mingi võtmesõna kaudu saab pöörduda sellega seotud dokumendi juurde). Sellest sai 1991. aastaks WorldWideWeb. Ka esimene veebilehitseja kandis sama nime: WorldWideWeb. SirTimothy John Berners-Lee on peale HTML’i loomist uus unistus: have a dream for the Web . . . (1999)Tsiteerides: Ma unistan veebist, kus arvutid suudavad kogu veebis olevat infot analüüsida.Semantic web - “a web of data that can be processed directly and indirectly by machines."
HTML-i (HypertextMarkupLanguage) keele peamine puudus on, et me saame kirjeldada selle keele abil ainult kujunduslikke elemente (kirjatüüp, suurus jne). HTML ei võimalda aga anda dokumentides kirjeldatud infole tähendust. Seega peab huvitava materjali leidmiseks vaatama ükshaaval üle kõik otsingu tulemused. Üheks lahenduseks on kitsendada otsingu tingimusi, kuid tänase infohulga juures see ei tööta ning vajalikku infot me ei leia.Google: „“, OR, -, .., site:, inurl:, allintitle:, jne
Me võiksime anda selle töö arvutiprogrammile, mis leiaks vajalikud artiklid, kuid see osutub võimatuks, sest nendel veebilehtedel esitatud info ei ole arvutile arusaadav. Nad lihtsalt ei oma teadmisi ala kohta, mida neilt küsitakse. Semantilises veebis aga sellist olukorda ei tekiks.
Semantiline veeb on olemasoleva veebi edasiarendus, mille eesmärgiks on panna arvutid mõistma veebis leiduvat infot, nagu seda suudavad teha inimesed. Tekiks n-ö „masinate võrk”, kus arvutid küsiksid ja saaksid üksteiselt infot. Andmetele lisatakse sisulist automaattöötlust võimaldavad metaandmed semantilise võrguna, mis loob veebilehtedele struktureeritud sisu.
Semantilise veebi aluseks on kaks põhilist tehnoloogiat: ontoloogiad — hierarhilised mõistete süsteemid, mille abil esitatakse teadmisiagendid — programmid, mis suudavad neid teadmisi kasutada. Agendid täidavad ülesandeid meie käsul, kuid meie otsese sekkumiseta, kogudes andmeid veebis hajutatud allikatest ja vahetades tulemusi teiste agentidega.
Täna on võimalus kasutada avalikult terminoloogilisi (ontoloogia) ja faktilisi (andmemudelid) teadmisi DBpedia’s, mis struktureerib Wikipedia’s olevat teavet. DBpedia võimaldab teha keerukamaid päringuid Wikipedia’s ja siduda teistes andmekogudes oleva infoga.New York Times Open Datahttp://www.minut.ee/minutee.rdf
Semantilise Veebi komponendid:XML - annab elementaarse süntaksi dokumentidele, kuid ei seosta semantikat sisuga.XML Schema - on keel, selleks et piirata elementide sisu XML dokumentides.OWL (WebOntologyLanguage) RDF (ResourceDescriptionFramework) ja RDFSchemaSPARQL (Hääldatakse „Sparkle“ (sära), Protocoland RDF Query Language) on protokoll ja päringute keel semantilise veebi andmete jaoks.FOAF an acronym of Friend of a friend
OWL (WebOntologyLanguage) lisab rohkem sõnavara kirjeldamaks omadusi ja klasse: klasside vahelised sõltuvused, kardinaalsus, võrdsus, täpsemad omadused, omaduse karateristika (näiteks sümmeetria) ja loendatavad klassid.
RDF (ResourceDescriptionFramework) on lihtne keel kirjeldamaks andmemudeleid, mis kirjeldab objekte ja nende vahelisi seoseid (vaata eelnevat näidet)RDFS (ResourceDescriptionFrameworkShema) on sõnastik kirjeldamaks RDF-i resursside, koos üldistatud omaduste hierarhiatega, omadusi ja klasse.
FOAF an acronym of: Friend of a friend[[name::John Doe]] has the homepage [[foaf:homepage::http://johndoe.org]]. His best friend is [[foaf:knows::Jane Doe]]. [[Category:Person]]<Foaf:name rdf:datatype="http://www.w3.org/2001/XMLSchema#string">John Doe</foaf:name> <Foaf:homepagerdf:resource="http://johndoe.org"/> <Foaf:knowsrdf:resource="http://wiki.ontoworld.org/index.php/Jane_Doe"/> <rdf:type rdf:resource="http://xmlns.com/foaf/0.1/Person"/>
SPARQL (Hääldatakse „Sparkle“ (sära), Protocoland RDF Query Language) on protokoll ja päringute keel semantilise veebi andmete jaoks.SELECT * WHERE (?parent <http://n2ide.ee/#hasSon> ?son)
W3C (WorldWideWebConsortium) on võtnud semantilise veebi loomise üheks oma kolmest pikaajalisest põhieesmärgist: „Luua tarkvara keskkond, mille abil iga kasutaja saaks suurimat kasu nendest allikatest, mis on veebis saadaval”.Lots more self-describing dataEverywhere – on web, in applicationsWeb servicesSoftware agentsImprove user interfacehttp://data.nytimes.com/dbpedia.org/