Suomenkielinen esitys Talentumin sisällönhallinta seminaarista 2013. (Sorry, in Finnish only). Mitkä on kolme suurinta ongelmaa nyt ja mihin semanttinen teknologia voi tuoda apuja. Kolmas (ja kenties pahin) ongelma on mainittu mutta siihen ei teknologia tepsi - kenties aika parantaa tai putoava meteoriitti...
12. Semantiikan kolmio: puhumme
symboleilla, ajattelemme
konsepteilla, tarkoitamme aitoja asioita
2011-06-17 12
Asiakas?
• “symbol”
Nimi
• “concept”
Henkilökohtainen rajallinen käsitys
oliosta “ajatusolio päässäsi”
• “referent”
Todellinen olio
http://www.yso.fi/
onto/liito/p1332
Henkilö
Leasing firma
Yritysasiakas
Myyntipäällikkö
Company Customer
Client
Asiakas = joka maksaa
auton huoltolaskun
http://jhsmeta.fi/
sanasto/id/henkilö
/J15152
Asiakas = joka noutaa
auton
Huoltopäällikkö
13. Liike-elämän hengen velttous:
Huomenna huomataan, että tänään
ei tehty mitään päätöksiä uusista
kehityshankkeista
Haaste
Ei käsitellä tänään. Kirjoittajan huomio
näinä ankean talouden aikoina.
14. Esityksen agenda
1. Tiedonhallinnan ongelmat => liiketoiminnan
haasteet
2. Ontologia ja semanttinen tiedonhallinta
1. Mitä se on?
2. Miten se tehdään?
3. Yhteenveto
16. Tiedonhallinnan haasteet
Epäyhtenäiset käsitteet ja kuvaukset
Tiedon määrä kasvaa (nopeammin kuin käsittelykyky)
Tiedon huono laatu
Elinkaari ei ole hallinnassa (omistajuus, hyöty vs. kulut)
Tieto ei ole rakenteista
Tieto on hajallaan, usein siiloissa
Rajoittunut tietoisuus relevantista tiedosta
Liiketoiminnan tempo vaatii tietoa nopeasti
Semanttinen
teknologia
auttaa
20. Semanttinen teknologia - häh?
Kielitieteessä
• Fonologia = äänteet,
• Morfologia = lauseiden
muodostuminen
• Semantiikka = merkitykset
• Pragmatiikka = sanat kontekstissa
• esim. ironia, terminologia
politiikassa, piilomerkitykset
Filosofia
• Ontologia = filosofinen
tiede, tutkii olemisen kategorioita
Semanttinen teknologia
• Ontologia = konseptuaalinen
tietomalli
tietämysrakenteelle, kohde
spesifinen
• Semanttisuus = merkityksiä
hyödyntävä, (kieltä ja merkityksiä
rajatusti ymmärtävä)
21. Suunnattu graafi - peruspalikka
• RDF tripletti edustaa nimettyä suunnattua graafia.
• Siten se soveltuu paremmin tietynlaisen tietämyksen
mallintamiseen kuin relaatiomalli.
Heimo
Tämä kalvo
On luonut
Subject Predicate Object
22. Ontologian luonti – Graafi konsepti
ASPEN, an industry-leading Advanced
Service Platform for Ethernet Networks
A-2200
Access
Aspen
A-2200
Service
platform
Access
is a type of product
contains a product
is a type of product
Ethernet
Networks
is applicable for
23. Mitä on ontologia?
Yritys
@nimi Heimo
@rooli konsultti
@sivu http://link
@sposti heimo…
Työntekijä
@toimiala MDM…
@kaupunki Espoo
@nimi Talent Base
Listaa MDM toimialan
konsultit Espoossa.
@ID 2157464-4
työsuhde
Organisaation todellinen maailma
Ontologia = Tietämyskartta
Subjektiivinen kuvaus maailmasta
Valitut oliot, yhteydet, ominaisuudet
Liiketoiminnan tarpeet (sovellukset)
Logiikka: päättely, haut, navigointi ym.
Faktat,
informaatio
URL
24. Yritys
@nimi Heimo
@rooli konsultti
@sivu http://link
@sposti heimo…
Työntekijä
@toimiala MDM…
@kaupunki Espoo
@nimi Talent Base
Listaa MDM toimialan
konsultit Espoossa.
@ID 2157464-4
työsuhde
Organisaation todellinen maailma
Ontologia = Tietämyskartta
Subjektiivinen kuvaus maailmasta
Valitut oliot, yhteydet, ominaisuudet
Liiketoiminnan tarpeet (sovellukset)
Logiikka: päättely, haut, navigointi ym.
Faktat,
informaatio
URL
Mitä on ontologia - tietokoneelle?
25. Mikä on ontologiapalvelu?
Talent Basen määritelmä:
Ontologiapalvelu on tiedonhallintakyvykkyys:
• Luoda konseptuaalinen malli tietovarantojen päälle:
– Käsin mallintaen tai
– Automaattisesti (varmistettava luotettavuustaso)
• Palvella tietointensiivisiä sovelluksia:
- Muodostaa yhteinen malli olennaiselle tiedolle
- Tiedon haku liiketoimintakäsitteiden avulla
- Yhdistellä tietoa yli siilojen
- Linkittää data ja sisältö liiketoiminnan kontekstiin
- Tuo ei-rakenteisen tiedon analytiikan saataville
- Koskematta tietolähteisiin (haku lähteistä tarvittaessa)
• Toteutettu semanttisella teknologialla
• Vaatii riittävän hyvän perustan ja kypsyystason (tiedon laatu, saatavuus)
Läheinen synonyymi: semanttinen haku ≈ ontologia palvelu
26. Data ja sisältö
Ontologiapalvelu
Ontologia tiedonhallinnan maailmassa
projekti
tuotepalvelu
työkalu toimitus
ihminen
ratkaisu
asiakas teknologia
tarpeet
hyödyt
Sovellukset
Käyttäjät
Haku Help desk
Projektin
työpöytä
Tuote-opas
CMSTietämyksen
integrointi BI
33. -rooli
Tietoarkkitehtuurin kerrokset
33
Rakenne
ERP
projekti
tuotepalvelu
työkalu toimitus
ihminen
IntraEmailsMDM
IA tasot
Konseptuaalinen
Looginen
Toteutus
ratkaisu
CMS
asiakas
Tietotyypit
Data
ja sisältö
- metadata
Ontologia
Tietämyskartta:
-Liiket. entiteetit
-attribuutit
-suhteet
Järjestelmät
-tietokuvaukset
Asiayhteys
teknologia
tarpeet
hyödyt
Luokittelut
Big Data
Liike-
toiminta
prosessi
T&K Tuotanto Myynti Huolto
Minulle tärkeä tieto.
Hyviä päätöksiä.
Laadukas tieto.
Saatavuus.
Yhteinen kieli.
Jaettu ymmärrys.
34. Ontologiaratkaisun rakennuspalikat
ABSTRAKTIO TEKNOLOGIA DATA JA SISÄLTÖ
projekti
tuotepalvelu
työkalu toimitus
ihmine
n
ratkaisu
asiakas teknologia
tarpeet
hyödyt Rakenteinen
tieto
Muu sisältö
+ +
STANDARDITRDFS, OWL, SKOS
RIF
ISO Topic Maps
RFF/XML
SPARQL
Web API
XML, JSON-LD, RDFa
ODBC/JDBC Unicode
35. Tiedonhallinan kypsyys
Tiedot ja data
siiloissa
Tiedot
kuvattu,
Siilojen
mäppäys
Bisnestarpeet
mäpätty
tietoon
Päättely ja
analytiikka,
Säännöt
Strateginen
johtamisväline
Ennusteet
Mukailtu malli pohjautuu: CMMi, Mike 2.0, EA Strategy maturity, Laatujohtamisen kypsyys
Kyvykkyys
Vertikaali
ratkaisu
Tietämyksen
integrointi palvelu
Ei tarvitse olla
täydellistä ollakseen
hyödyllistä
Sanasto
36. Tyypillisiä käyttötapauksia
• Automatisoida operaattori-portaalin sisällönhallintaa
– Tuoterakenne, yhteensopivuustiedot, tuoteinformaatio
• Hallita tietoa & mainoksia portaalissa
– uutiset eri lähteistä reititetään, mainosten täsmäys
• ”Älykkäät” asiantuntijan apuvälineet
– Nopeutetaan tuotesuunnittelua, fiksu help desk -apulainen
• Tietämystason tiedon integrointi
– EAI käy kalliiksi ja hitaaksi – semanttisen tason integraatio
• Tärkeän tiedon uuttaminen isoista datamääristä
– Telco operaattoreiden BSS/OSS datan louhinta
• Globaali avoin tieto (julkishallinto, bisnes)
– Tiedon yhdistely ja käyttö Web APIn kautta
– Programmableweb.com (MuleSoft)
– http://www.bbc.co.uk/ontologies/
37. Opiskele lisää semanttista tiedonkäsittelyä
• Suomessa:
– http://data.aalto.fi/
– http://jhsmeta.fi/sanasto/
– http://informationthinker.blogspot.fi/ (Heimon blogi)
• W3C:
– http://www.w3.org/standards/semanticweb/
– http://www.w3schools.com/web/web_semantic.asp
• Toimittajien valitut palat (MBS warning!):
– http://www.cambridgesemantics.com/semantic-university/
– http://www.poolparty.biz/videos/
– http://www.fluidops.com/publications/
– http://www.ontology.com/resources/
– http://www.programmableweb.com/ (Web API)
The Semantic Web = a Web with a meaning.
39. Yhteenveto
• Semanttinen teknologia tarjoaa joustavaa ja tehokasta
informaation hallintaa:
– Tehokkaampia keinoja hallita tieto-tsunamia
– Muodostaa yhtenäisen tietämyskartan tiedosta joka on hajallaan
– Tehostaa tiedon hakua
– Automatisoi metatiedon luontia (auto tagging)
– Tuo ei-rakenteisen tiedon analytiikan saataville
– Metatasolla on kettärämpää mallintaa liiketoimintaa
• Vaikka iso asia - liikkeelle pääsee helposti
• Semanttinen netti = Linked Open Data (web of data)
• Hakukoneet suosii RDF metadataa: http://schema.org/ (SEO)
Brain will not get bigger – amount of information willVuoteen 2006 menessäluotutieto, luodaannytallevuodessa!TiedonharkittupoistaminenmaksaaenemmänkuinuudenkapasiteetinlisääminenThe world’s information is doubling every two years. In 2011 the world will create a staggering 1.8 zettabytes. By 2020 the world will generate 50 times the amount of information and 75 times the number of "information containers" while IT staff to manage it will grow less than 1.5 times. (EMC)On halvempaalisätätallennuskapasiteettiakuintehdäanalyyttistätiedonpoistamista.
Brain will not get bigger – amount of information willVuoteen 2006 menessäluotutieto, luodaannytallevuodessa!TiedonharkittupoistaminenmaksaaenemmänkuinuudenkapasiteetinlisääminenThe world’s information is doubling every two years. In 2011 the world will create a staggering 1.8 zettabytes. By 2020 the world will generate 50 times the amount of information and 75 times the number of "information containers" while IT staff to manage it will grow less than 1.5 times. (EMC)On halvempaalisätätallennuskapasiteettiakuintehdäanalyyttistätiedonpoistamista.
Sama pätee järjestelmille, organisaatioille
VS. Huoltopäällikkö: Asiakas = henkilö joka tuo auton huoltoon! Hänelle soitetaan kun auto valmis.Klassikko: tilaa Tallinnassa viineri
Sama pätee järjestelmille, organisaatioille
Data Warehousing Institute kysely US yrityksissä:suurinyksittäinensyydatanlaatuonglemiinhuonot tai puuttuvattermienmäärittelyt
First came Enron, with $65.5 billion in assets, going belly-up and becoming the largest bankruptcy in U.S. history at that time. Chairman Kenneth Lay said that Enron's decision to file bankruptcy would “stabilize the company,” but over the next five years the company was completely liquidated. The stock went from a high of $84.63 in December 2000 to a whopping 26¢ one year later.TUI Travel Plc, which owns the Thomson travel agency, acquired rival company First Choice in 2007. An error during the integration of First Choice’s accounting software with TUI Travel’s own systems meant that discounts offered by First Choice sales people were not registered on TUI's accounts.This meant TUI Travel plc overstated its revenue for the last year to the tune of £117 million. Ihmisetvaihtaatyöpaikkaajostekeminen, välineetjaympäristö & kulttuurieityydytä.Vuosien 2010 ja 2011 aikana Euroopan keskuspankki osti Kreikan velkakirjoja sijoittajilta polkuhintaan. IDC recently undertook a large global survey of information workers and IT professionals on behalf of Adobe to better understand the productivity challenges that cost information workers time, and put a dollar value on that unproductive time. The bottom line: conservatively, the cost to an organization of 1,000 employees is nearly $16m a year.http://www.rebeccacosta.com/book-interview.htmwhen complexity exceeds our cognitive ability. We become vulnerable to unproven beliefs. This is also what happened when we made the decision to go into Iraq. The situation was complex and we had very little data to go on. So we made the decision substantially based on our belief that the country wouldbe safer if we sent troops into Iraq.
First came Enron, with $65.5 billion in assets, going belly-up and becoming the largest bankruptcy in U.S. history at that time. Chairman Kenneth Lay said that Enron's decision to file bankruptcy would “stabilize the company,” but over the next five years the company was completely liquidated. The stock went from a high of $84.63 in December 2000 to a whopping 26¢ one year later.TUI Travel Plc, which owns the Thomson travel agency, acquired rival company First Choice in 2007. An error during the integration of First Choice’s accounting software with TUI Travel’s own systems meant that discounts offered by First Choice sales people were not registered on TUI's accounts.This meant TUI Travel plc overstated its revenue for the last year to the tune of £117 million. Ihmisetvaihtaatyöpaikkaajostekeminen, välineetjaympäristö & kulttuurieityydytä.Vuosien 2010 ja 2011 aikana Euroopan keskuspankki osti Kreikan velkakirjoja sijoittajilta polkuhintaan. IDC recently undertook a large global survey of information workers and IT professionals on behalf of Adobe to better understand the productivity challenges that cost information workers time, and put a dollar value on that unproductive time. The bottom line: conservatively, the cost to an organization of 1,000 employees is nearly $16m a year.http://www.rebeccacosta.com/book-interview.htmwhen complexity exceeds our cognitive ability. We become vulnerable to unproven beliefs. This is also what happened when we made the decision to go into Iraq. The situation was complex and we had very little data to go on. So we made the decision substantially based on our belief that the country wouldbe safer if we sent troops into Iraq.
Pitäisivastatakohteesta:Mitäovattarkoitukset (ontologisetkysymykset)Mikä on kielellistenilmaisujenjaniidentarkoitustensuhde (semantiikankysymykset)Kuinkaem. suhteidenkytkennätvoioppia (oppimisenkysymykset)Kuinkakommunikoimmetarkoituksia (kommunikoinninkysymykset)Konseptuaalinen (alias kognitiivinen) lähestymistapa:Kielellistenilmaisujentarkoituksetovatmielikuvaentiteettejä – kognitiivisiarakenteitakielenkäyttäjänpäässä.Kieliitsessään on osakognitiivistarakennetta – eiirrallinen tai riippumatonitsemaailmankuvaustaKieliedustaakonseptia, eimaailmaa!
Ontologia = konseptuaalinen tietomalli = ylätason tietomalli = bisnes informaation malliSemanttisessa teknologiassa:-asiat kuvataan ja identifioidaan (luotettava ID …. Useita nimiä)-tyypitetään-linkitetään toisiin asioihin-asioihin liitettään tietoresursseja (RDF – URL)+ LOD: ontologiat julkaistaan muille käytettäväksi (linkitys: meidän toimipiste on Lontoossa Lontoon kotisivut + metron reittiopas)Google http://www.cambridgesemantics.com/semantic-university/introduction-to-the-semantic-web
Ontologia = konseptuaalinen tietomalli = ylätason tietomalli = bisnes informaation malliSemanttisessa teknologiassa:-asiat kuvataan ja identifioidaan (luotettava ID …. Useita nimiä)-tyypitetään-linkitetään toisiin asioihin-asioihin liitettään tietoresursseja (RDF – URL)+ LOD: ontologiat julkaistaan muille käytettäväksi (linkitys: meidän toimipiste on Lontoossa Lontoon kotisivut + metron reittiopas)Google http://www.cambridgesemantics.com/semantic-university/introduction-to-the-semantic-web
The most common ontology powered tool today, which everyone uses many times per dayGoogle – graph -- Freebase
NSA – ne tietävät mitä sinä ajattelet!
Otetaan esim. yksi vertikaali ja toteutetaan se kunnolla ensin, eli business case: NSN operaattori portaali, mainosten targetointi netissä, dokumenttien automaattinen luokittelu
Globaali: Kun yhteystiedoissa Martin James kohdalla klikkaat suunnittele matka: lähin bussi lentoasemalle edullisimman lennon varaus metro Lontooseen Trip Advisor kevereitten suosittelema hotelli viesti What’sAppilla Martinille jossa on ko. Suunnitelma.Asiakkaat ei ole tyytyväisiä palveluumme:Keitä he ovat ja mitkä on kunkin tarpeet? palvelumme ja niiden hyödyt?Tärkeimmät päätökset tehdään tuntumalla – ei faktoillaDataan ei voi luottaa, sitä ei ole saatavilla tai se ei ole yhteismitallistaTietojärjestelmien tekeminen ja liittäminen kallistaYhteinen kieli puuttuu, tietomallit, käsitteet ja määritelmät sopimatta Jopa 40% IT budjetista menee integraatioihin (IBM 2005)Työn tuottavuus huono ja innovointi piilossaSisäiset ideat ei saavuta päätöksentekoa, kukaan ei tiedä mitä naapurissa tapahtuuTietotyön ergonomia hukassaTietojärjestelmien muutosnopeus ei riitä bisneksen vauhtiinLiiketoiminnan tarvitsema tieto ei ole mallinnettu ja se on syvällä järjestelmissä