SlideShare a Scribd company logo
1 of 23
Informasjonsintegrasjon
– hva er utfordringene?
Stian Danenbarger <stian@bouvet.no>
Rådgiver, Bouvet ASA

Twitter: @stidan
EII
?
Begrep/
            konsept




Referent/              Term/
 objekt               symbol
Konseptet
                      ‘representasjon
                        av begrepet’


                                            <element name="foo">
                                             <oneOrMore><choice>
                                                 <element name="bar"><text/>
                                                  </element>
                                                 <element name="baz"><text/>
                                                  </element>
                                             </choice></oneOrMore>
                                            </element>
                                        <!ELEMENT foo ( bar | baz)* >
            Begrep/                               <xs:complexType name="foo">
                                                   <xs:choice minOccurs="0">
            konsept                                   maxOccurs="unbounded">
                                                     <xs:element name="bar"/>
                                                     <xs:element name="baz"/>
                                                   </xs:choice>
                                                  </xs:complexType>




Referent/                Term/
objekt                  symbol
#%*¤!




        KONSENSUS!
XML                           XML
      “While the definition of an XML protocol
      element using a validity formalism is
      useful, it is not sufficient. XML by itself does
      not supply semantics.”
XML
      “Any document defining a protocol element
      with XML MUST also have sufficient prose in
      the document describing the semantics of
      whatever XML the document has elected to
      define.”

      RFC 3470, “Guidelines for the Use of XML within IETF
      Protocols” January 2003                     XQuery
70%
      60%                       70%
95%                                   70%
        modell 1
                   30%   modell 2




      80%                       40%

                   90%
Informasjonsintegrasjon – hva er utfordringene
Informasjonsintegrasjon – hva er utfordringene
Informasjonsintegrasjon – hva er utfordringene
Informasjonsintegrasjon – hva er utfordringene

More Related Content

What's hot (20)

Growing jQuery
Growing jQueryGrowing jQuery
Growing jQuery
 
How to increase Performance of Web Application using JQuery
How to increase Performance of Web Application using JQueryHow to increase Performance of Web Application using JQuery
How to increase Performance of Web Application using JQuery
 
Controle de estado
Controle de estadoControle de estado
Controle de estado
 
Javascript - Beyond-jQuery
Javascript - Beyond-jQueryJavascript - Beyond-jQuery
Javascript - Beyond-jQuery
 
Dependency injection in Scala
Dependency injection in ScalaDependency injection in Scala
Dependency injection in Scala
 
Jquery
JqueryJquery
Jquery
 
えっ、なにそれこわい
えっ、なにそれこわいえっ、なにそれこわい
えっ、なにそれこわい
 
Jquery Basics
Jquery BasicsJquery Basics
Jquery Basics
 
Xml 2
Xml  2 Xml  2
Xml 2
 
Everyday's JS
Everyday's JSEveryday's JS
Everyday's JS
 
Java script
Java scriptJava script
Java script
 
Jquery fundamentals
Jquery fundamentalsJquery fundamentals
Jquery fundamentals
 
Full compile invalid obje pl/sql
Full compile invalid obje pl/sqlFull compile invalid obje pl/sql
Full compile invalid obje pl/sql
 
Jquery plugin development
Jquery plugin developmentJquery plugin development
Jquery plugin development
 
Handlebars.js
Handlebars.jsHandlebars.js
Handlebars.js
 
JQuery
JQueryJQuery
JQuery
 
Javascript for the c# developer
Javascript for the c# developerJavascript for the c# developer
Javascript for the c# developer
 
Going with style: Themes and apps for Magento Go
Going with style: Themes and apps for Magento GoGoing with style: Themes and apps for Magento Go
Going with style: Themes and apps for Magento Go
 
Schemas and soap_prt
Schemas and soap_prtSchemas and soap_prt
Schemas and soap_prt
 
SetFocus Portfolio
SetFocus PortfolioSetFocus Portfolio
SetFocus Portfolio
 

Viewers also liked

"Maskiner som leser" (Nordic Research 2011)
"Maskiner som leser" (Nordic Research 2011)"Maskiner som leser" (Nordic Research 2011)
"Maskiner som leser" (Nordic Research 2011)Stian Danenbarger
 
"Hodepine 2.0" - Enterprise 2.0 for virksomhetsarkitekter, presentert på Soft...
"Hodepine 2.0" - Enterprise 2.0 for virksomhetsarkitekter, presentert på Soft..."Hodepine 2.0" - Enterprise 2.0 for virksomhetsarkitekter, presentert på Soft...
"Hodepine 2.0" - Enterprise 2.0 for virksomhetsarkitekter, presentert på Soft...Stian Danenbarger
 
Deling av data: ”Tenke det, ønske det, ville det med, men gjøre det...?”
Deling av data: ”Tenke det, ønske det, ville det med, men gjøre det...?”Deling av data: ”Tenke det, ønske det, ville det med, men gjøre det...?”
Deling av data: ”Tenke det, ønske det, ville det med, men gjøre det...?”Stian Danenbarger
 
Keynote Topic Maps 2010: "Occurrences"
 Keynote Topic Maps 2010: "Occurrences" Keynote Topic Maps 2010: "Occurrences"
Keynote Topic Maps 2010: "Occurrences"Stian Danenbarger
 
GoOpen 2010: Fra Open Data til Linked Open Data
GoOpen 2010: Fra Open Data til Linked Open DataGoOpen 2010: Fra Open Data til Linked Open Data
GoOpen 2010: Fra Open Data til Linked Open DataStian Danenbarger
 
Enkle Grep – omfattende Grep…anvendt semantikk i utdanningssektoren
Enkle Grep – omfattende Grep…anvendt semantikk i utdanningssektorenEnkle Grep – omfattende Grep…anvendt semantikk i utdanningssektoren
Enkle Grep – omfattende Grep…anvendt semantikk i utdanningssektorenStian Danenbarger
 
Semantic search - for journalists
Semantic search - for journalistsSemantic search - for journalists
Semantic search - for journalistsStian Danenbarger
 
GoOpen 2009: Den Digitale Moltemyras Forbannelse
GoOpen 2009: Den Digitale Moltemyras ForbannelseGoOpen 2009: Den Digitale Moltemyras Forbannelse
GoOpen 2009: Den Digitale Moltemyras ForbannelseStian Danenbarger
 
Fra tjenesteorientert til dataorientert integrasjon
Fra tjenesteorientert til dataorientert integrasjonFra tjenesteorientert til dataorientert integrasjon
Fra tjenesteorientert til dataorientert integrasjonStian Danenbarger
 

Viewers also liked (9)

"Maskiner som leser" (Nordic Research 2011)
"Maskiner som leser" (Nordic Research 2011)"Maskiner som leser" (Nordic Research 2011)
"Maskiner som leser" (Nordic Research 2011)
 
"Hodepine 2.0" - Enterprise 2.0 for virksomhetsarkitekter, presentert på Soft...
"Hodepine 2.0" - Enterprise 2.0 for virksomhetsarkitekter, presentert på Soft..."Hodepine 2.0" - Enterprise 2.0 for virksomhetsarkitekter, presentert på Soft...
"Hodepine 2.0" - Enterprise 2.0 for virksomhetsarkitekter, presentert på Soft...
 
Deling av data: ”Tenke det, ønske det, ville det med, men gjøre det...?”
Deling av data: ”Tenke det, ønske det, ville det med, men gjøre det...?”Deling av data: ”Tenke det, ønske det, ville det med, men gjøre det...?”
Deling av data: ”Tenke det, ønske det, ville det med, men gjøre det...?”
 
Keynote Topic Maps 2010: "Occurrences"
 Keynote Topic Maps 2010: "Occurrences" Keynote Topic Maps 2010: "Occurrences"
Keynote Topic Maps 2010: "Occurrences"
 
GoOpen 2010: Fra Open Data til Linked Open Data
GoOpen 2010: Fra Open Data til Linked Open DataGoOpen 2010: Fra Open Data til Linked Open Data
GoOpen 2010: Fra Open Data til Linked Open Data
 
Enkle Grep – omfattende Grep…anvendt semantikk i utdanningssektoren
Enkle Grep – omfattende Grep…anvendt semantikk i utdanningssektorenEnkle Grep – omfattende Grep…anvendt semantikk i utdanningssektoren
Enkle Grep – omfattende Grep…anvendt semantikk i utdanningssektoren
 
Semantic search - for journalists
Semantic search - for journalistsSemantic search - for journalists
Semantic search - for journalists
 
GoOpen 2009: Den Digitale Moltemyras Forbannelse
GoOpen 2009: Den Digitale Moltemyras ForbannelseGoOpen 2009: Den Digitale Moltemyras Forbannelse
GoOpen 2009: Den Digitale Moltemyras Forbannelse
 
Fra tjenesteorientert til dataorientert integrasjon
Fra tjenesteorientert til dataorientert integrasjonFra tjenesteorientert til dataorientert integrasjon
Fra tjenesteorientert til dataorientert integrasjon
 

Recently uploaded

WordPress Websites for Engineers: Elevate Your Brand
WordPress Websites for Engineers: Elevate Your BrandWordPress Websites for Engineers: Elevate Your Brand
WordPress Websites for Engineers: Elevate Your Brandgvaughan
 
Designing IA for AI - Information Architecture Conference 2024
Designing IA for AI - Information Architecture Conference 2024Designing IA for AI - Information Architecture Conference 2024
Designing IA for AI - Information Architecture Conference 2024Enterprise Knowledge
 
SQL Database Design For Developers at php[tek] 2024
SQL Database Design For Developers at php[tek] 2024SQL Database Design For Developers at php[tek] 2024
SQL Database Design For Developers at php[tek] 2024Scott Keck-Warren
 
New from BookNet Canada for 2024: BNC CataList - Tech Forum 2024
New from BookNet Canada for 2024: BNC CataList - Tech Forum 2024New from BookNet Canada for 2024: BNC CataList - Tech Forum 2024
New from BookNet Canada for 2024: BNC CataList - Tech Forum 2024BookNet Canada
 
Gen AI in Business - Global Trends Report 2024.pdf
Gen AI in Business - Global Trends Report 2024.pdfGen AI in Business - Global Trends Report 2024.pdf
Gen AI in Business - Global Trends Report 2024.pdfAddepto
 
Streamlining Python Development: A Guide to a Modern Project Setup
Streamlining Python Development: A Guide to a Modern Project SetupStreamlining Python Development: A Guide to a Modern Project Setup
Streamlining Python Development: A Guide to a Modern Project SetupFlorian Wilhelm
 
Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...
Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...
Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...shyamraj55
 
Nell’iperspazio con Rocket: il Framework Web di Rust!
Nell’iperspazio con Rocket: il Framework Web di Rust!Nell’iperspazio con Rocket: il Framework Web di Rust!
Nell’iperspazio con Rocket: il Framework Web di Rust!Commit University
 
Unleash Your Potential - Namagunga Girls Coding Club
Unleash Your Potential - Namagunga Girls Coding ClubUnleash Your Potential - Namagunga Girls Coding Club
Unleash Your Potential - Namagunga Girls Coding ClubKalema Edgar
 
costume and set research powerpoint presentation
costume and set research powerpoint presentationcostume and set research powerpoint presentation
costume and set research powerpoint presentationphoebematthew05
 
DevEX - reference for building teams, processes, and platforms
DevEX - reference for building teams, processes, and platformsDevEX - reference for building teams, processes, and platforms
DevEX - reference for building teams, processes, and platformsSergiu Bodiu
 
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationBeyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationSafe Software
 
Bun (KitWorks Team Study 노별마루 발표 2024.4.22)
Bun (KitWorks Team Study 노별마루 발표 2024.4.22)Bun (KitWorks Team Study 노별마루 발표 2024.4.22)
Bun (KitWorks Team Study 노별마루 발표 2024.4.22)Wonjun Hwang
 
Scanning the Internet for External Cloud Exposures via SSL Certs
Scanning the Internet for External Cloud Exposures via SSL CertsScanning the Internet for External Cloud Exposures via SSL Certs
Scanning the Internet for External Cloud Exposures via SSL CertsRizwan Syed
 
Connect Wave/ connectwave Pitch Deck Presentation
Connect Wave/ connectwave Pitch Deck PresentationConnect Wave/ connectwave Pitch Deck Presentation
Connect Wave/ connectwave Pitch Deck PresentationSlibray Presentation
 
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmaticsKotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmaticscarlostorres15106
 
Powerpoint exploring the locations used in television show Time Clash
Powerpoint exploring the locations used in television show Time ClashPowerpoint exploring the locations used in television show Time Clash
Powerpoint exploring the locations used in television show Time Clashcharlottematthew16
 
Commit 2024 - Secret Management made easy
Commit 2024 - Secret Management made easyCommit 2024 - Secret Management made easy
Commit 2024 - Secret Management made easyAlfredo García Lavilla
 
Understanding the Laravel MVC Architecture
Understanding the Laravel MVC ArchitectureUnderstanding the Laravel MVC Architecture
Understanding the Laravel MVC ArchitecturePixlogix Infotech
 

Recently uploaded (20)

WordPress Websites for Engineers: Elevate Your Brand
WordPress Websites for Engineers: Elevate Your BrandWordPress Websites for Engineers: Elevate Your Brand
WordPress Websites for Engineers: Elevate Your Brand
 
Designing IA for AI - Information Architecture Conference 2024
Designing IA for AI - Information Architecture Conference 2024Designing IA for AI - Information Architecture Conference 2024
Designing IA for AI - Information Architecture Conference 2024
 
SQL Database Design For Developers at php[tek] 2024
SQL Database Design For Developers at php[tek] 2024SQL Database Design For Developers at php[tek] 2024
SQL Database Design For Developers at php[tek] 2024
 
New from BookNet Canada for 2024: BNC CataList - Tech Forum 2024
New from BookNet Canada for 2024: BNC CataList - Tech Forum 2024New from BookNet Canada for 2024: BNC CataList - Tech Forum 2024
New from BookNet Canada for 2024: BNC CataList - Tech Forum 2024
 
Gen AI in Business - Global Trends Report 2024.pdf
Gen AI in Business - Global Trends Report 2024.pdfGen AI in Business - Global Trends Report 2024.pdf
Gen AI in Business - Global Trends Report 2024.pdf
 
Streamlining Python Development: A Guide to a Modern Project Setup
Streamlining Python Development: A Guide to a Modern Project SetupStreamlining Python Development: A Guide to a Modern Project Setup
Streamlining Python Development: A Guide to a Modern Project Setup
 
Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...
Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...
Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...
 
Nell’iperspazio con Rocket: il Framework Web di Rust!
Nell’iperspazio con Rocket: il Framework Web di Rust!Nell’iperspazio con Rocket: il Framework Web di Rust!
Nell’iperspazio con Rocket: il Framework Web di Rust!
 
Unleash Your Potential - Namagunga Girls Coding Club
Unleash Your Potential - Namagunga Girls Coding ClubUnleash Your Potential - Namagunga Girls Coding Club
Unleash Your Potential - Namagunga Girls Coding Club
 
costume and set research powerpoint presentation
costume and set research powerpoint presentationcostume and set research powerpoint presentation
costume and set research powerpoint presentation
 
DevEX - reference for building teams, processes, and platforms
DevEX - reference for building teams, processes, and platformsDevEX - reference for building teams, processes, and platforms
DevEX - reference for building teams, processes, and platforms
 
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationBeyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
 
Bun (KitWorks Team Study 노별마루 발표 2024.4.22)
Bun (KitWorks Team Study 노별마루 발표 2024.4.22)Bun (KitWorks Team Study 노별마루 발표 2024.4.22)
Bun (KitWorks Team Study 노별마루 발표 2024.4.22)
 
Scanning the Internet for External Cloud Exposures via SSL Certs
Scanning the Internet for External Cloud Exposures via SSL CertsScanning the Internet for External Cloud Exposures via SSL Certs
Scanning the Internet for External Cloud Exposures via SSL Certs
 
DMCC Future of Trade Web3 - Special Edition
DMCC Future of Trade Web3 - Special EditionDMCC Future of Trade Web3 - Special Edition
DMCC Future of Trade Web3 - Special Edition
 
Connect Wave/ connectwave Pitch Deck Presentation
Connect Wave/ connectwave Pitch Deck PresentationConnect Wave/ connectwave Pitch Deck Presentation
Connect Wave/ connectwave Pitch Deck Presentation
 
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmaticsKotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
Kotlin Multiplatform & Compose Multiplatform - Starter kit for pragmatics
 
Powerpoint exploring the locations used in television show Time Clash
Powerpoint exploring the locations used in television show Time ClashPowerpoint exploring the locations used in television show Time Clash
Powerpoint exploring the locations used in television show Time Clash
 
Commit 2024 - Secret Management made easy
Commit 2024 - Secret Management made easyCommit 2024 - Secret Management made easy
Commit 2024 - Secret Management made easy
 
Understanding the Laravel MVC Architecture
Understanding the Laravel MVC ArchitectureUnderstanding the Laravel MVC Architecture
Understanding the Laravel MVC Architecture
 

Informasjonsintegrasjon – hva er utfordringene

  • 1. Informasjonsintegrasjon – hva er utfordringene? Stian Danenbarger <stian@bouvet.no> Rådgiver, Bouvet ASA Twitter: @stidan
  • 2. EII
  • 3. ?
  • 4.
  • 5.
  • 6.
  • 7.
  • 8. Begrep/ konsept Referent/ Term/ objekt symbol
  • 9.
  • 10. Konseptet ‘representasjon av begrepet’ <element name="foo"> <oneOrMore><choice> <element name="bar"><text/> </element> <element name="baz"><text/> </element> </choice></oneOrMore> </element> <!ELEMENT foo ( bar | baz)* > Begrep/ <xs:complexType name="foo"> <xs:choice minOccurs="0"> konsept maxOccurs="unbounded"> <xs:element name="bar"/> <xs:element name="baz"/> </xs:choice> </xs:complexType> Referent/ Term/ objekt symbol
  • 11. #%*¤! KONSENSUS!
  • 12.
  • 13.
  • 14.
  • 15. XML XML “While the definition of an XML protocol element using a validity formalism is useful, it is not sufficient. XML by itself does not supply semantics.” XML “Any document defining a protocol element with XML MUST also have sufficient prose in the document describing the semantics of whatever XML the document has elected to define.” RFC 3470, “Guidelines for the Use of XML within IETF Protocols” January 2003 XQuery
  • 16.
  • 17.
  • 18.
  • 19. 70% 60% 70% 95% 70% modell 1 30% modell 2 80% 40% 90%

Editor's Notes

  1. EII (Enterprise Info. Integr.) er ikke et nytt begrep. Noen mener begrepet ble første gang ble gjort allment kjent av analytikerfirmaet Standish Group i 2002*), mens andre refererer til løsninger utviklet på det sene 90-tallet. Det tidligste artikkelen jeg har funnet om distribuerte spørringer over databaser er fra 1981…**) *) http://www.cs.washington.edu/homes/alon/files/eiisigmod05.pdf **) P. A. Bernstein, N. Goodman, E. Wong, C. L. Reeve,and J. B. R. Jr. Query processing in a system fordistributed databases (sdd-1). ACM Trans. DatabaseSyst., 6(4):602{625, 1981
  2. Fra starten var målet med EII å muliggjøre såkalte «fødererte» spørringer over data fra multiple kilder i tilnærmet «sann tid» - altså uten å gå den lange veien om å ekstrahere, transformere og laste alle dataene inn inn i et datavarehus.  Man utformet typisk et «virtuelt» skjema å spørre mot, basert på en felles, såkalt «kanonisk» datamodell for virksomheten. EII-løsningene håndterte reformuleringen av spørringene til hver kilde, og var gjerne enten basert på relasjonsbase-teknologi, eller sentrert rundt XQuery og XML – altså mer strukturerte spørringer enn søkemotorer tradisjonelt har vært i stand til…
  3. Behovet for å sammenstille («integrere») data er selvsagt ikke nytt. De fleste av dere har sikkert hatt befatning med løsninger for sammenstilling av strukturerte data: Delte databaser, datavarehus…og ikke minst manuelt! Alle kjenner vel fortsatt til «integrasjonsløsninger» der stressede kundebehandlere henter ut data fra ulike kilder og klipper og limer sammen noe i full fart…!
  4. Behovet for II har ikke akkurat minsket de senere årene, for å si det mildt..: Én ting er den eksponensielle veksten av mengden informasjon – både strukturert og ustrukturert – som innebærer en dobling hvert 2,3 år.De konkurransemessige kravene til raske omstillinger, sammenslåinger og muligheten til å inngå i nye konstellasjoner med andre virksomheter økerSosiale medier og søkemotorer øker de ansattes forventninger til sømløs deling og sammenstillingSamfunnets krav til virksomhetens juridiske etterrettelighet øker…Samtidig sier Forrester at oppmerksomheten rundt dagens kommersielle EII-løsninger har avtatt…!
  5. EII lover et kjapt og fleksibelt tjenestelag som i tilnærmet sann tid kan besvare vilkårlige spørringer over heterogene kilder, strukturert eller ustrukturert, distribuert over hele selskapet – og kanskje til og med utenfor?  Kan bygge tjenester over denne, og realisere «Sømløs virksomhet»… What’s not to like?!?
  6. Informasjonsintegrasjon er selvsagt et område som er fullt av utfordringer – mange opplagte – og det ville føre for langt å gå inn på alle her. MEN…Min sterke påstand er at et underliggende misforhold mellom menneskelig symbolbruk, EIIs intensjoner og ÉN implementasjonsmessig antakelseer årsak til mange av utfordringene, og dette resulterer i systemer som er unødig rigide og dyreimplementasjons- og forvaltningsmessig. Dette igjen bidrar til dårligere datakvalitet, og til svekkede muligheter til å styre virksomheten etter sanntidsdata. Vi ser at kostnadene og kompleksiteten så langt har hindret mange virksomheters EII-initiativer, selv om besparelsene kan være enorme.Etterpå skal vi vise hvorfor vi er så stolte av hva vi har fått til i Hafslund. 
  7. For å underbygge påstanden vil jeg først introdusere den såkalt «Ogdens trekant», som er en visuell framstilling av en sammenheng allerede beskrevet av Aristoteles – sammenhengen mellom et fysisk objekt og informasjonsobjektet som representerer det – for eksempel et skilt eller et ord brukt i dagligtale… I og utenfor en organisasjon:Samme referent – ulik konseptuell forståelseUlik forståelse gir ulik symbolbrukForståelsen og symbolbruken varierer over tid, med kontekst, fra individ til individ…
  8. Begrepet «rød» - men for hvem? MegEn kunstnerEn forsker som analyserer fargespektreBegrepet «kunde» – men for hvem?…Og ikke minst alle relasjonene mellom begrepene…
  9. Det blir ikke bedre når vi skal kodifisere begrepene og relasjonene på metanivå – som når vi skal representere dette i relasjonsbaser, UML eller XML…Ikke rart representasjonene blir forskjellige i de ulike systemene… (tre ulike eksempler til høyre)
  10. …Men kan vi ikke bare standardisere begrepene eller relasjonene, eller komme fram til en konsensus…?Ressurskrevende!Tar laaaang tid (år) – i praksis alltid etterslep i forhold til faktisk brukInnen man er enige, er enigheten allerede utdatertFortolkningen av symbolene og representasjonene varierer – over tid, med kontekst, fra individ til individ… Opplevd rigiditet leder blant annet til «kreativ» og inkonsistent bruk av registreringsfelter – én viktig årsak til lav datakvalitet – og sammenstilling på feil premisser…
  11. Jeg nevnte et underliggende misforhold mellom menneskelig symbolbruk ogÉN implementasjonsmessig antakelse – på engelsk kalt:«the Closed World Assumption&quot; *)CWA er en underliggende antakelse som gir en ekstrem forenkling av verdens kompleksitet og tvetydighet, og også en riktig forenkling for mange implementasjonsformål…:Antar at settet av entiteter og relasjoner er komplett (bøkene i et bibliotek, passasjerene på et fly)Omvendt: Entiteter og relasjoner som ikke er eksplisitt representert antas å ikke eksistereNavn antas unikt identifiserendeEtt predefinert skjema definerer skopet og tolkningen av domenet – må kun sjekke sjekke den ene modellens struktur for å besvare en spørringUlemper:Rigiditet: Ikke egnet for hyppige, inkrementelle utvidelser av ufullstendig og irregulær informasjonmed ulik struktur, som når man sammenstiller fra mange kilder (NULL og OPTIONAL er primitive workarounds) …Tette bindinger: Ett felles skjema krever konsensus og resulterer i omfattende koordineringskostnader og betydelig risiko (systemendringer må gjøres synkront)...Effektivt eksekveringsmessig - ineffektivt implementasjons- og forvaltningsmessig*) Raymond Reiter, 1978. “On Closed World Data Bases”, Logic and Data Bases, H. Gallaire and J. Minker, eds., New York: Plenum Press, 55-76
  12. Klassisk eksempel på CWA:Relasjonsmodellen: SQL og relasjonsbaser - som transaksjonssystem og for modellering av svært avgrensede, strukturerte domener - eksepsjonelt vellykket i virksomhetssammenheng. Velprøvd og optimalisert. Naturlig å forsøke å overføre en vellykket tilnærming til andre områder...Delt relasjonsbase («mini-EII»):Ett felles, delt skjema som må forhåndsdefineresSammenhengen mellom det modellerte domenet og skjemaet er implisitt - i beste fall dokumentert for utviklereTett kopling mellom data og skjemaAvgrenset, strukturert domene (&quot;CWA&quot; og identitet, relasjoner, NULL)Proprietær, ofte begrenset støtte for ustrukturert informasjon, f.eks. gjennom nøkkelordsøkLagrer data - ikke informasjon (eksempel tall -&gt; saldo). Domenespesifikk kontekst og relasjoner svært begrenset, eller mangler. Kontekstuell tolkning overlatt til applikasjonsutviklerne(!)ETL - ikke sanntid (støttet i noen nyere løsninger), spørringer mot foreldede dataOR-mappinger må kodes om ved hver endring (&quot;rippeleffekt&quot;)Synkron koordinering: Semantikken uttrykkes i forretningslogikken. Endringer som påvirker det delte skjemaet krever omfattende manuell innsats, nedetidUlemper:Tid (endringer krever tidkrevende synkron koordinering)Kost (endringer krever kostbar synkron koordinering)Kvalitet (oftest utført av utviklere med svakere kontekstforståelse enn domeneeksperter)
  13. Fødererte SQL-spørringer over distribuerte relasjonsbaserTilnærming: Ett felles, &quot;virtuelt&quot; (&quot;mediert&quot;) skjema, reformulerer til spørringer over datakildeneStrukturell («syntaktisk»), skjemasentrisk integrasjon av data – dyrt ved endringer  (&quot;rippeleffekt&quot;), nye kilder (lineær kost, burde falle…?)Tette, strukturelle koplinger, avhengighet mellom produsent og konsumentUlemper og fordeler langt på vei samme som for delt relasjonsbase (over), men i tilleggOmfattende koordineringskostnader (endringer må gjøres synkront). Semantikken uttrykkes i forretningslogikken. Endringer som påvirker det delte skjemaet krever omfattende manuell innsats, nedetid
  14. Fødererte XQuery-spørringer over distribuerte kilder som kan generere XMLXML: Generisk enkodingStandard dokumenttyper gir (grovkornet) kontekst, OK for statiske, høyvolumstransaksjoner mellom kjente aktørerHva med referering til entiteter utenfor dokumentkonteksten (&quot;den virkelige verden&quot;)?Hva med mange-til-mange-relasjoner? (Navnerom og modularisering gir mer finkornet kontekst, hvor kanskje enkeltutsagn kan sies å være en logisk konklusjon?)Ulemper med XQuery og XML som basis for EII:Som for (fødererte) relasjonsbaser...!Ytelse og skalering. Tidlig eksempel: Kryssdatabase-join av to enorme tabeller, konv. til XML (3x større), så sende over nettet, XQuery-prosessorer ikke optimale… Bør minimere datatrafikk!
  15. …Men hva med Datavarehus, BI…?Fordel for datavarehus:Persistering å foretrekke framfor virtualisering når kildene av en eller annen grunn ikke er direkte tilgjengelig, eller når det er behov for å ta vare på historikkUlemper som delte relasjonsbaser, men i tillegg:Ekstra dyrt å sette opp, ekstra dyrt å forvalte
  16. …Men hva med søkemotorer…?Datamodellene er i praksis dokumenter med attributter («skjema»), samt én eller flere taksonomier – termsett som er ordnet hierarkisk – for å støttefasettert søkInformasjonsmodellene forvaltes i praksis under CWA (navn unikt identifiserende, representasjon innebærer eksistens -&gt; én kanonisk datamodell)Endringer i modellene enklere enn relasjonsbaser, men kan krevetidkrevendereindekseringOfte relativt begrensede spørrespråk, men stadig bedre…Stort potensiale – begrenses av proprietære datamodeller og spørrespråk, CWA – men lovende utvikling hos noen leverandører…
  17. …Hva med integrasjon – EAI,skreddersydd «punkt til punkt» og «hub and spoke»…?Integrasjon er &quot;rørleggervirksomhet&quot; - en nødvendig, men ikke tilstrekkelig forutsetning...Ofte skreddersydde adaptere (semantikken nedfelt i logikk som kun utviklere kan tolke) - dyrt å implementere, dyrt å vedlikeholde, svak forvaltningKodifiserer &quot;hvordan&quot;, ikke &quot;hvorfor&quot;...«…Med nok kode kan jeg integrere alt!» - men så endrer noe seg (Sisyfos…)Proprietære, leverandøravhengige løsninger
  18. I &quot;hub and spoke&quot; ble kanoniske datamodeller etterhvert vanlige - all mapping via denne -&gt; betydelig tap av betydning (semantikk), selv om man operererte med mer enn én modellhttp://enterpriseintegrationpatterns.com/CanonicalDataModel.html
  19. Integrasjon: SOA/ESB (evt. m/BPM)Videreutvikling av EAI - lover mer dynamisk &quot;røropplegg&quot;...Data er usynlige tupler i &quot;kjelleren&quot; - nye data isoleres i lageneWS kan gi løsere koplinger (dokumentbaserte/hendelsesbaserte meldinger), men dette hjelper ikke mottaker til å forstå - krever:skreddersømorganisatorisk enighet (endringer har lang tidskonstant), ellerstandarder (endringer har veldig lang tidskonstant...)Avansert SOA benytter CIM og &quot;kanonisk skjema» – fortsatt CWA
  20. Er vi dømt til «gummisålenettverk&quot; og manuell informasjonsintegrasjon (aka &quot;dreiestolintegrasjon&quot;) for å besvare vilkårlige spørringer over heterogene kilder? :-) Fordeler:&quot;Fuzzy logic&quot; :-)Kontekstforståelse (hvis utført av domeneeksperter)Ulemper:TidKostKvalitetFortsatt vanlig EII-metode for legacy-systemer uten egnede APIer og med logikk og datadefinisjoner som få i organisasjonen forstår...
  21. Eksponensiell vekst av mengden informasjon – både strukturert og ustrukturert.Økt konkurranse krever raske omstillinger, sammenslåinger og muligheten til å inngå i nye konstellasjoner med andre virksomheterDe ansattes forventninger til sømløs deling og sammenstilling økerKravene til virksomhetens juridiske etterrettelighet økerEII lover et kjapt og fleksibelt tjenestelag som i tilnærmet sann tid kan besvare vilkårlige spørringer over heterogene kilder, strukturert eller ustrukturert, distribuert over hele selskapet. Kan bygge tjenester over denne, og realisere «Sømløs virksomhet»…  
  22. Min påstand er altså at systemer basert på CWA er fornuftig og riktig for komplette domener, men ineffektivt implementasjons- og forvaltningsmessigfor EIIKonsekvensene er unødig høye kostnader ved endring eller samhandling med andrefortsatt lav datakvalitet,fragmentert og forsinket operasjonell styringsinformasjon, ogtapte automatiseringsmuligheter…!Puh! Nok problemfokus… Etterpå skal vi vise hvorfor vi er så stolte av hva vi har fått til i Hafslund.  Følg med, følg med, …! 