Data trends
Open,linked,big & portable
22 februari 2013

Studiedag open data en de cloud
een revolutie in de informatiehuishouding van de overheid

Het Pand, Gent
                                                            Rosemie Callewaert
                                                                iStoire Services
                                                                                   1	
  
Hallo,
Ik werk als onafhankelijk informatie architect voor een aantal grote web- en
IT projecten




Ik ben geboeid door nieuwe vormen van lezen en schrijven. Daarvan breng
ik, samen met anderen, verslag op istoire.be




                                                                         2	
  
Doel van de volgende
30 minuten
1.  Bijbrengen wat het verschil is tussen
   Open data
   Linked data
   Big data



2.  Duidelijk maken waarom je aandacht moet hebben voor
   Data portability



3.  Doen nadenken over
   Mogelijke toepassingen met eigen datasets

                                                          3	
  
En toen was alles…




 ©	
  freehand518	
     4	
  
data warehousing
                                     data driven
         metadata
                           data scientists

data analytics                       data design
                   open                      big data
linked data
                   data                 microdata

 data mining                                 personal big data
                 data as a service
  data driven                           data visualization
                     data portability
                                                                 5
Waarvoor staat open data?
Open data is the idea that certain data should be
freely available to everyone to use and republish as
they wish, without restrictions from copyright, patents
or other mechanisms of control.
While not identical, open data has a similar ethos to
those of other “Open” movements such as open
source, open content, and open access.
The term “open data” itself is recent, gaining
                                                                 besch ikbaar
popularity with the rise of the Internet and World        Vrij
Wide Web and, especially, with the launch of open-
data government initiatives such Data.gov                  Voor iedereen
                                                                           s
                                                                    i ctie
                                                               estr
                                                     Zon der r
                                                                            6	
  
8 open data principes
voor de overheid
Open data werkgroep (2007)
•    30 internationale experts
•    gecoördineerd door Tim O'Reilly




                                       h2p://www.opengovdata.org/home/8principles	
  



                                                                                    7	
  
Waarom zou je data openstellen?

•  Om data los van een systeem te kunnen gebruiken
   –  Nieuwe inzichten
   –  Nieuwe interfaces           Open data
   –  Nieuwe vormen van gebruik

•  Om data te kunnen combineren met andere data
   –  Nieuwe inzichten
                                             a
   –  Nieuwe interfaces
                                  Linked dat
   –  Nieuwe vormen van gebruik


                                                     8	
  
Wat zijn de voordelen als anderen met ‘jouw data’
aan de slag gaan?


•    Er kunnen toepassingen, websites of apps ontwikkeld worden die de
     organisatiegrenzen en -mogelijkheden overstijgen


•    Vanuit het perspectief van een eindgebruiker is de grens van een organisatie niet
     altijd relevant
      –  ik zoek het dichtstbijzijnde zwembad dat nu open is
      –  ik zoek een ondergrondse parking in de buurt waar ik nu ben en waar plaats vrij is


•    Mensen van buiten de organisatie bekijken je data anders en kunnen met
     vernieuwende concepten komen waar je als organisatie niet aan gedacht had




                                                                                              9	
  
10	
  
©	
  vrijedata.nl	
  
11	
  
©	
  vrijedata.nl	
  
Hackersmeetings
open data + developers =
nieuwe producten




 ©	
  johncb1973	
         12	
  
https://www.rijksmuseum.nl/nl/api   13	
  
http://doekvoorinjehoek.nl/   14	
  
15	
  
http://developers.bol.com/api/finalisten-developer-contest-bekend/
                                                                     16	
  
17	
  
Waarvoor staat linked data?
In computing, linked data describes a method of
publishing structured data so that it can be
interlinked and become more useful.
It builds upon standard Web technologies such as
HTTP and URIs, but rather than using them to serve
web pages for human readers, it extends them to
share information in a way that can be read
automatically by computers.                                Gestructureerde data
This enables data from different sources to be
                                                                             eb
                                                                     p het w
connected and queried.
                                                                   o
Tim Berners-Lee, director of the World Wide Web
                                                       Pub liceren
Consortium, coined the term in a design note
discussing issues around the Semantic Web project.      Afgesproken
                                                                      formaat
However, the idea is very old and is closely related
to concepts including database network models,
citations between scholarly articles, and controlled
headings in library catalogs”
                                                                                18	
  
5 stars of open linked data
The Semantic Web isn't just about putting data
on the web.

It is about making links, so that a person or
machine can explore the web of data.

With linked data, when you have some of it, you
can find other, related, data

Tim Berners-Lee, 2006




                                                  19	
  
The web, one huge database
open data + open data =
nieuwe producten
                          ©	
  Living	
  with	
  punks	
  
                                            20	
  
http://linkeddata.org
                        21	
  
22	
  
Waarvoor staat big data?
In information technology, big data is a
collection of data sets so large and complex
that it becomes difficult to process using on-
hand database management tools or
traditional data processing applications. The
challenges include capture, curation, storage,
search, sharing, analysis, and visualization.

                                                 Collecties van
The trend to larger data sets is due to the
                                                 Grote en complexe datasets
additional information derivable from analysis
of a single large set of related data, as
compared to separate smaller sets with the       Analyseren en visualiseren
same total amount of data, allowing                  Met big-data tools
correlations to be found to "spot business
trends, determine quality of research, prevent                     an
                                                       Ontdekken v
diseases, link legal citations, combat crime,                        banden
                                                   Inzic hten en ver
and determine real-time roadway traffic
conditions.
                                                                          23	
  
Waarom inzetten op big data?

•  Trends detecteren
•  Inzichten verwerven
•  Onderzoek doen
•  Voorspellingen maken
•  Actie ondernemen op basis van inzichten




                                             24	
  
Datasets bestuderen
data + nieuwe visualisaties =
nieuwe inzichten
                                ©	
  medcure.org	
  
                                          25	
  
Van logfiles naar dashboards




                              26	
  
Van logfiles naar verkoopsinterfaces

1.  Wat heb ik recent bekeken op Amazon.com?
2.  Wat kopen mensen die ook de boeken uit mijn Amazon-
   historiek kochten?




                                                      27	
  
Van personal big data naar health apps

•    Logging daily activities into health apps
•    Visualize, track, monitor your progress based
     on your own goals




Visualisering van harde feiten als motivatie
en aanzet tot gedragswijziging




                                                     28	
  
Van big data naar smart cities




                                 29	
  
30	
  
It is also staggering how much data towns and cities generate. At a rough
estimate, we will generate 4.1 terabytes per day per square kilometer of
urbanized land area by 2016.

In fact, you could say that cities are the true big data systems of our age.
From geolocation data collected by smart phones to data generated by cars
and their GPS instruments, from the contact sensor payment cards we use
to ride the subway to the data we offer when we want to make use of a bike
or a car in the city.                                                          31	
  
Voldoende stof om na te denken
over toepassingen voor jouw
organisatie?
… vergeet dan deze voorwaarden niet




                                      32	
  
Data doesn’t
distribute itself
                33	
  
Make your data portable




 Organizations and people should “own” their data and be
 able to easily export/remove it from one application or
 service and import it into another
                                                           34	
  

Data trends

  • 1.
    Data trends Open,linked,big &portable 22 februari 2013 Studiedag open data en de cloud een revolutie in de informatiehuishouding van de overheid Het Pand, Gent Rosemie Callewaert iStoire Services 1  
  • 2.
    Hallo, Ik werk alsonafhankelijk informatie architect voor een aantal grote web- en IT projecten Ik ben geboeid door nieuwe vormen van lezen en schrijven. Daarvan breng ik, samen met anderen, verslag op istoire.be 2  
  • 3.
    Doel van devolgende 30 minuten 1.  Bijbrengen wat het verschil is tussen Open data Linked data Big data 2.  Duidelijk maken waarom je aandacht moet hebben voor Data portability 3.  Doen nadenken over Mogelijke toepassingen met eigen datasets 3  
  • 4.
    En toen wasalles… ©  freehand518   4  
  • 5.
    data warehousing data driven metadata data scientists data analytics data design open big data linked data data microdata data mining personal big data data as a service data driven data visualization data portability 5
  • 6.
    Waarvoor staat opendata? Open data is the idea that certain data should be freely available to everyone to use and republish as they wish, without restrictions from copyright, patents or other mechanisms of control. While not identical, open data has a similar ethos to those of other “Open” movements such as open source, open content, and open access. The term “open data” itself is recent, gaining besch ikbaar popularity with the rise of the Internet and World Vrij Wide Web and, especially, with the launch of open- data government initiatives such Data.gov Voor iedereen s i ctie estr Zon der r 6  
  • 7.
    8 open dataprincipes voor de overheid Open data werkgroep (2007) •  30 internationale experts •  gecoördineerd door Tim O'Reilly h2p://www.opengovdata.org/home/8principles   7  
  • 8.
    Waarom zou jedata openstellen? •  Om data los van een systeem te kunnen gebruiken –  Nieuwe inzichten –  Nieuwe interfaces Open data –  Nieuwe vormen van gebruik •  Om data te kunnen combineren met andere data –  Nieuwe inzichten a –  Nieuwe interfaces Linked dat –  Nieuwe vormen van gebruik 8  
  • 9.
    Wat zijn devoordelen als anderen met ‘jouw data’ aan de slag gaan? •  Er kunnen toepassingen, websites of apps ontwikkeld worden die de organisatiegrenzen en -mogelijkheden overstijgen •  Vanuit het perspectief van een eindgebruiker is de grens van een organisatie niet altijd relevant –  ik zoek het dichtstbijzijnde zwembad dat nu open is –  ik zoek een ondergrondse parking in de buurt waar ik nu ben en waar plaats vrij is •  Mensen van buiten de organisatie bekijken je data anders en kunnen met vernieuwende concepten komen waar je als organisatie niet aan gedacht had 9  
  • 10.
  • 11.
  • 12.
    Hackersmeetings open data +developers = nieuwe producten ©  johncb1973   12  
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
    Waarvoor staat linkeddata? In computing, linked data describes a method of publishing structured data so that it can be interlinked and become more useful. It builds upon standard Web technologies such as HTTP and URIs, but rather than using them to serve web pages for human readers, it extends them to share information in a way that can be read automatically by computers. Gestructureerde data This enables data from different sources to be eb p het w connected and queried. o Tim Berners-Lee, director of the World Wide Web Pub liceren Consortium, coined the term in a design note discussing issues around the Semantic Web project. Afgesproken formaat However, the idea is very old and is closely related to concepts including database network models, citations between scholarly articles, and controlled headings in library catalogs” 18  
  • 19.
    5 stars ofopen linked data The Semantic Web isn't just about putting data on the web. It is about making links, so that a person or machine can explore the web of data. With linked data, when you have some of it, you can find other, related, data Tim Berners-Lee, 2006 19  
  • 20.
    The web, onehuge database open data + open data = nieuwe producten ©  Living  with  punks   20  
  • 21.
  • 22.
  • 23.
    Waarvoor staat bigdata? In information technology, big data is a collection of data sets so large and complex that it becomes difficult to process using on- hand database management tools or traditional data processing applications. The challenges include capture, curation, storage, search, sharing, analysis, and visualization. Collecties van The trend to larger data sets is due to the Grote en complexe datasets additional information derivable from analysis of a single large set of related data, as compared to separate smaller sets with the Analyseren en visualiseren same total amount of data, allowing Met big-data tools correlations to be found to "spot business trends, determine quality of research, prevent an Ontdekken v diseases, link legal citations, combat crime, banden Inzic hten en ver and determine real-time roadway traffic conditions. 23  
  • 24.
    Waarom inzetten opbig data? •  Trends detecteren •  Inzichten verwerven •  Onderzoek doen •  Voorspellingen maken •  Actie ondernemen op basis van inzichten 24  
  • 25.
    Datasets bestuderen data +nieuwe visualisaties = nieuwe inzichten ©  medcure.org   25  
  • 26.
    Van logfiles naardashboards 26  
  • 27.
    Van logfiles naarverkoopsinterfaces 1.  Wat heb ik recent bekeken op Amazon.com? 2.  Wat kopen mensen die ook de boeken uit mijn Amazon- historiek kochten? 27  
  • 28.
    Van personal bigdata naar health apps •  Logging daily activities into health apps •  Visualize, track, monitor your progress based on your own goals Visualisering van harde feiten als motivatie en aanzet tot gedragswijziging 28  
  • 29.
    Van big datanaar smart cities 29  
  • 30.
  • 31.
    It is alsostaggering how much data towns and cities generate. At a rough estimate, we will generate 4.1 terabytes per day per square kilometer of urbanized land area by 2016. In fact, you could say that cities are the true big data systems of our age. From geolocation data collected by smart phones to data generated by cars and their GPS instruments, from the contact sensor payment cards we use to ride the subway to the data we offer when we want to make use of a bike or a car in the city. 31  
  • 32.
    Voldoende stof omna te denken over toepassingen voor jouw organisatie? … vergeet dan deze voorwaarden niet 32  
  • 33.
  • 34.
    Make your dataportable Organizations and people should “own” their data and be able to easily export/remove it from one application or service and import it into another 34