SlideShare a Scribd company logo
1 of 16
Download to read offline
Data-driven jako
               nové paradigma
               31. 10. 2011, Josef Šlerka, Studia nových médií
               Precamp #2, Krásný ztráty, Praha




Wednesday, November 2, 11
Data jsou (velmi naivně)
               vyjádření skutečností formálním způsobem tak, aby je
               bylo možno přenášet nebo zpracovat (např. počítačem)
               číselné nebo jiné symbolicky vyjádřené (reprezentované)
               údaje a hodnoty nějakých entit nebo událostí
               jakékoliv fyzicky (materiálně) zaznamenané znalosti
               (vědomosti), poznatky, zkušenosti nebo výsledky
               pozorování procesů, projevů, činností a prvků reálného
               světa (reality)
               surovina, z níž se tvoří informace
               Wikipedia
Wednesday, November 2, 11
Čtyři paradigmata vědy

               1. empirický - založeno na pozorování přírody
               2. teoretický - vytváří modely, generalizuje
               3. komputační - simulace komplexních systémů
               4. datový - založený na analýze data




Wednesday, November 2, 11
Paradigma


               Paradigma (je) souhrn základních domněnek,
               předpokladů, představ dané skupiny vědců. Ke
               každému paradigmatu patří i metodická pravidla
               řešení, intuitivní postoje a hodnocení problémů.
               Proměna vědeckého paradigmatu se děje zvraty (tzv.
               vědeckými revolucemi). (Wikipedia)




Wednesday, November 2, 11
Společenské paradigma


               An information society is a society in which the
               creation, distribution, diffusion, use, integration and
               manipulation of information is a significant economic,
               political, and cultural activity. (Wikipedia)




Wednesday, November 2, 11
Data divide: nové bojiště


               1. Digital Divide
               2. Mobile Divide
               3. Data Divide




Wednesday, November 2, 11
Pozor na “čistá” data




Wednesday, November 2, 11
BTW: Open Data
               jsou politická otázka!
               nikoli technická!




Wednesday, November 2, 11
Sexy job?


               “I keep saying that the sexy job in the next 10 years
               will be statisticians...”
               Hal Varian, chief economist at Google.




Wednesday, November 2, 11
Data science je lepší




Wednesday, November 2, 11
Stupně práce s daty

               1. Obtain: pointing and clicking does not scale.
               2. Scrub: the world is a messy place
                                            Text
               3. Explore: You can see a lot by looking
               4. Models: always bad, sometimes ugly
               5. iNterpret: “The purpose of computing is insight, not
               numbers.”

              http://www.dataists.com/2010/09/a-taxonomy-of-data-science/


Wednesday, November 2, 11
Demokratizace dat
               NoSQL databáze (CouchDB, Redis, Big Table)
               Storage (S3, HDFS)
               Servery (EC2, Google App Engine)
               Processing / Čištění (Elastic Search, R, Google
               Refine)
               NLP / Machine Learning (NLP Toolkit, Open Calais)
               Vizualizace (Gephi, Protovis, Processing)


Wednesday, November 2, 11
Pro nás ostatní
               Google Fusion Tables (http://www.google.com/
               fusiontables/Home/)
               Google Docs (docs.google.com)
               Google Refine (http://code.google.com/p/google-
               refine/)
               Yahoo Pipes (http://pipes.yahoo.com/)
               Many Eyes (http://www-958.ibm.com/software/data/
               cognos/manyeyes/)


Wednesday, November 2, 11
Naše problémy

               nevůle lidí data vůbec dávat, strach z kontroly
               ne-demokratičnost
               málo dat v strojově čitelném formátu
               minumum českých aplikací s API
               absence českých NLP nástrojů




Wednesday, November 2, 11
Ale na časy se blýská...


               http://www.rozpocetverejne.cz/
               http://zindex.cz/
               http://opendata.cz/




Wednesday, November 2, 11
Čas na diskusi...


               email: josef.slerka@gmail.com
               twitter: http://twitter.com/josefslerka




Wednesday, November 2, 11

More Related Content

More from Josef Šlerka

Znaky, znaky, modely
Znaky, znaky, modelyZnaky, znaky, modely
Znaky, znaky, modelyJosef Šlerka
 
LLM a mixed methods v humanitních vědách
LLM a mixed methods v humanitních vědáchLLM a mixed methods v humanitních vědách
LLM a mixed methods v humanitních vědáchJosef Šlerka
 
Vliv AI na mediální trh
Vliv AI na mediální trhVliv AI na mediální trh
Vliv AI na mediální trhJosef Šlerka
 
Informační věda - Pravděpodobnosti
Informační věda - PravděpodobnostiInformační věda - Pravděpodobnosti
Informační věda - PravděpodobnostiJosef Šlerka
 
Informacni veda: Pocitace
Informacni veda: PocitaceInformacni veda: Pocitace
Informacni veda: PocitaceJosef Šlerka
 
Inforamační věda: Algoritmus
Inforamační věda: AlgoritmusInforamační věda: Algoritmus
Inforamační věda: AlgoritmusJosef Šlerka
 
Co je to datova novinarina
Co je to datova novinarinaCo je to datova novinarina
Co je to datova novinarinaJosef Šlerka
 
Algoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvodAlgoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvodJosef Šlerka
 
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...Josef Šlerka
 
Dezinformační weby a zpravodajství v ČR
Dezinformační weby a zpravodajství v ČRDezinformační weby a zpravodajství v ČR
Dezinformační weby a zpravodajství v ČRJosef Šlerka
 
INFOWAR IN CZECH REPUBLIC
INFOWAR IN CZECH REPUBLICINFOWAR IN CZECH REPUBLIC
INFOWAR IN CZECH REPUBLICJosef Šlerka
 
Česká média dnes aneb Pokus o kontext k aktuální debatě
Česká média dnes aneb Pokus o kontext k aktuální debatěČeská média dnes aneb Pokus o kontext k aktuální debatě
Česká média dnes aneb Pokus o kontext k aktuální debatěJosef Šlerka
 
Svět viděný cizíma očima
Svět viděný cizíma očimaSvět viděný cizíma očima
Svět viděný cizíma očimaJosef Šlerka
 
Do Birds of a Feather Flock Together?
Do Birds of a Feather Flock Together?Do Birds of a Feather Flock Together?
Do Birds of a Feather Flock Together?Josef Šlerka
 
Projekt Navigátor - datová část
Projekt Navigátor - datová částProjekt Navigátor - datová část
Projekt Navigátor - datová částJosef Šlerka
 
Stručná zpráva o jednom experimentu
Stručná zpráva o jednom experimentuStručná zpráva o jednom experimentu
Stručná zpráva o jednom experimentuJosef Šlerka
 
Wikipedie ve službách zla?!
Wikipedie ve službách zla?!Wikipedie ve službách zla?!
Wikipedie ve službách zla?!Josef Šlerka
 

More from Josef Šlerka (20)

Znaky, znaky, modely
Znaky, znaky, modelyZnaky, znaky, modely
Znaky, znaky, modely
 
LLM a mixed methods v humanitních vědách
LLM a mixed methods v humanitních vědáchLLM a mixed methods v humanitních vědách
LLM a mixed methods v humanitních vědách
 
Vliv AI na mediální trh
Vliv AI na mediální trhVliv AI na mediální trh
Vliv AI na mediální trh
 
Informační věda - Pravděpodobnosti
Informační věda - PravděpodobnostiInformační věda - Pravděpodobnosti
Informační věda - Pravděpodobnosti
 
Informacni veda: Pocitace
Informacni veda: PocitaceInformacni veda: Pocitace
Informacni veda: Pocitace
 
Inforamační věda: Algoritmus
Inforamační věda: AlgoritmusInforamační věda: Algoritmus
Inforamační věda: Algoritmus
 
Co je to datova novinarina
Co je to datova novinarinaCo je to datova novinarina
Co je to datova novinarina
 
Algoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvodAlgoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvod
 
Atlas konspirací
Atlas konspiracíAtlas konspirací
Atlas konspirací
 
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
 
Dezinformační weby a zpravodajství v ČR
Dezinformační weby a zpravodajství v ČRDezinformační weby a zpravodajství v ČR
Dezinformační weby a zpravodajství v ČR
 
INFOWAR IN CZECH REPUBLIC
INFOWAR IN CZECH REPUBLICINFOWAR IN CZECH REPUBLIC
INFOWAR IN CZECH REPUBLIC
 
Česká média dnes aneb Pokus o kontext k aktuální debatě
Česká média dnes aneb Pokus o kontext k aktuální debatěČeská média dnes aneb Pokus o kontext k aktuální debatě
Česká média dnes aneb Pokus o kontext k aktuální debatě
 
Svět viděný cizíma očima
Svět viděný cizíma očimaSvět viděný cizíma očima
Svět viděný cizíma očima
 
Do Birds of a Feather Flock Together?
Do Birds of a Feather Flock Together?Do Birds of a Feather Flock Together?
Do Birds of a Feather Flock Together?
 
Projekt Navigátor - datová část
Projekt Navigátor - datová částProjekt Navigátor - datová část
Projekt Navigátor - datová část
 
AI a žurnalistika
AI a žurnalistikaAI a žurnalistika
AI a žurnalistika
 
Stručná zpráva o jednom experimentu
Stručná zpráva o jednom experimentuStručná zpráva o jednom experimentu
Stručná zpráva o jednom experimentu
 
Volba a metoda
Volba a metodaVolba a metoda
Volba a metoda
 
Wikipedie ve službách zla?!
Wikipedie ve službách zla?!Wikipedie ve službách zla?!
Wikipedie ve službách zla?!
 

Recently uploaded

Martina Košanová: Komunikace s problémovými uživateli knihoven
Martina Košanová: Komunikace s problémovými uživateli knihovenMartina Košanová: Komunikace s problémovými uživateli knihoven
Martina Košanová: Komunikace s problémovými uživateli knihovenÚISK FF UK
 
Project Restart 2024: Karel Smutný - Specializace patří do 19. století
Project Restart 2024: Karel Smutný - Specializace patří do 19. stoletíProject Restart 2024: Karel Smutný - Specializace patří do 19. století
Project Restart 2024: Karel Smutný - Specializace patří do 19. stoletíTaste
 
Project Restart 2024: Hana Březinová - Psychologické tipy pro práci s lidmi n...
Project Restart 2024: Hana Březinová - Psychologické tipy pro práci s lidmi n...Project Restart 2024: Hana Březinová - Psychologické tipy pro práci s lidmi n...
Project Restart 2024: Hana Březinová - Psychologické tipy pro práci s lidmi n...Taste
 
Project Restart 2024: Lenka Auerová - Budování holistické organizace
Project Restart 2024: Lenka Auerová - Budování holistické organizaceProject Restart 2024: Lenka Auerová - Budování holistické organizace
Project Restart 2024: Lenka Auerová - Budování holistické organizaceTaste
 
Project Restart 2024: Martin Vasquez - Inteligence je schopnost reagovat na z...
Project Restart 2024: Martin Vasquez - Inteligence je schopnost reagovat na z...Project Restart 2024: Martin Vasquez - Inteligence je schopnost reagovat na z...
Project Restart 2024: Martin Vasquez - Inteligence je schopnost reagovat na z...Taste
 
Project Restart 2024: Pavel Minář - Procesy pro lepší projekty
Project Restart 2024: Pavel Minář - Procesy pro lepší projektyProject Restart 2024: Pavel Minář - Procesy pro lepší projekty
Project Restart 2024: Pavel Minář - Procesy pro lepší projektyTaste
 
Project Restart 2024: Jan Řezáč - Nahradí AI projektové manažery?
Project Restart 2024: Jan Řezáč - Nahradí AI projektové manažery?Project Restart 2024: Jan Řezáč - Nahradí AI projektové manažery?
Project Restart 2024: Jan Řezáč - Nahradí AI projektové manažery?Taste
 
Project Restart 2024: Jiří Langr - Mytologie projektů
Project Restart 2024: Jiří Langr - Mytologie projektůProject Restart 2024: Jiří Langr - Mytologie projektů
Project Restart 2024: Jiří Langr - Mytologie projektůTaste
 

Recently uploaded (8)

Martina Košanová: Komunikace s problémovými uživateli knihoven
Martina Košanová: Komunikace s problémovými uživateli knihovenMartina Košanová: Komunikace s problémovými uživateli knihoven
Martina Košanová: Komunikace s problémovými uživateli knihoven
 
Project Restart 2024: Karel Smutný - Specializace patří do 19. století
Project Restart 2024: Karel Smutný - Specializace patří do 19. stoletíProject Restart 2024: Karel Smutný - Specializace patří do 19. století
Project Restart 2024: Karel Smutný - Specializace patří do 19. století
 
Project Restart 2024: Hana Březinová - Psychologické tipy pro práci s lidmi n...
Project Restart 2024: Hana Březinová - Psychologické tipy pro práci s lidmi n...Project Restart 2024: Hana Březinová - Psychologické tipy pro práci s lidmi n...
Project Restart 2024: Hana Březinová - Psychologické tipy pro práci s lidmi n...
 
Project Restart 2024: Lenka Auerová - Budování holistické organizace
Project Restart 2024: Lenka Auerová - Budování holistické organizaceProject Restart 2024: Lenka Auerová - Budování holistické organizace
Project Restart 2024: Lenka Auerová - Budování holistické organizace
 
Project Restart 2024: Martin Vasquez - Inteligence je schopnost reagovat na z...
Project Restart 2024: Martin Vasquez - Inteligence je schopnost reagovat na z...Project Restart 2024: Martin Vasquez - Inteligence je schopnost reagovat na z...
Project Restart 2024: Martin Vasquez - Inteligence je schopnost reagovat na z...
 
Project Restart 2024: Pavel Minář - Procesy pro lepší projekty
Project Restart 2024: Pavel Minář - Procesy pro lepší projektyProject Restart 2024: Pavel Minář - Procesy pro lepší projekty
Project Restart 2024: Pavel Minář - Procesy pro lepší projekty
 
Project Restart 2024: Jan Řezáč - Nahradí AI projektové manažery?
Project Restart 2024: Jan Řezáč - Nahradí AI projektové manažery?Project Restart 2024: Jan Řezáč - Nahradí AI projektové manažery?
Project Restart 2024: Jan Řezáč - Nahradí AI projektové manažery?
 
Project Restart 2024: Jiří Langr - Mytologie projektů
Project Restart 2024: Jiří Langr - Mytologie projektůProject Restart 2024: Jiří Langr - Mytologie projektů
Project Restart 2024: Jiří Langr - Mytologie projektů
 

Data-driven jako nové paradigma

  • 1. Data-driven jako nové paradigma 31. 10. 2011, Josef Šlerka, Studia nových médií Precamp #2, Krásný ztráty, Praha Wednesday, November 2, 11
  • 2. Data jsou (velmi naivně) vyjádření skutečností formálním způsobem tak, aby je bylo možno přenášet nebo zpracovat (např. počítačem) číselné nebo jiné symbolicky vyjádřené (reprezentované) údaje a hodnoty nějakých entit nebo událostí jakékoliv fyzicky (materiálně) zaznamenané znalosti (vědomosti), poznatky, zkušenosti nebo výsledky pozorování procesů, projevů, činností a prvků reálného světa (reality) surovina, z níž se tvoří informace Wikipedia Wednesday, November 2, 11
  • 3. Čtyři paradigmata vědy 1. empirický - založeno na pozorování přírody 2. teoretický - vytváří modely, generalizuje 3. komputační - simulace komplexních systémů 4. datový - založený na analýze data Wednesday, November 2, 11
  • 4. Paradigma Paradigma (je) souhrn základních domněnek, předpokladů, představ dané skupiny vědců. Ke každému paradigmatu patří i metodická pravidla řešení, intuitivní postoje a hodnocení problémů. Proměna vědeckého paradigmatu se děje zvraty (tzv. vědeckými revolucemi). (Wikipedia) Wednesday, November 2, 11
  • 5. Společenské paradigma An information society is a society in which the creation, distribution, diffusion, use, integration and manipulation of information is a significant economic, political, and cultural activity. (Wikipedia) Wednesday, November 2, 11
  • 6. Data divide: nové bojiště 1. Digital Divide 2. Mobile Divide 3. Data Divide Wednesday, November 2, 11
  • 7. Pozor na “čistá” data Wednesday, November 2, 11
  • 8. BTW: Open Data jsou politická otázka! nikoli technická! Wednesday, November 2, 11
  • 9. Sexy job? “I keep saying that the sexy job in the next 10 years will be statisticians...” Hal Varian, chief economist at Google. Wednesday, November 2, 11
  • 10. Data science je lepší Wednesday, November 2, 11
  • 11. Stupně práce s daty 1. Obtain: pointing and clicking does not scale. 2. Scrub: the world is a messy place Text 3. Explore: You can see a lot by looking 4. Models: always bad, sometimes ugly 5. iNterpret: “The purpose of computing is insight, not numbers.” http://www.dataists.com/2010/09/a-taxonomy-of-data-science/ Wednesday, November 2, 11
  • 12. Demokratizace dat NoSQL databáze (CouchDB, Redis, Big Table) Storage (S3, HDFS) Servery (EC2, Google App Engine) Processing / Čištění (Elastic Search, R, Google Refine) NLP / Machine Learning (NLP Toolkit, Open Calais) Vizualizace (Gephi, Protovis, Processing) Wednesday, November 2, 11
  • 13. Pro nás ostatní Google Fusion Tables (http://www.google.com/ fusiontables/Home/) Google Docs (docs.google.com) Google Refine (http://code.google.com/p/google- refine/) Yahoo Pipes (http://pipes.yahoo.com/) Many Eyes (http://www-958.ibm.com/software/data/ cognos/manyeyes/) Wednesday, November 2, 11
  • 14. Naše problémy nevůle lidí data vůbec dávat, strach z kontroly ne-demokratičnost málo dat v strojově čitelném formátu minumum českých aplikací s API absence českých NLP nástrojů Wednesday, November 2, 11
  • 15. Ale na časy se blýská... http://www.rozpocetverejne.cz/ http://zindex.cz/ http://opendata.cz/ Wednesday, November 2, 11
  • 16. Čas na diskusi... email: josef.slerka@gmail.com twitter: http://twitter.com/josefslerka Wednesday, November 2, 11

Editor's Notes

  1. \n
  2. \n
  3. \n
  4. \n
  5. \n
  6. \n
  7. \n
  8. \n
  9. \n
  10. \n
  11. \n
  12. \n
  13. \n
  14. \n
  15. \n
  16. \n