NMI13 Josef Šlerka - Science is tango between data and theory.

344 views
262 views

Published on

Prezentace z druhého ročníku konference New Media Inspiration (http://nminspiration.cz), který se konal 19. 1. 2013 v hlavní budově FF UK pod vedením @petrkou, @simindr a @josefslerka.

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
344
On SlideShare
0
From Embeds
0
Number of Embeds
30
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

NMI13 Josef Šlerka - Science is tango between data and theory.

  1. 1. Science is tango betweendata and theory.James Kobielus, IBMs big data evangelist
  2. 2. Shall we danceJosef Šlerka, New Media Inspiration 2013Studia nových médií, Ataxo Interactive a.s.
  3. 3. Všechno co potřebujivědět o datech...... mne naučili filosofie
  4. 4. Myšlenky bez obsahu jsouprázdné, názory bez pojmůjsou slepé.Immanuel Kant, německý osvícenecký filosof
  5. 5. Obrazotvornost!
  6. 6. Žádný algoritmus z nebenespadl...staré programátorské přísloví
  7. 7. Sémiotická průpravaTypologie znaků a otázka sémiosisS čím si obrazotvornost hraje
  8. 8. A sign, or representamen, issomething which stands tosomebody for something insome respect or capacity.Charles Sanders Peirce, semiotik
  9. 9. Typologie znakůznak (sign), jeho Objekt a jeho interpretantsémiosis je činnost, která spojuje Z-O-Isémiosis je potencionálně nekonečnákomplexní systém znakůnejznámější ikon, index, symbol
  10. 10. Ikon a indexIkon je znak, který se vztahuje k Objektu a denotuje hojen díky svým vlastním rysům, které má bez ohledu nato, zda nějaký Objekt skutečně existuje anebo ne.Index je znak, který se vztahuje na Objekt a denotujeho tím, že je jím skutečně ovlivněný. Příkladem indexuje klepání na dveře.Ikony ani indexy však nic netvrdí, nýbrž ukazují.
  11. 11. SymbolSymbol je znak, který se vztahuje k Objektu adenotuje ho díky zákonu, většinou asociaci všeobecnéideje a tento zákon způsobuje interpretaci. Jinýmislovy znak tu nemá vztah ani podobnosti a ani faktickésouvislosti, ale jaké si značky pravidla, které námumožňuje spojení mezi jinak nespojitými věcmi.
  12. 12. Data jsou symbolická(konvenční) vyjádřeníindexů reality, už obsahujíurčitý pohled. Ale nicneříkají.
  13. 13. Nejsou data jako data.
  14. 14. Poslední filosofickálekce....
  15. 15. There are only two hardthings in ComputerScience: cache invalidationand naming thingsPhil Karlton, computer programmer
  16. 16. ... programátoři jsouvlastně filosofové
  17. 17. Facebook normalizeddistance ...... příběh jedné hypotézy a problémy, které jí provázejía provazely
  18. 18. Google distancepočítá se sémantická vzdálenostautory jsou Rudi Cilibrasi a Paul M. B. Vitanyipodobné věci sdílí stejné vlastnostitudíž se o nich mluví častěji dohromadydvě reprezentace jsou si tím podobnější, čím méněsložitých změn je třeba k převodu jedné v druhou
  19. 19. NGD je vyjádřená vzorcem:m = log10(počet všech indexovaných stránek);fx = log10(počet výsledků pro slovo X);fy = log10(počet výsledků pro slovo Y);fxy = log10(počet výsledků pro slovo X a Y);GND = ((max(fx,fy) - fxy) / (m - min(fx,fy))
  20. 20. http://www.mechanicalcinderella.com/
  21. 21. FNDFacebook normalized distance vychází z Googlenormalized distanceLidé komentují na stránkách kandidátů, vůči kterým sepředevším pozitivně, ale i negativně vymezují.Pohybují se v určitých myšlenkovinách rovinách čidiskursech
  22. 22. FND je vyjádřená vzorcem:m = log10(počet všech českých účtů);fx = log10(počet komentujících na stránce X);fy = log10(počet komentujících na stránce Y);fxy = log10(počet společných komentujících);FND = ((max(fx,fy) - fxy) / (m - min(fx,fy))
  23. 23. Aplikacebuď objevování příbuzných stránek a tématči k mapování vztahů mezi stránkami
  24. 24. VyhledáváníNajdi mi stránky, které mají blízko k mojí
  25. 25. VztahováníKde se nachází moje stránka mezi ostatními
  26. 26. Mediální mapa FBJaké typy stránek máme mezi FB stránkami serveru
  27. 27. Velká mapa stránekNeziskovky, strany, média....
  28. 28. Případová studiePrezidentské volby 2013
  29. 29. Mapa prezidentských kandidátů 14. 1. 2013
  30. 30. Mapa prezidentských kandidátů 14. 1. 2013
  31. 31. Validace?zatím nepříméanalýza chování fanoušků při přesunu mezi voliči strana kandidátů (bude o ní mluvit Kamil Gregor)analýza zájmů fanoušků (bude mluvit o ní JanSchmid)validace smysluplností
  32. 32. Hlavní úskalívelikosti korpus a průniku (vzorec funguje “vždy”)validaceúplnost korpusu při objevovánírelativní drahost
  33. 33. A ještě jedna ...Jak je to s fanoušky prezidentů teď...
  34. 34. Mapa prezidentských kandidátů 18. 1. 2013
  35. 35. Věda je tango mezi teorií adaty. To tango, které hraje jeale lidská představivost.Bez ní je věda nemožná.
  36. 36. Děkuji za pozornost!Otázky? Odpovědi?

×