Digital humanities a změna paradigmatu

1,921
-1

Published on

Olomouc, 17. 4. 2012

Published in: Education

Digital humanities a změna paradigmatu

  1. 1. Digital humanities azměna paradigmatuJosef Šlerka, SNM FF UK, Ataxo InteractiveOlomouc, 17. 4. 2012
  2. 2. OverturaNormalized Compression Distance
  3. 3. NCDfunction ncd ($x, $y) { $cx = strlen(gzcompress($x)); $cy = strlen(gzcompress($y)); return (strlen(gzcompress($x . $y)) -min($cx, $cy)) / max($cx, $cy);}
  4. 4. ParadigmaParadigma (je) souhrn základních domněnek,předpokladů, představ dané skupiny vědců.Ke každému paradigmatu patří i metodickápravidla řešení, intuitivní postoje a hodnoceníproblémů. Proměna vědeckého paradigmatuse děje zvraty (tzv. vědeckými revolucemi).(Wikipedia)
  5. 5. Čtyři paradigmataempirický - založený na pozorování přírodyteoretický - vytváří modely, generalizujekomputační - simulace komplexních systémůdatový - založený na analýze dat
  6. 6. Data: naivně viděnovyjádření skutečností formálním způsobem tak, aby jebylo možno přenášet nebo zpracovat (např. počítačem)číselné nebo jiné symbolicky vyjádřené (reprezentované)údaje a hodnoty nějakých entit nebo událostíjakékoliv fyzicky (materiálně) zaznamenané znalosti(vědomosti), poznatky, zkušenosti nebo výsledkypozorování procesů, projevů, činností a prvků reálnéhosvěta (reality)Wikipedia
  7. 7. Změna paradigmatudata-driven vs. knowledge-drivekomputační metody vs. modelovánískutečnostiPeter Norvig vs Noam Chomsky
  8. 8. Digital Humanities The digital humanities is an area of study,research, teaching, and invention concernedwith the intersection of computing and thedisciplines of the humanities. Sometimescalled humanities computing, the field hasfocused on the digitization and analysis ofmaterials related to the traditional disciplinesof the humanities.
  9. 9. Digital Humanities první vlna: nástup korpusů, sofistikovanéprohledávání etc.druhá vlna: experimentovánítřetí vlna: “computational turn”
  10. 10. Zdroje datAnalogový (v počátcích, ale pro uni důležitý)Digitální (velmi, velmi pokročilý díky internetu)
  11. 11. Analogový světnutné transformovatpředstavitelnější pro běžné akademikyve světě již hutně zastoupenýu nás pořád bídazajímavé výsledky
  12. 12. Příkladydistant readingcultural analysissocial network analysis
  13. 13. Distant readingFranco Moretticlose reading vs distant readingliteraturu je třeba zkoumat jako živočišnédruhyodmítnutí close readingu jako sekularizovanépodoby čtení Bible
  14. 14. Analýza pohlaví
  15. 15. Cultural analysisLev Manovichanalýza a vizualizace velkých, převážněvizuálních korpusůhledání patternů
  16. 16. Impressionisté
  17. 17. SNA v politologiedata mining politických akcívzorové studie jsou z oblati společnýchhlasování
  18. 18. Pražský magistrátanalýza hlasování za tři volební obdobívazba existuje při 75% shodných hlasováníukazuje skutečné hlasovací jádroukazuje vazby napříč stranamiinspirace americkým experimentem
  19. 19. 1998 - 2002
  20. 20. 2002 - 2006
  21. 21. 2006 - 2010
  22. 22. Digitální světvešekerá produkce na internetuzáznamy z digitálních zařízenídemokratizace velkých datdemokratizace technologii
  23. 23. Co jsou to Big Data?Big Data is a term applied to data sets whosesize is beyond the ability of commonly usedsoftware tools to capture, manage, andprocess the data within a tolerable elapsedtime. Big data sizes are a constantly movingtarget currently ranging from a few dozenterabytes to many petabytes of data in asingle data set.
  24. 24. Co je Data Science?A data application acquires its value from thedata itself, and creates more data as a result.Its not just an application with data; its adata product. Data science enables thecreation of data products.
  25. 25. Sexy job?“Datový vědec je statistiky žijící v SanFranciscu...” (source: Twitter)“I keep saying that the sexy job in the next 10years will be statisticians...”Hal Varian, chief economist at Google.
  26. 26. Data Science
  27. 27. 3 000 000 000počet hledání na Googlu denně
  28. 28. 30 000 000 000počet zpráv a příspěvků na Facebooku měsíčně
  29. 29. 5 000 000 000mobilních telefonů po celém světě
  30. 30. 140 000 000průměrný počet zpráv poslaných denně na Twitteru
  31. 31. 1 000 000počet denně vygenerovných zpráv na českém Facebooku votevřených profilech
  32. 32. 600 dolarůcena disku na který se vejde veškerá hudba na světě v MP3
  33. 33. 100 dolarůcena hodiny provozu klastru 10 počítačů na Amazonu
  34. 34. 0 dolarůcena open-source softwarů, jako je Hadoop,Lucene,Cassandra, CouchDB, Elastich Search a dalších
  35. 35. Big Social Datadeep data vs. surface datadata-driven sociální a humanitní vědyLev Manovich: The Promises and theChallenges of Big Social Data
  36. 36. Big (Social) Datapřípadové studie
  37. 37. Search Engine Basednormalized Google distanceGoogle Insightsearch suggestion
  38. 38. Google distancepočítá se sémantická vzdálenostautory jsou Rudi Cilibrasi a Paul M. B.Vitanyipodobné věci sdílí stejné vlastnostidvě reprezentace jsou si tím podobnější, čímméně složitých změn je třeba k převodu jednév druhou
  39. 39. NGD je vyjádřená vzorcem:m = log10(počet všech indexovanýchstránek);fx = log10(počet výsledků pro slovo X);fy = log10(počet výsledků pro slovo X);fxy = log10(očet výsledků pro slovo X a Y);GND = ((max(fx,fy) - fxy) / (m - min(fx,fy))
  40. 40. http://www.mechanicalcinderella.com/
  41. 41. Dovolené podle jazyka
  42. 42. Search jako signálHyunyoung Choi, Hal Varia:Predicting the Present with Google Trends
  43. 43. Jak je to možné?Život je hledání... (taky)a dříve než se rozhodneme, hledáme...(taky)
  44. 44. Google Insightstatistiky vyhledávání na Googlevyužitelné pro predikci nezaměstnanostizajímavé výsledky pro vztahy slov
  45. 45. Google a zaměstnanost
  46. 46. Google Insight
  47. 47. Google suggestion
  48. 48. Google suggestion
  49. 49. Báječný svět APITwitterFacebookFoursquareOpenSubtitles
  50. 50. ... korupsy u nohouTwitterFacebookFoursquareOpenSubtitles
  51. 51. Wikipediavíce jak 500.000 kategoriívíce jak 5.500.000 entitpojmová síť
  52. 52. Sémantický analyzérText je systém, ve kterém jsou souvislosti mezivětami dány i tím, že pojmy, které se v textuvyskytují, náleží ke společnému tématu.Správné určení tématu (témat) textu jeshodné s nalezením nejvyššího společnéhoslovníku pro co největší část použitýchtermínů.
  53. 53. Ukázkový text...TEHRAN — Thirty-six years after construction began under the shah, Iran finallyopened its first nuclear power plant at a ceremony on Saturday.Attended by senior officials from Iran and Russia, the ceremony marked thebeginning of the transfer of low-enriched uranium fuel rods from a storage siteinto the plant.Officials of both countries said Saturday’s events signified the opening, not thestartup, of the plant near Bushehr, in southern Iran, as a working nuclear plant.“This is a special day for both Russian and Iranian specialists,” the chief ofRussia’s Rosatom state nuclear power company, Sergei Kiriyenko, said, shakinghands and smiling with his Iranian counterparts, in television reports broadcastin Russia, which helped build the station through years of concern by the Westthat Iran was using its civilian program to mask a plan to build a bomb....
  54. 54. Výsledek: kategorieEnergyNuclear technologyInternational relationsChemistryCountries
  55. 55. Výsledek: slovarussiairanuraniumnuclear powernuclear power plantfuel
  56. 56. Další studie...prediktivní analýza pomocí velkých dat v praxi
  57. 57. Twitter a burza
  58. 58. Mobily a cholera
  59. 59. Facebook a filmyzmínky o Inception na českém Facebooku 2010 a divácký ohlas
  60. 60. Facebook a filmy Harry Potter na českém Facebooku 2010 a divácký ohlas
  61. 61. Facebook a filmy Harry Potter na českém Facebooku 2010 a divácký ohlas
  62. 62. Indexy sociální akce Realita logy mobilů Instagram recenze 4SQ 4SQ check-inReakce Akce statusy na Twitteu FB komentáře FB statusy FB likes členství ve FB skupinách Virtualita
  63. 63. Co dál?Změnit imaginaci! A dát si pozor na intelektuální pasti.
  64. 64. Na co si dát pozor?The lure of objectivityThe power of visual evidenceBlack-boxingInstitutional perturbationsThe quest for universalism(Rieder, Rohle: Digital Methods)
  65. 65. Děkuji za pozornost!Čas na otázky, čas na odpovědi:-)mail: josef.slerka@gmail.comtwitter: twitter.com/josefslerka

×