Big Data

2,201 views

Published on

Slajdy z konference Business & Information Forum 2011: Starosti a radosti českých CIO

Published in: Education, Technology
0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
2,201
On SlideShare
0
From Embeds
0
Number of Embeds
8
Actions
Shares
0
Downloads
40
Comments
0
Likes
3
Embeds 0
No embeds

No notes for slide

Big Data

  1. 1. Big Data Josef Šlerka, Ataxo Interactive, SNM FF UK Business & Information Forum 2011, PrahaTuesday, June 7, 2011
  2. 2. 3 000 000 000 počet hledání na Googlu denněTuesday, June 7, 2011
  3. 3. 30 000 000 000 počet zpráv a příspěvků na Facebooku měsíčněTuesday, June 7, 2011
  4. 4. 5 000 000 000 mobilních telefonů po celém světěTuesday, June 7, 2011
  5. 5. 140 000 000 průměrný počet zpráv poslaných denně na TwitteruTuesday, June 7, 2011
  6. 6. 1 000 000 počet denně vygenerovných zpráv na českém Facebooku v otevřených profilechTuesday, June 7, 2011
  7. 7. 600 dolarů cena disku na který se vejde veškerá hudba na světě v MP3Tuesday, June 7, 2011
  8. 8. 100 dolarů cena hodiny provozu klastru 10 počítačů na AmazonuTuesday, June 7, 2011
  9. 9. 0 dolarů cena open-source softwarů, jako je Hadoop, Lucene,Cassandra, CouchDB, Elastich Search a dalšíchTuesday, June 7, 2011
  10. 10. Big (Data (Science)) buzzwords, které tu s námi dlouho zůstanouTuesday, June 7, 2011
  11. 11. Co jsou to Big Data? Big Data is a term applied to data sets whose size is beyond the ability of commonly used software tools to capture, manage, and process the data within a tolerable elapsed time. Big data sizes are a constantly moving target currently ranging from a few dozen terabytes to many petabytes of data in a single data set.Tuesday, June 7, 2011
  12. 12. Co je Data Science? A data application acquires its value from the data itself, and creates more data as a result. Its not just an application with data; its a data product. Data science enables the creation of data products.Tuesday, June 7, 2011
  13. 13. Příklady Jaccardův index a TOEFL Google Translate ZIP klastrováníTuesday, June 7, 2011
  14. 14. require zlib require pp   files = Dir[ARGV[0] + /*]   def deflate(*files) z = Zlib::Deflate.new z.deflate(files.collect {|f| open(f).read}.join("n"), Zlib::FINISH).size end   pairwise = files.combination(2).collect do |f1, f2| a, b = deflate(f1), deflate(f2) both = deflate(f1, f2)   {:files => [f1, f2], :score => (a+b)-both} end   pp pairwise.sort {|a,b| b[:score] <=> a[:score]}[0,20]Tuesday, June 7, 2011
  15. 15. Změna paradigmatu data-driven vs. knowledge-drive (algorithm-driven) statistické modely vs. modelování skutečnosti Peter Norvig vs Noam ChomskyTuesday, June 7, 2011
  16. 16. Potřebné dovednosti Drew ConwayTuesday, June 7, 2011
  17. 17. Big Social Data deep data vs. surface data data-driven sociální a humanitní vědy Lev Manovich: The Promises and the Challenges of Big Social DataTuesday, June 7, 2011
  18. 18. Případové studie prediktivní analýza pomocí velkých dat v praxiTuesday, June 7, 2011
  19. 19. Google a zaměstnanostTuesday, June 7, 2011
  20. 20. Twitter a burzaTuesday, June 7, 2011
  21. 21. Mobily a choleraTuesday, June 7, 2011
  22. 22. Facebook a filmy zmínky o Inception na českém Facebooku 2010 a divácký ohlasTuesday, June 7, 2011
  23. 23. Facebook a filmy Harry Potter na českém Facebooku 2010 a divácký ohlasTuesday, June 7, 2011
  24. 24. Problémy aneb co nás brzdí u nás (podle mých omezených zkušeností)Tuesday, June 7, 2011
  25. 25. Selhání vysokých škol Informatika - úzké obzory, staré názory, disky už jsou levné Java bývá dnes cesta pro lepší ukrajinské dělníkyTuesday, June 7, 2011
  26. 26. Potřeba přesahu Interdisciplinarita, spolupráce polytechnik a univerzit je to, co dnes zoufale chybí, bez ní jsme jen lepší montovna.Tuesday, June 7, 2011
  27. 27. Strach z experimentů Jsme příliš v zajetí sezónních prémií, placení za čas a strachu z IT bezpečnostní politiky. Neúspěch se neodpouští.Tuesday, June 7, 2011
  28. 28. Inovace chtějí volnost Grantové projekty z MPO a podobné ve skutečnosti brzdí inovace, protože se orientují na řešení průmyslových problémů. Neřešíme myšlení out of box.Tuesday, June 7, 2011
  29. 29. Co za to dostanete? podle analytiků McKinsey & Company a jejich BIG DATA: THE NEXT FRONTIER FOR INNOVATION,Tuesday, June 7, 2011
  30. 30. Včasný přehled Making big data more accessible in a timely manner.Tuesday, June 7, 2011
  31. 31. Budeme vědět s kým Segmenting populations to customize actions.Tuesday, June 7, 2011
  32. 32. Přesnější rozhodování Replacing and supporting human decision-making with automated algorithms.Tuesday, June 7, 2011
  33. 33. Produkty, které nejsou Innovating new business models, products, and services.Tuesday, June 7, 2011
  34. 34. ... a taky dobrý pocit něčeho nového:-)Tuesday, June 7, 2011
  35. 35. Děkuji za pozornost. josef.slerka@ataxo.com josef.slerka@gmail.comTuesday, June 7, 2011

×