Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Proč selhávají BigData a AI projekty a jak se tomu vyhnout

Prezentace o tom, jak předejít selhání u BigData a AI projektů. Prezentována Janem Jančou z Gauss Algorithmic na konferenci New Media Inspiration 2018 v Praze.

  • Be the first to comment

  • Be the first to like this

Proč selhávají BigData a AI projekty a jak se tomu vyhnout

  1. 1. Proč selhávají BigData a AI projekty … a jak se selhání vyhnout
  2. 2. Proč selhávají BigData a AI projekty 01 * https://www.gartner.com/smarterwithgartner/how-to-prevent-big-data-analytics-failures/ ** https://twitter.com/nheudecker/status/928720268662530048 Big Data projektů selhalo Oficiální Gartner report 2017* 60 % 85 % Big Data projektů selhalo Neoficiální vyjádření analytika Nicka Heudeckera, který na reportu pracoval**
  3. 3. 1. Aby AI dobře fungovala, potřebují její algoritmy zpravidla velké množství dat k učení. 2. Nepostavíte úspěšný AI projekt, pokud nemáte v pořádku data a nejste dobří v datové analýze. 3. AI je v podstatě nový buzzword pro BigData, což byl před lety nový buzzword pro BI, což byl před drahnými lety nový buzzword pro statistiku. Jaký je vztah mezi BigData a AI projekty? 02 1980 2000 2010 2016 Databáze BI BigData AI
  4. 4. Jaký je vztah mezi BigData a AI projekty? 03 Zdroj dat Zdroj dat Zdroj dat Čištění, validace, normalizace, třídění, obohacení, sloučení, deduplikace, uložení… single source of truth DataLake/DWH Datová analýza Statistika Databáze Reporty, alerty Vizualizace Prediktivní modely Strojové učení Data driven decisions Aplikace 3. stran I. datová integrace II. hledání informací III. AI magic if I. or II. !=true: no magic
  5. 5. 1. Rychlejší a autonomní rozhodování s „předpovědí” budoucnosti – přenesení analytické práce na stroj. 2. Snížení rizika při rozhodování – přenesení odpovědnosti na stroj. 3. Získání nových pohledů / vhledů a získání konkurenční výhody – přenesení „podnikatelské invence” na stroj. 4. Tlak na inovace díky nemožnosti zvýšit výkonnost současných obchodních modelů – zvýšený vztah k riziku. 5. Je to „cool & nová” věc, která dokáže zázraky* – nový svatý grál. Proč jsou BigData a AI projekty tak lákavé? 04 * „Jakákoliv dostatečně pokročilá technologie je nerozlišitelná od magie.“. Sir Arthur C. Clarke
  6. 6. BigData, AI a cyklus zavádění nových technologií 05 Inovátoři Vizionáři Early adopters Pragmatici Early majority Konzervy Late majority Opozdilci Očekávání/Adopce/Náklady Gartner's supply chain Hype Cycle září 2017: https://www.gartner.com/newsroom/id/3798863 Gartner's tech Hype Cycle 2017: https://www.gartner.com/...gartner-hype-cycle-for-emerging... PROPAST Plateau of productivity Trough of disillusionment Peak of inflated expectations
  7. 7. BigData, AI a cyklus zavádění nových technologií 06 Inovátoři Vizionáři Early adopters Pragmatici Early majority Konzervy Late majority Opozdilci Očekávání/Adopce/Náklady Gartner's supply chain Hype Cycle září 2017: https://www.gartner.com/newsroom/id/3798863 Gartner's tech Hype Cycle 2017: https://www.gartner.com/...gartner-hype-cycle-for-emerging... Deep learning BigData Deskriptivní datová analytika 85%projektů Plateau of productivity Trough of disillusionment Peak of inflated expectations
  8. 8. 1. Riziko využití nové technologie časem klesá, stejně jako s tím spojená konkurenční výhoda. 2. Investice do zavedení nové technologie zůstávají vysoké až do její masové adopce. 3. Projekty využívající BigData a AI technologie jsou stále výzkumně vývojové, mají vysoké riziko neúspěchu. 4. Dospělost a většinová adopce těchto technologií nastane za 2–5 let*. BigData, AI a cyklus zavádění nových technologií 07 Zvažte svůj vztah k riziku a touhu i nezbytnost zavádět inovace vzhledem k výkonnosti vašeho stávajícího business modelu. * To stejné se říká o jaderné fúzi již 50 let ;)
  9. 9. Široká definice projektů a přehnaná očekávání 1. Zahajují se velké a ambiciózní (transformační) projekty bez konkrétní představy o jejich ROI s výkřikem: „Nebylo by super udělat X s AI?“ 2. Zapomíná se na generování a ověřování hypotéz před specifikací řešení (neověřuje se dosažitelnost). 3. Velké projekty vyžadují spolupráci mnoha lidí, velké investice a mají mnoho kritických míst. 4. Deadliny jsou vzhledem ke komplexitě projektů nerealistické a těžko se průběžně kontrolují. Důvody selhání BigData a AI projektů 08 Začněte s menšími, dobře definovanými projekty, na kterých lze ve finitním čase ověřit reálnost hypotéz a návratnost investic.
  10. 10. Nedostatek znalostí a zkušeností 1. Projekty vyžadují specifickou sadu schopností dostupnou pouze malé části populace (genetika, vzdělání a zkušenosti). 2. Budování interních AI týmů je drahý a dlouhodobý proces s nejistým výsledkem, který může vyčerpat rozpočet dříve než vznikne specifikace projektu. 3. Nejlepší lidé nechtějí dlouhodobě pracovat na jednom projektu a výzkumníci z akademického světa nechápou pojmy jako „rozpočet“ nebo „deadline“. Důvody selhání BigData a AI projektů 09 Využijte externí AI/BigData specialisty se zkušenostmi s projekty z více oborů, kteří buď již mají hotová řešení (nevymýšlí kolo) nebo pomohou se zadáním projektu, dodají MVP a předají vám know-how.
  11. 11. Špatná, nekompletní nebo nesprávná data 1. Neúplná datová integrace, špatné vyčištění dat, neověřená ujištění IT, že „všechno mají“ nebo, že „to nebude problém udělat později.“ Bude. 2. Přesvědčení, že obrovské množství interních dat musí obsahovat cenné informace bez nutnosti využití dat třetích stran. 3. Podcenění významu zapojení lidí z praxe do procesu datové analýzy. Víra, že všechny podstatné informace najde analytik nebo dokonce stroj. Důvody selhání BigData a AI projektů 10 80 % využitelných výsledků získáte z datové analýzy. Udělejte ji pořádně a s nejlepšími dostupnými lidmi. Získání dalších 20 % s pomocí AI, vyčerpá 80 % rozpočtu.
  12. 12. Víra ve staré IT a unáhlené investice nových 1. SAP, Oracle, atd. jsou technologie 90. let. Dobře, a v mezích licenční politiky i efektivně, zvládají úkoly, pro které byly navrženy. To vede často k omylu, že stejně dobře zvládnou i BigData a AI projekty. 2. Investice pak probíhají ve dvou extrémech, nákupu krabic roubujících BD/AI řešení na starou technologii nebo nákupem celé nové infrastruktury. 3. Zanedbává se analýza toho, které úkoly lze řešit se stávajícím řešením, které lze realizovat v cloudu jako SaaS, a pro které je třeba nová infrastruktura. Důvody selhání BigData a AI projektů 11 Vyzkoušejte technologie např. na AWS nebo si udělejte min. instalace „open source“ verzí na starý HW. Nesnažte se provést „Lví skok” DWH na DataLake (koupit si budoucnost).
  13. 13. Málo anebo příliš mnoho času 1. Výsledky se očekávají ihned, ale výkon řady aplikací AI pro podporu rozhodování lze vyhodnotit až v horizontu desítek měsíců. AI i její vývojáři potřebují čas, aby se mohli poučit z chyb. 2. Očekávání a cena BigData / AI projektů často omezuje racionalitu při rozhodování o jejich ukončení pro neúspěch. Dlouho běžící projekt bez výsledků požírající investice rozčiluje a demotivuje oddělení, která na něj „vydělávají“. Důvody selhání BigData a AI projektů 12 Součástí specifikace projektu by měly být i scénáře pro ověření jeho návratnosti. Proto je lepší začít s malým projektem a v případě úspěchu škálovat.
  14. 14. Některé další časté zdroje problémů 1. Projekt je iniciován zespodu a nemá podporu managementu. 2. Projekt je prezentován jako náhrada tradičního DWH a BI, čímž vzniká rezistence uvnitř organizace (strach o práci). 3. Společnosti, které na své pragmatičnosti nebo dokonce konzervativnosti vybudovali svůj úspěch, se snaží změnit svou DNA a stát se přes noc inovátory. 4. Omezení daná kybernetickou bezpečností nebo zákonnou úpravou, mohou zastavit i jinak úspěšný projekt. Důvody selhání BigData a AI projektů 13
  15. 15. Nebyla to teorie, ale těžce získané zkušenosti... 14 ... při vývoji vlastních projektů* ... … i řady projektů našich zákazníků ... * Ano, je to reklama, ale taková nativní ;)
  16. 16. 1. Dny, ve kterých v posledních 25 letech abstinoval Miloš Zeman. 2. Dny, ve kterých Zemi navštívili Marťani. 3. Dny zúčtování, ve kterých ve filmech s Terminátorem procitla* umělá inteligence Skynet a zničila svět**. Sci-fi kvíz. Víte, čím jsou významná tato data? 15 *uvědomila si sebe sama a řekla si, že lidi nejsou zase tak dobrý nápad. **na seznamu zničených měst není Praha. Češi jsou mírumilovný národ a pro Skynet jsou OK ;) 29. srpna 1997 25. července 2004 21. dubna 2011 25. července 2003
  17. 17. Děkuji za pozornost. Dotazy? janca@gaussalgo.com

×