SlideShare a Scribd company logo
1 of 16
Barnaby Rich szindróma a 21.
században
Hámori Balázs
Ünnepi konferencia Szabó Katalin 70. születésnapja alkalmából, 2014. november 5.
----------------------------------------------------------------------------------------------------------
Amiről ma szó lesz…
o Robbanásszerű adatfeldúsulás
o Barnaby Rich szindróma
o Az elmélet lemaradása
o Big Data
o Az információs szennyeződés mint externália
o Az adatok természetének a változása
o A közgazdasági kutatások új perspektívái
o Big Data elemzések a gyakorlatban
o A Big Data Magyarországon
Adatförgeteg
o 2012- re 20 (!) tipikus – széles sávú internettel ellátott –
háztartás több információ-forgalmat generál, mint amennyi
2008-ban az egész interneten átfolyt.
o 2010 végére egy fél zettabyte-nyi adat ment át az interneten,
ami körülbelül akkora információ-mennyiségnek felel meg, mint
amennyit egy 36 milliárd mérföld hosszú (ez a Föld és a Pluto
távolságának a tízszerese) könyvespolc tartalmaz.
o Minden öt percben (!) akkora digitális adatförgeteget
generálunk, amely egyenértékű az amerikai Kongresszusi
Könyvtárban tárolt információmennyiséggel
1 zettabyte a számítógépes adattárolás egysége 1 sextillion bytes
(10007 vagy 1021)
Forrás: Https://www.cisco.com/web/about/ac79/docs/pov/Data_Explosion_IBSG.pdf
Barnaby Rich szindróma
o A 17. században élt ír
katonaorvosról Barnaby Rich-
szindrómának nevezték el a
szüntelen panaszkodást az irodalom
túlcsordulása, exponenciális
szaporodása, mértéktelen
burjánzása miatt. Mit szólna
Barnaby Rich a mai állapotokhoz?
o A publikációk csak a jéghegy csúcsát
jelentik, és eltörpülnek az
elképzelhetetlen méretű
adattermelés mellett
o Az University of San Diego egy
tanulmánya szerint az átlag amerikai
napi 11,8 (!) órát tölt információ-
fogyasztással, ez alatt napi 34
gigabyte információt fogyaszt.
2000-ben becslések szerint a világ teljes
információ mennyiségének a negyedét
tárolták digitálisan, ma ez az arány 98 %
2005-től kezdve a jelenség Big Data
néven vonult be a köztudatba
Az USA 17
ágazatából 15-ben a
Vállalatok
egyenként több
adatot tárolnak
átlagosan, mint a
Kongresszusi
Könyvtár
Információs szennyeződés mint
externália
o Az információtermelő folyamatok káros
mellékhatása a kéretlen
reklámanyagoktól a spameken
keresztül a gépeket megtámadó
férgekig és vírusokig.
o A felesleges információk eltömítik az
információs csatornákat, megnehezítik
a keresést, ezáltal kárt okoznak mind az
információtermelőknek, mind az
információfogyasztóknak
o A szennyeződésnek ez a formája
láthatatlan, additív, destruktív, hosszú
távú hatású, a jog által is védelmezett,
rejtett költségei vannak és
visszafordíthatatlan, a szennyezők
nehezen megfoghatók
o Ezek negatív externális hatást fejtenek
ki.
Az elmélet lemaradása
oAz információ közgazdaságtana
sokáig szinte egyáltalán nem
foglalkozott az információs
túlterheléssel. Sokkal inkább a
hiányos információk kötötték
le a közgazdászok figyelmét
(aszimmetrikus információk,
bizonytalanság, stb.)
oNem az információ, hanem az
észleléséhez, feldolgozásához,
megemésztéséhez szükséges
figyelem szűkös.
oEbből viszont következik,
hogy e szűkös jószágot, a
figyelmet hatékonyan kell
allokálni a különféle
felhasználási lehetőségek
között.
oAz allokációs problémát
azonban csak akkor lehet
jól megoldani, ha
megtaláljuk a szűkös
erőforrás mérésére
szolgáló eszközöket (Simon,
1982, p. 151.)
oEz az idő
Big Data
oMcKinsey Global Institute
(2011) a Big Datára olyan
adategyüttesként hivatkozik,
„amelynek a mérete
túlnyúlik a tipikus adatbázis-
kezelő szoftverek rögzítési,
raktározási, menedzselési és
analizálási képességén”.
o„Az adattömeg túl nagy, túl
gyorsan mozog, vagy nem
illeszkedik az adatbázis
architektúrájához.”
(Edd Dumbill, 2012)
Az adatok természetének változása
a Big Data korszakban
o Ezek ráadásul valós időben és
torzításmentesen állnak
rendelkezésre, amelyek a
korábbi -- felmérésekkel
beszerzett -- adatokról
egyáltalán nem volt
elmondható
o Lehetővé teszi a kutatók
számára hogy nyomon
kövessék a különböző
gazdaságpolitikai intézkedések
és intézményi változások
következményeit
o Negatív konnotáció helyett inkább
pozitív jelenségként tekinthetünk
rá, mert ami kezelhetetlen vagy
strukturálatlan egy adott
időpontban valamivel később a
számítás-technikának
köszönhetően már kezelhető lehet
o Korábban elérhetetlen vagy
nehezen megfigyelhető, ám
gazdasági szempontból fontos
adatok néhány klikkeléssel
beszerezhetők (emberek
helyváltoztatása, kapcsolathálójuk,
stb.)
o Néhány évvel ezelőtt az üzletek csak a napi forgalomról összesítve gyűjthettek
adatokat, jó esetben termékek , illetve termékkategóriák szerint. Ma a
pénztárgépek lehetővé teszik, hogy egyénenként rögzíthessék a vásárlásokat,
nyomon kövessék a vevőtörténetet, vagyis hosszú távon megfigyelhessék az
individuális vevő megatartását és annak a trendjeit, ajánlataikat, illetve
promóciós tevékenységüket feltételezett vevőcsoportok helyett az egyes
egyénekhez igazítsák.
o A kutatók számára ezek adatok valóságos aranybányát jelentenek, különösen
ha összekötik őket a demográfiai adatokkal, a közösségi médián keresztül
nyomon követhető aktivitással vagy a hiteltörténettel. (V.ö. Einav&Levin,
NBER, 2014)
o Nincs szükség feltételezésekre a reprezentatív fogyasztóról, szélsőséges
leegyszerűsítésekre a modellépítéskor, közvetlenül és teljeskörűen
megfigyelhető a valóság. Ez egészen új megvilágításba helyezi a közgazdasági
kutatások és a valóság viszonyát, amely eddig talán a legkritikusabb pontja
volt tudományágunknak
Új perspektívák a közgazdasági kutatások
előtt: teljes körű megfigyelés
Big Data Big Thinking
o A kutatók predikcióra is alkalmas
összefüggést találtak a Wikipedia
pénzügyi témájú keresései és
a Wall Street nagy zuhanásai között.
o Mivel az emberek kockázatkerülők,
főként az eladások előtt keresgéltek
a Wikipédián, ezért a keresések
megugró száma előre vetítette a
krachot.
o A nagy tömegű adat pénzügyi célú
feldolgozására egy egészen új
tudományterület, az ökonofizika
épült.
Gingras, Y. - Schinckus, C. (2012):
The Institutionalization of
Econophysics in the Shadow of Physics,
Journal of the History of Economic
Thought, Volume 34, Number 1,
March 2012
A Big Data előnyei a közgazdasági
kutatások szempontjából
o Meglévő adatok használhatók, amelyek olcsóbak
az originális adatok létrehozásánál (például
felmérésekkel)
o Amennyiben automatikusan keletkeznek (például
klikkeléssel, vagy egy vásárlás tételeinek a
beütésével) többnyire torzításmentesek, szemben
a lekérdezéssel nyert adatokkal
o Megragadhatók olyan események és jelenségek
is, amelyek relatíve ritkák, a nagy adattömegben
azonban következtetések levonására is alkalmas
számban fordulnak elő
o Kombinálhatók egymással és a tradicionális
módon nyert adatokkal
o A nagy adattömeg megbízhatóbb, mint a
korlátozott körben gyűjtött adathalom
Kihívások a Big Data kutatási célú
felhasználásakor
oAdatbázisokhoz való hozzáférés, a
megismételhetőség nehézségei
oSpeciális szaktudásra van szükség a
nagy adatbázisok elemzéshez (A
Gartner szerint 2015-ig világszerte 4,4
millió munkahelyet kell majd betölteni
a "big data", elemzésében jártas
szakemberekkel.)
oZajos adatok, a zajok
kiszűrése nem egyszerű
(Cho & Judge, 2013)
oHamis kapcsolatok kimutatása
Mire használják a Big Data elemzéseket a
gyakorlatban?
• A Google 2009-ben hatékonyan
jelezte előre a sertésinfluenza
vírus terjedését, anélkül, hogy
egyetlen orvosi vizsgálatot is
végeztek volna. A keresőmotor,
amely naponta mintegy 3 milliárd
keresési kérést dolgoz fel, 450
millió modellt értékelt, amelyek a
sertésinfluenzával kapcsolatos 50
millió legnépszerűbb keresőszó
kombinációján alapultak, és
felépített egy 45 keresőszóból álló
modellt, amely tényleg jól
teljesített a sertésinfluenza
előrejelzésében.
• Rolls Royce a jet-motorok néhány
tucat szenzora által továbbított
adatokat gyűjtött. Ezek a
kereskedelmi járatok minden
egyes útján detektálták az
alkatrészeket, hogy ennek
alapján előre jelezze azt, mikor
megy valószínűen tönkre egy
alkatrész, és kicserélje azt,
mielőtt az valóban felmondta
volna a szolgálatot. Az utasoknak
ez nagyobb biztonságot, a
légitársaságoknak kevesebb
meghibásodást jelentett, és
ennek alapján a Rolls Royce
sokkal előnyösebb karbantartási
szerződéseket tudott ajánlani.
További példák
o Az energiaszektorban új
lehetőségeket nyit meg az okos
mérők elterjedése és a adataik
részletes elemzése
o Bérszámfejtésre kb. 500.000
vállalat használ az USA-ban
ADP (Automatic Data
Processing) szoftvert
o Az ADP kutatóintézete
együttműködve Moody’s
Analitics-szel havi jelentést ad
a foglalkoztatásról. Az adatok
ennek az 500.000 vállalatnak
az automatikus bérszámfejtő
szoftver-adataiból származnak
oAz állam is felismerte az
adatelemzésben rejlő
lehetőségeket, jó példa erre
az online pénztárgépek
bevezetése és a belőlük
nyert adatok kockázatalapú
elemzése.
A Big Data Magyarországon
o Az MTA Wigner Fizikai Kutatóközpont a
magyarországi Big Data kutatásokban
érdekelt tudományos közösségeknek
szervezett konferenciát 2013
szeptemberében
o A konferencián a Microsoft munkatársa
elmondta: ők a közösségi hálón
történteket elemzik. Hangulatokra,
trendekre, véleményvezérekre
kíváncsiak, az eredményeket aztán a
marketingkampányokban szeretnék
felhasználni.
o Az üzleti élet és a munkaerőpiac várható
változásaira készülve indít közös
mesterképzést a CEU és az IBM. A „Big
Data szakra" közgazdászokat,
szociológusokat várnak és olyan
diplomásokat, akik az adathasznosítás
legújabb módszereivel szeretnének
mélyebben megismerkedni.
o Radoop egy három évvel ezelőtt
alakult magyar startup. A hazai
kutatókból és fejlesztőkből álló
csapat olyan megoldást hozott
létre, amely programozói
háttértudás nélkül alkalmas
nagymennyiségű adat elemzésére.
o A „felhasználóbarát alkalmazás a
nemzetközi érdeklődést váltott ki,
ennek tudható be, hogy
RapidMiner felvásárolta
o Radoop-ból a RapidMiner Big
Data feldolgozásával foglalkozó
részlegét alakítják majd ki.
RapidMiner Magyarországra hozza
teljes Big Data fejlesztési üzletágát
Néhány konklúzió
o Új adatforrások - új lehetőségek a tudományos kutatásban
o A Big Data
 már ma is stratégiai kérdés és egyre inkább azzá válik mind a
 vállalkozások, mind a
 gazdaságpolitikusok számára;
 informatikai beruházásokat követel;
 a képzés módosítását, kiegészítését igényli egy sor szakmában
(például informatika, statisztika, döntéselmélet, vezetés és
szervezés, marketing, közgazdaságtan, pénz- bank- és tőzsde
ügyek, meteorológia, fizika, földrengések kutatása, stb.)
o Adatbiztonsági kérdések sorát veti fel

More Related Content

Viewers also liked

TeamTILT for Nagios - Graphical based installation Guide
TeamTILT for Nagios - Graphical based installation GuideTeamTILT for Nagios - Graphical based installation Guide
TeamTILT for Nagios - Graphical based installation GuideTeamTILT
 
10 group presentation
10 group presentation10 group presentation
10 group presentationlunacy101
 
R&T Company Profile
R&T Company ProfileR&T Company Profile
R&T Company Profiledrivalda
 
NNg Visioneering-MKish
NNg Visioneering-MKishNNg Visioneering-MKish
NNg Visioneering-MKishkishmc
 
Il marchio della Bestia!
Il marchio della Bestia!Il marchio della Bestia!
Il marchio della Bestia!Medea63
 
Apple app store optimization
Apple app store optimizationApple app store optimization
Apple app store optimizationrajivrranjan
 
Aggression And Blackmail As Normal
Aggression And Blackmail As NormalAggression And Blackmail As Normal
Aggression And Blackmail As Normalbhamori
 
Trust And Social Capital Final
Trust And Social Capital FinalTrust And Social Capital Final
Trust And Social Capital Finalbhamori
 
BH_NewTypesOfInnovation_PhDWorkshop
BH_NewTypesOfInnovation_PhDWorkshopBH_NewTypesOfInnovation_PhDWorkshop
BH_NewTypesOfInnovation_PhDWorkshopbhamori
 
Cisco TrustSec - Software Defined Segmentation e sua aplicabilidade em Segura...
Cisco TrustSec - Software Defined Segmentation e sua aplicabilidade em Segura...Cisco TrustSec - Software Defined Segmentation e sua aplicabilidade em Segura...
Cisco TrustSec - Software Defined Segmentation e sua aplicabilidade em Segura...Wilson Rogerio Lopes
 
DDoS Attacks - Scenery, Evolution and Mitigation
DDoS Attacks - Scenery, Evolution and MitigationDDoS Attacks - Scenery, Evolution and Mitigation
DDoS Attacks - Scenery, Evolution and MitigationWilson Rogerio Lopes
 
Comparing SAP, Oracle, and Microsoft Solutions for Project Management; CLASH ...
Comparing SAP, Oracle, and Microsoft Solutions for Project Management; CLASH ...Comparing SAP, Oracle, and Microsoft Solutions for Project Management; CLASH ...
Comparing SAP, Oracle, and Microsoft Solutions for Project Management; CLASH ...Sasan Hosseyni
 

Viewers also liked (16)

Hnm
HnmHnm
Hnm
 
Hnm
HnmHnm
Hnm
 
TeamTILT for Nagios - Graphical based installation Guide
TeamTILT for Nagios - Graphical based installation GuideTeamTILT for Nagios - Graphical based installation Guide
TeamTILT for Nagios - Graphical based installation Guide
 
10 group presentation
10 group presentation10 group presentation
10 group presentation
 
R&T Company Profile
R&T Company ProfileR&T Company Profile
R&T Company Profile
 
NNg Visioneering-MKish
NNg Visioneering-MKishNNg Visioneering-MKish
NNg Visioneering-MKish
 
Il marchio della Bestia!
Il marchio della Bestia!Il marchio della Bestia!
Il marchio della Bestia!
 
Apple app store optimization
Apple app store optimizationApple app store optimization
Apple app store optimization
 
Aggression And Blackmail As Normal
Aggression And Blackmail As NormalAggression And Blackmail As Normal
Aggression And Blackmail As Normal
 
Trust And Social Capital Final
Trust And Social Capital FinalTrust And Social Capital Final
Trust And Social Capital Final
 
BH_NewTypesOfInnovation_PhDWorkshop
BH_NewTypesOfInnovation_PhDWorkshopBH_NewTypesOfInnovation_PhDWorkshop
BH_NewTypesOfInnovation_PhDWorkshop
 
71 80
71 8071 80
71 80
 
City Wifi Móvil 2018
City Wifi Móvil 2018City Wifi Móvil 2018
City Wifi Móvil 2018
 
Cisco TrustSec - Software Defined Segmentation e sua aplicabilidade em Segura...
Cisco TrustSec - Software Defined Segmentation e sua aplicabilidade em Segura...Cisco TrustSec - Software Defined Segmentation e sua aplicabilidade em Segura...
Cisco TrustSec - Software Defined Segmentation e sua aplicabilidade em Segura...
 
DDoS Attacks - Scenery, Evolution and Mitigation
DDoS Attacks - Scenery, Evolution and MitigationDDoS Attacks - Scenery, Evolution and Mitigation
DDoS Attacks - Scenery, Evolution and Mitigation
 
Comparing SAP, Oracle, and Microsoft Solutions for Project Management; CLASH ...
Comparing SAP, Oracle, and Microsoft Solutions for Project Management; CLASH ...Comparing SAP, Oracle, and Microsoft Solutions for Project Management; CLASH ...
Comparing SAP, Oracle, and Microsoft Solutions for Project Management; CLASH ...
 

Similar to Barnaby Rich

BigData trendek a TVs iparágban
BigData trendek a TVs iparágbanBigData trendek a TVs iparágban
BigData trendek a TVs iparágbanZoltán Petres
 
Üzleti célú mobilmédia elemzés
Üzleti célú mobilmédia elemzésÜzleti célú mobilmédia elemzés
Üzleti célú mobilmédia elemzésAFF Group
 
A jövő ma - inspirációs előadás
A jövő ma - inspirációs előadásA jövő ma - inspirációs előadás
A jövő ma - inspirációs előadásRobert Pinter
 
Kovacs antal bigdata_diagnosztika
Kovacs antal bigdata_diagnosztikaKovacs antal bigdata_diagnosztika
Kovacs antal bigdata_diagnosztikaAntalKovacs1
 
Konferencia_MKE_Dezinformacio_320231213.pptx
Konferencia_MKE_Dezinformacio_320231213.pptxKonferencia_MKE_Dezinformacio_320231213.pptx
Konferencia_MKE_Dezinformacio_320231213.pptxOrosSndor
 
Mihály Sz., Remetey-Fülöpp G., CBAS és magyar vonatkozásai, Fény-Tér-K...
Mihály Sz., Remetey-Fülöpp G., CBAS és magyar vonatkozásai, Fény-Tér-K...Mihály Sz., Remetey-Fülöpp G., CBAS és magyar vonatkozásai, Fény-Tér-K...
Mihály Sz., Remetey-Fülöpp G., CBAS és magyar vonatkozásai, Fény-Tér-K...Gabor
 
Pr idojaraselorejelzes
Pr idojaraselorejelzesPr idojaraselorejelzes
Pr idojaraselorejelzesThomas Barat
 
Könyvtárostanár Konferencia
Könyvtárostanár KonferenciaKönyvtárostanár Konferencia
Könyvtárostanár KonferenciaReka Racsko
 
Mobiloktatás internet biztonság
Mobiloktatás internet biztonságMobiloktatás internet biztonság
Mobiloktatás internet biztonságMobiloktatas
 
Munkát vagy munkahelyet vesz el a BI és az MI a cégeknél?
Munkát vagy munkahelyet vesz el a BI és az MI a cégeknél? Munkát vagy munkahelyet vesz el a BI és az MI a cégeknél?
Munkát vagy munkahelyet vesz el a BI és az MI a cégeknél? Robert Pinter
 
A mesterséges intelligencia megjelenése a biztonságtudományban
A mesterséges intelligencia megjelenése a biztonságtudománybanA mesterséges intelligencia megjelenése a biztonságtudományban
A mesterséges intelligencia megjelenése a biztonságtudománybanCsaba KOLLAR (Dr. PhD.)
 

Similar to Barnaby Rich (13)

BigData trendek a TVs iparágban
BigData trendek a TVs iparágbanBigData trendek a TVs iparágban
BigData trendek a TVs iparágban
 
Üzleti célú mobilmédia elemzés
Üzleti célú mobilmédia elemzésÜzleti célú mobilmédia elemzés
Üzleti célú mobilmédia elemzés
 
A jövő ma - inspirációs előadás
A jövő ma - inspirációs előadásA jövő ma - inspirációs előadás
A jövő ma - inspirációs előadás
 
Kovacs antal bigdata_diagnosztika
Kovacs antal bigdata_diagnosztikaKovacs antal bigdata_diagnosztika
Kovacs antal bigdata_diagnosztika
 
Konferencia_MKE_Dezinformacio_320231213.pptx
Konferencia_MKE_Dezinformacio_320231213.pptxKonferencia_MKE_Dezinformacio_320231213.pptx
Konferencia_MKE_Dezinformacio_320231213.pptx
 
Mihály Sz., Remetey-Fülöpp G., CBAS és magyar vonatkozásai, Fény-Tér-K...
Mihály Sz., Remetey-Fülöpp G., CBAS és magyar vonatkozásai, Fény-Tér-K...Mihály Sz., Remetey-Fülöpp G., CBAS és magyar vonatkozásai, Fény-Tér-K...
Mihály Sz., Remetey-Fülöpp G., CBAS és magyar vonatkozásai, Fény-Tér-K...
 
Pr idojaraselorejelzes
Pr idojaraselorejelzesPr idojaraselorejelzes
Pr idojaraselorejelzes
 
Könyvtárostanár Konferencia
Könyvtárostanár KonferenciaKönyvtárostanár Konferencia
Könyvtárostanár Konferencia
 
Alszent Antikapitalistak
Alszent AntikapitalistakAlszent Antikapitalistak
Alszent Antikapitalistak
 
PTE_BPTB_maj8
PTE_BPTB_maj8PTE_BPTB_maj8
PTE_BPTB_maj8
 
Mobiloktatás internet biztonság
Mobiloktatás internet biztonságMobiloktatás internet biztonság
Mobiloktatás internet biztonság
 
Munkát vagy munkahelyet vesz el a BI és az MI a cégeknél?
Munkát vagy munkahelyet vesz el a BI és az MI a cégeknél? Munkát vagy munkahelyet vesz el a BI és az MI a cégeknél?
Munkát vagy munkahelyet vesz el a BI és az MI a cégeknél?
 
A mesterséges intelligencia megjelenése a biztonságtudományban
A mesterséges intelligencia megjelenése a biztonságtudománybanA mesterséges intelligencia megjelenése a biztonságtudományban
A mesterséges intelligencia megjelenése a biztonságtudományban
 

Barnaby Rich

  • 1. Barnaby Rich szindróma a 21. században Hámori Balázs Ünnepi konferencia Szabó Katalin 70. születésnapja alkalmából, 2014. november 5. ----------------------------------------------------------------------------------------------------------
  • 2. Amiről ma szó lesz… o Robbanásszerű adatfeldúsulás o Barnaby Rich szindróma o Az elmélet lemaradása o Big Data o Az információs szennyeződés mint externália o Az adatok természetének a változása o A közgazdasági kutatások új perspektívái o Big Data elemzések a gyakorlatban o A Big Data Magyarországon
  • 3. Adatförgeteg o 2012- re 20 (!) tipikus – széles sávú internettel ellátott – háztartás több információ-forgalmat generál, mint amennyi 2008-ban az egész interneten átfolyt. o 2010 végére egy fél zettabyte-nyi adat ment át az interneten, ami körülbelül akkora információ-mennyiségnek felel meg, mint amennyit egy 36 milliárd mérföld hosszú (ez a Föld és a Pluto távolságának a tízszerese) könyvespolc tartalmaz. o Minden öt percben (!) akkora digitális adatförgeteget generálunk, amely egyenértékű az amerikai Kongresszusi Könyvtárban tárolt információmennyiséggel 1 zettabyte a számítógépes adattárolás egysége 1 sextillion bytes (10007 vagy 1021) Forrás: Https://www.cisco.com/web/about/ac79/docs/pov/Data_Explosion_IBSG.pdf
  • 4. Barnaby Rich szindróma o A 17. században élt ír katonaorvosról Barnaby Rich- szindrómának nevezték el a szüntelen panaszkodást az irodalom túlcsordulása, exponenciális szaporodása, mértéktelen burjánzása miatt. Mit szólna Barnaby Rich a mai állapotokhoz? o A publikációk csak a jéghegy csúcsát jelentik, és eltörpülnek az elképzelhetetlen méretű adattermelés mellett o Az University of San Diego egy tanulmánya szerint az átlag amerikai napi 11,8 (!) órát tölt információ- fogyasztással, ez alatt napi 34 gigabyte információt fogyaszt. 2000-ben becslések szerint a világ teljes információ mennyiségének a negyedét tárolták digitálisan, ma ez az arány 98 % 2005-től kezdve a jelenség Big Data néven vonult be a köztudatba Az USA 17 ágazatából 15-ben a Vállalatok egyenként több adatot tárolnak átlagosan, mint a Kongresszusi Könyvtár
  • 5. Információs szennyeződés mint externália o Az információtermelő folyamatok káros mellékhatása a kéretlen reklámanyagoktól a spameken keresztül a gépeket megtámadó férgekig és vírusokig. o A felesleges információk eltömítik az információs csatornákat, megnehezítik a keresést, ezáltal kárt okoznak mind az információtermelőknek, mind az információfogyasztóknak o A szennyeződésnek ez a formája láthatatlan, additív, destruktív, hosszú távú hatású, a jog által is védelmezett, rejtett költségei vannak és visszafordíthatatlan, a szennyezők nehezen megfoghatók o Ezek negatív externális hatást fejtenek ki.
  • 6. Az elmélet lemaradása oAz információ közgazdaságtana sokáig szinte egyáltalán nem foglalkozott az információs túlterheléssel. Sokkal inkább a hiányos információk kötötték le a közgazdászok figyelmét (aszimmetrikus információk, bizonytalanság, stb.) oNem az információ, hanem az észleléséhez, feldolgozásához, megemésztéséhez szükséges figyelem szűkös. oEbből viszont következik, hogy e szűkös jószágot, a figyelmet hatékonyan kell allokálni a különféle felhasználási lehetőségek között. oAz allokációs problémát azonban csak akkor lehet jól megoldani, ha megtaláljuk a szűkös erőforrás mérésére szolgáló eszközöket (Simon, 1982, p. 151.) oEz az idő
  • 7. Big Data oMcKinsey Global Institute (2011) a Big Datára olyan adategyüttesként hivatkozik, „amelynek a mérete túlnyúlik a tipikus adatbázis- kezelő szoftverek rögzítési, raktározási, menedzselési és analizálási képességén”. o„Az adattömeg túl nagy, túl gyorsan mozog, vagy nem illeszkedik az adatbázis architektúrájához.” (Edd Dumbill, 2012)
  • 8. Az adatok természetének változása a Big Data korszakban o Ezek ráadásul valós időben és torzításmentesen állnak rendelkezésre, amelyek a korábbi -- felmérésekkel beszerzett -- adatokról egyáltalán nem volt elmondható o Lehetővé teszi a kutatók számára hogy nyomon kövessék a különböző gazdaságpolitikai intézkedések és intézményi változások következményeit o Negatív konnotáció helyett inkább pozitív jelenségként tekinthetünk rá, mert ami kezelhetetlen vagy strukturálatlan egy adott időpontban valamivel később a számítás-technikának köszönhetően már kezelhető lehet o Korábban elérhetetlen vagy nehezen megfigyelhető, ám gazdasági szempontból fontos adatok néhány klikkeléssel beszerezhetők (emberek helyváltoztatása, kapcsolathálójuk, stb.)
  • 9. o Néhány évvel ezelőtt az üzletek csak a napi forgalomról összesítve gyűjthettek adatokat, jó esetben termékek , illetve termékkategóriák szerint. Ma a pénztárgépek lehetővé teszik, hogy egyénenként rögzíthessék a vásárlásokat, nyomon kövessék a vevőtörténetet, vagyis hosszú távon megfigyelhessék az individuális vevő megatartását és annak a trendjeit, ajánlataikat, illetve promóciós tevékenységüket feltételezett vevőcsoportok helyett az egyes egyénekhez igazítsák. o A kutatók számára ezek adatok valóságos aranybányát jelentenek, különösen ha összekötik őket a demográfiai adatokkal, a közösségi médián keresztül nyomon követhető aktivitással vagy a hiteltörténettel. (V.ö. Einav&Levin, NBER, 2014) o Nincs szükség feltételezésekre a reprezentatív fogyasztóról, szélsőséges leegyszerűsítésekre a modellépítéskor, közvetlenül és teljeskörűen megfigyelhető a valóság. Ez egészen új megvilágításba helyezi a közgazdasági kutatások és a valóság viszonyát, amely eddig talán a legkritikusabb pontja volt tudományágunknak Új perspektívák a közgazdasági kutatások előtt: teljes körű megfigyelés
  • 10. Big Data Big Thinking o A kutatók predikcióra is alkalmas összefüggést találtak a Wikipedia pénzügyi témájú keresései és a Wall Street nagy zuhanásai között. o Mivel az emberek kockázatkerülők, főként az eladások előtt keresgéltek a Wikipédián, ezért a keresések megugró száma előre vetítette a krachot. o A nagy tömegű adat pénzügyi célú feldolgozására egy egészen új tudományterület, az ökonofizika épült. Gingras, Y. - Schinckus, C. (2012): The Institutionalization of Econophysics in the Shadow of Physics, Journal of the History of Economic Thought, Volume 34, Number 1, March 2012
  • 11. A Big Data előnyei a közgazdasági kutatások szempontjából o Meglévő adatok használhatók, amelyek olcsóbak az originális adatok létrehozásánál (például felmérésekkel) o Amennyiben automatikusan keletkeznek (például klikkeléssel, vagy egy vásárlás tételeinek a beütésével) többnyire torzításmentesek, szemben a lekérdezéssel nyert adatokkal o Megragadhatók olyan események és jelenségek is, amelyek relatíve ritkák, a nagy adattömegben azonban következtetések levonására is alkalmas számban fordulnak elő o Kombinálhatók egymással és a tradicionális módon nyert adatokkal o A nagy adattömeg megbízhatóbb, mint a korlátozott körben gyűjtött adathalom
  • 12. Kihívások a Big Data kutatási célú felhasználásakor oAdatbázisokhoz való hozzáférés, a megismételhetőség nehézségei oSpeciális szaktudásra van szükség a nagy adatbázisok elemzéshez (A Gartner szerint 2015-ig világszerte 4,4 millió munkahelyet kell majd betölteni a "big data", elemzésében jártas szakemberekkel.) oZajos adatok, a zajok kiszűrése nem egyszerű (Cho & Judge, 2013) oHamis kapcsolatok kimutatása
  • 13. Mire használják a Big Data elemzéseket a gyakorlatban? • A Google 2009-ben hatékonyan jelezte előre a sertésinfluenza vírus terjedését, anélkül, hogy egyetlen orvosi vizsgálatot is végeztek volna. A keresőmotor, amely naponta mintegy 3 milliárd keresési kérést dolgoz fel, 450 millió modellt értékelt, amelyek a sertésinfluenzával kapcsolatos 50 millió legnépszerűbb keresőszó kombinációján alapultak, és felépített egy 45 keresőszóból álló modellt, amely tényleg jól teljesített a sertésinfluenza előrejelzésében. • Rolls Royce a jet-motorok néhány tucat szenzora által továbbított adatokat gyűjtött. Ezek a kereskedelmi járatok minden egyes útján detektálták az alkatrészeket, hogy ennek alapján előre jelezze azt, mikor megy valószínűen tönkre egy alkatrész, és kicserélje azt, mielőtt az valóban felmondta volna a szolgálatot. Az utasoknak ez nagyobb biztonságot, a légitársaságoknak kevesebb meghibásodást jelentett, és ennek alapján a Rolls Royce sokkal előnyösebb karbantartási szerződéseket tudott ajánlani.
  • 14. További példák o Az energiaszektorban új lehetőségeket nyit meg az okos mérők elterjedése és a adataik részletes elemzése o Bérszámfejtésre kb. 500.000 vállalat használ az USA-ban ADP (Automatic Data Processing) szoftvert o Az ADP kutatóintézete együttműködve Moody’s Analitics-szel havi jelentést ad a foglalkoztatásról. Az adatok ennek az 500.000 vállalatnak az automatikus bérszámfejtő szoftver-adataiból származnak oAz állam is felismerte az adatelemzésben rejlő lehetőségeket, jó példa erre az online pénztárgépek bevezetése és a belőlük nyert adatok kockázatalapú elemzése.
  • 15. A Big Data Magyarországon o Az MTA Wigner Fizikai Kutatóközpont a magyarországi Big Data kutatásokban érdekelt tudományos közösségeknek szervezett konferenciát 2013 szeptemberében o A konferencián a Microsoft munkatársa elmondta: ők a közösségi hálón történteket elemzik. Hangulatokra, trendekre, véleményvezérekre kíváncsiak, az eredményeket aztán a marketingkampányokban szeretnék felhasználni. o Az üzleti élet és a munkaerőpiac várható változásaira készülve indít közös mesterképzést a CEU és az IBM. A „Big Data szakra" közgazdászokat, szociológusokat várnak és olyan diplomásokat, akik az adathasznosítás legújabb módszereivel szeretnének mélyebben megismerkedni. o Radoop egy három évvel ezelőtt alakult magyar startup. A hazai kutatókból és fejlesztőkből álló csapat olyan megoldást hozott létre, amely programozói háttértudás nélkül alkalmas nagymennyiségű adat elemzésére. o A „felhasználóbarát alkalmazás a nemzetközi érdeklődést váltott ki, ennek tudható be, hogy RapidMiner felvásárolta o Radoop-ból a RapidMiner Big Data feldolgozásával foglalkozó részlegét alakítják majd ki. RapidMiner Magyarországra hozza teljes Big Data fejlesztési üzletágát
  • 16. Néhány konklúzió o Új adatforrások - új lehetőségek a tudományos kutatásban o A Big Data  már ma is stratégiai kérdés és egyre inkább azzá válik mind a  vállalkozások, mind a  gazdaságpolitikusok számára;  informatikai beruházásokat követel;  a képzés módosítását, kiegészítését igényli egy sor szakmában (például informatika, statisztika, döntéselmélet, vezetés és szervezés, marketing, közgazdaságtan, pénz- bank- és tőzsde ügyek, meteorológia, fizika, földrengések kutatása, stb.) o Adatbiztonsági kérdések sorát veti fel