SlideShare a Scribd company logo
1 of 51
Download to read offline
Data, informace, 
zákony a indexy 
Josef Šlerka, Studia nových médií, Socialbakers
Obsah 
1. DIKW aneb obecný rámec 
2. Zákony a paradoxy (a slepé cesty) 
3. Social Heatlh Index - případová studie 
4. Diskuse 
5. Konec
1. DIKW 
Data, Information, Knowledge, Wisdom
2. Zákony a paradoxy 
(a také slepé cesty)
Zákony a paradoxy 
2.1. Medián a průměr 
2.2. Zákon velkých čísel 
2.3. Benfordův zákon 
2.4. Simpsonův paradox 
2.5. Matoušův efekt 
2.6. Bonus
2.1. Medián a průměr 
Malá cesta v čase... To psal rok 2013 a my jsme s 
Eliškou Hutníkovou prezentovali data o českém 
Facebooku....
Tisíce fanoušků má 
přeci každá stránka, 
tak proč my ne!
Ověření 
analýza informací o FB stránkách přes API 
celkem indexujeme něco přes 23.000 stránek 
jen něco přes 11.000 bylo za poslední měsíc 
alespoň jednou aktivních 
pro analýzu jsme využili jen stránky aktivní v 
minulém měsící
Zjištění 
průměrně má česká aktivní stránka 4.169 
fanoušků 
median je 356, tedy více než 10x méně 
skoro 90 procent stránek na českém Facebooku 
má méně fanoušků než je průměr 
jen horních 7 procent jich má více než 10.000 
v případě počtu fanoušků Facebook stránek je 
metrika průměru naprostej bullshit
2.1. Medián a průměr 
Medián je hodnota, jež dělí řadu vzestupně 
seřazených výsledků na dvě stejně početné poloviny. 
Ve statistice patří mezi míry centrální tendence. Platí, 
že nejméně 50 % hodnot je menších nebo rovných a 
nejméně 50 % hodnot je větších nebo rovných 
mediánu. Medián má smysl definovat pouze pro 
jednorozměrnou reálnou veličinu, jako je např. výška, 
hmotnost, výše mzdy atd. (Wikipedie)
2.1. Medián a průměr 
Aritmetický průměr je statistická veličina, která v jistém 
smyslu vyjadřuje typickou hodnotu popisující soubor 
mnoha hodnot. Aritmetický průměr se obvykle značí 
vodorovným pruhem nad názvem proměnné, popř. 
řeckým písmenem μ. Definice aritmetického průměru 
je (...) součet všech hodnot vydělený jejich počtem. V 
běžné řeči se obvykle obecným slovem průměr myslí 
právě aritmetický průměr. (Wikipedie)
2.2. Zákon velkých čísel 
Když máte fanoušky, kteří mají hodně followerů, asi 
jsou kvalitěnější (známější, vlivnější)...
2.2. Zákon velkých čísel 
Vezměme čtyři účty: 
@O2GuruCZ (cca 1.700) 
@o2_cz (cca 6.500) 
@tmobile_cze (cca 4.200) 
@Vodafone_cz (cca 32.400)
2.2. Zákon velkých čísel
2.2. Zákon velkých čísel 
In probability theory, the law of large numbers (LLN) is 
a theorem that describes the result of performing the 
same experiment a large number of times. According 
to the law, the average of the results obtained from a 
large number of trials should be close to the expected 
value, and will tend to become closer as more trials 
are performed. (http://en.wikipedia.org/wiki/ 
Law_of_large_numbers)
2.3. Benfordův zákon 
Benfordův zákon je matematický zákon, který říká, že 
v mnoha souborech přirozených dat (ale ne ve všech) 
čísla mnohem častěji začínají číslicí 1 než na jiné 
číslice. Zhruba 30 % čísel začíná jedničkou. Čím vyšší 
je počáteční číslice, tím méně pravděpodobněji se na 
začátku čísel objevuje. (http://cs.wikipedia.org/wiki/ 
Benford%C5%AFv_z%C3%A1kon)
2.4. Simpsonův paradox 
KLM AirFrance 
Ruzyň 30% 25% 
Frankfurt 100% 75% 
kdo je lepší průměr 65%? průměr 50%? 
Kolik letů bylo zpožděných...
2.4. Simpsonův paradox 
... no vida? 
KLM AirFrance 
Ruzyň 2 z 6 1 ze 4 
Frankfurt 2 ze 2 12 z 16 
kdo je lepší 4 z 8 (50%) 13 z 20 (65%)
2.4. Simpsonův paradox 
Simpsonův paradox je statistický paradox při 
porovnání úspěšností dvou individuí (skupin) během 
více období, přičemž v jednotlivých obdobích je 
úspěšnější skupina A, ale celkově je úspěšnější 
skupina B. Paradox je pojmenovaný podle Edwarda 
Simpsona, který jej publikoval v roce 1951.[1] Protože 
jde o matematickou trivialitu, je prakticky jisté, že tento 
paradox byl pozorovaný možná staletí před ním, ale 
kvůli nepředstavitelné trivialitě ho nikdo nepublikoval. 
(http://cs.wikipedia.org/wiki/Simpson
2.5. Matoušův efekt 
In sociology, the Matthew effect (or accumulated 
advantage) is the phenomenon where "the rich get 
richer and the poor get poorer". In both its original and 
typical usage it is meant metaphorically to refer to 
issues of fame or status but it may also be used 
literally to refer to cumulative advantage of economic 
capital. (Wikipedia)
2.5. Matoušův efekt 
>1 0 a 1 
18% 
82% 
@tmobile_cze 
>1 0 a 1 
17% 
83% 
@o2_cz
2.5. Matoušův efekt 
>1 0 a 1 
49% 51% 
@radeksikorski 
(sample) 
>1 0 a 1 
51% 49% 
@Vodafone_cz 
(sample)
2.6. Bonus 
Social network analysis a profiling vlivných účtů pro 
@stunome...
3. Social Health Index 
SoHI aneb případová studie: Socialbakers a Lenovo
3. Social Health Index 
Vstupní požadavky: vytvořit metriku, která bude 
nakonec redukovatelná na jedno číslo, které zároveň 
bude mít smysl, zároveň bude umožňovat porovnat 
výkon kampaní v sociálních sítích s konkurencí, bude 
transparentní, bude umžňovat porovnání klastrů, 
půjde rozšířit a bude stabilní proti výkyvům. 
Proč? Protože současné obecné metriky (Klout a 
spol.) řadu těchto požadavků nesplňují
3. Social Health Index 
Obecně chce většina firem na sítích: 
získávat nové klienty a 
udržet si stávající a 
zapojit je a 
udělat z nich obhájce a 
měřit svůj výkon proti konkurenci a 
počítat finančně svůj výkon
3. Social Health Index 
P - participace 
A - akvizice 
R - retence 
S - sdílení 
a KPI plus shluky
3. Social Health Index
3. Social Health Index
3. Social Health Index
3. Social Health Index
3. Social Health Index
3. Social Health Index
3. Social Health Index 
Vypadá to jednoduše, že? 
Ale nakonec to bylo pět měsíců diskusí a vývoje. 
Speciální díky patří Elišce Hutníkové!
Král indexů....
4. Diskuse 
tedy pokud to technicky jde...
Děkuji za pozornost! 
@josefslerka

More Related Content

More from Josef Šlerka

Znaky, znaky, modely
Znaky, znaky, modelyZnaky, znaky, modely
Znaky, znaky, modelyJosef Šlerka
 
LLM a mixed methods v humanitních vědách
LLM a mixed methods v humanitních vědáchLLM a mixed methods v humanitních vědách
LLM a mixed methods v humanitních vědáchJosef Šlerka
 
Vliv AI na mediální trh
Vliv AI na mediální trhVliv AI na mediální trh
Vliv AI na mediální trhJosef Šlerka
 
Informační věda - Pravděpodobnosti
Informační věda - PravděpodobnostiInformační věda - Pravděpodobnosti
Informační věda - PravděpodobnostiJosef Šlerka
 
Informacni veda: Pocitace
Informacni veda: PocitaceInformacni veda: Pocitace
Informacni veda: PocitaceJosef Šlerka
 
Inforamační věda: Algoritmus
Inforamační věda: AlgoritmusInforamační věda: Algoritmus
Inforamační věda: AlgoritmusJosef Šlerka
 
Co je to datova novinarina
Co je to datova novinarinaCo je to datova novinarina
Co je to datova novinarinaJosef Šlerka
 
Algoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvodAlgoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvodJosef Šlerka
 
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...Josef Šlerka
 
Dezinformační weby a zpravodajství v ČR
Dezinformační weby a zpravodajství v ČRDezinformační weby a zpravodajství v ČR
Dezinformační weby a zpravodajství v ČRJosef Šlerka
 
INFOWAR IN CZECH REPUBLIC
INFOWAR IN CZECH REPUBLICINFOWAR IN CZECH REPUBLIC
INFOWAR IN CZECH REPUBLICJosef Šlerka
 
Česká média dnes aneb Pokus o kontext k aktuální debatě
Česká média dnes aneb Pokus o kontext k aktuální debatěČeská média dnes aneb Pokus o kontext k aktuální debatě
Česká média dnes aneb Pokus o kontext k aktuální debatěJosef Šlerka
 
Svět viděný cizíma očima
Svět viděný cizíma očimaSvět viděný cizíma očima
Svět viděný cizíma očimaJosef Šlerka
 
Do Birds of a Feather Flock Together?
Do Birds of a Feather Flock Together?Do Birds of a Feather Flock Together?
Do Birds of a Feather Flock Together?Josef Šlerka
 
Projekt Navigátor - datová část
Projekt Navigátor - datová částProjekt Navigátor - datová část
Projekt Navigátor - datová částJosef Šlerka
 
Stručná zpráva o jednom experimentu
Stručná zpráva o jednom experimentuStručná zpráva o jednom experimentu
Stručná zpráva o jednom experimentuJosef Šlerka
 
Wikipedie ve službách zla?!
Wikipedie ve službách zla?!Wikipedie ve službách zla?!
Wikipedie ve službách zla?!Josef Šlerka
 

More from Josef Šlerka (20)

Znaky, znaky, modely
Znaky, znaky, modelyZnaky, znaky, modely
Znaky, znaky, modely
 
LLM a mixed methods v humanitních vědách
LLM a mixed methods v humanitních vědáchLLM a mixed methods v humanitních vědách
LLM a mixed methods v humanitních vědách
 
Vliv AI na mediální trh
Vliv AI na mediální trhVliv AI na mediální trh
Vliv AI na mediální trh
 
Informační věda - Pravděpodobnosti
Informační věda - PravděpodobnostiInformační věda - Pravděpodobnosti
Informační věda - Pravděpodobnosti
 
Informacni veda: Pocitace
Informacni veda: PocitaceInformacni veda: Pocitace
Informacni veda: Pocitace
 
Inforamační věda: Algoritmus
Inforamační věda: AlgoritmusInforamační věda: Algoritmus
Inforamační věda: Algoritmus
 
Co je to datova novinarina
Co je to datova novinarinaCo je to datova novinarina
Co je to datova novinarina
 
Algoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvodAlgoritmy a sociální sítě - stručný úvod
Algoritmy a sociální sítě - stručný úvod
 
Atlas konspirací
Atlas konspiracíAtlas konspirací
Atlas konspirací
 
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
Parallel Polis Revisited: Way from concept of Parallel Polis to Distributed R...
 
Dezinformační weby a zpravodajství v ČR
Dezinformační weby a zpravodajství v ČRDezinformační weby a zpravodajství v ČR
Dezinformační weby a zpravodajství v ČR
 
INFOWAR IN CZECH REPUBLIC
INFOWAR IN CZECH REPUBLICINFOWAR IN CZECH REPUBLIC
INFOWAR IN CZECH REPUBLIC
 
Česká média dnes aneb Pokus o kontext k aktuální debatě
Česká média dnes aneb Pokus o kontext k aktuální debatěČeská média dnes aneb Pokus o kontext k aktuální debatě
Česká média dnes aneb Pokus o kontext k aktuální debatě
 
Svět viděný cizíma očima
Svět viděný cizíma očimaSvět viděný cizíma očima
Svět viděný cizíma očima
 
Do Birds of a Feather Flock Together?
Do Birds of a Feather Flock Together?Do Birds of a Feather Flock Together?
Do Birds of a Feather Flock Together?
 
Projekt Navigátor - datová část
Projekt Navigátor - datová částProjekt Navigátor - datová část
Projekt Navigátor - datová část
 
AI a žurnalistika
AI a žurnalistikaAI a žurnalistika
AI a žurnalistika
 
Stručná zpráva o jednom experimentu
Stručná zpráva o jednom experimentuStručná zpráva o jednom experimentu
Stručná zpráva o jednom experimentu
 
Volba a metoda
Volba a metodaVolba a metoda
Volba a metoda
 
Wikipedie ve službách zla?!
Wikipedie ve službách zla?!Wikipedie ve službách zla?!
Wikipedie ve službách zla?!
 

Data, informace, zákony a indexy

  • 1. Data, informace, zákony a indexy Josef Šlerka, Studia nových médií, Socialbakers
  • 2.
  • 3. Obsah 1. DIKW aneb obecný rámec 2. Zákony a paradoxy (a slepé cesty) 3. Social Heatlh Index - případová studie 4. Diskuse 5. Konec
  • 4. 1. DIKW Data, Information, Knowledge, Wisdom
  • 5.
  • 6. 2. Zákony a paradoxy (a také slepé cesty)
  • 7. Zákony a paradoxy 2.1. Medián a průměr 2.2. Zákon velkých čísel 2.3. Benfordův zákon 2.4. Simpsonův paradox 2.5. Matoušův efekt 2.6. Bonus
  • 8. 2.1. Medián a průměr Malá cesta v čase... To psal rok 2013 a my jsme s Eliškou Hutníkovou prezentovali data o českém Facebooku....
  • 9. Tisíce fanoušků má přeci každá stránka, tak proč my ne!
  • 10. Ověření analýza informací o FB stránkách přes API celkem indexujeme něco přes 23.000 stránek jen něco přes 11.000 bylo za poslední měsíc alespoň jednou aktivních pro analýzu jsme využili jen stránky aktivní v minulém měsící
  • 11.
  • 12.
  • 13. Zjištění průměrně má česká aktivní stránka 4.169 fanoušků median je 356, tedy více než 10x méně skoro 90 procent stránek na českém Facebooku má méně fanoušků než je průměr jen horních 7 procent jich má více než 10.000 v případě počtu fanoušků Facebook stránek je metrika průměru naprostej bullshit
  • 14. 2.1. Medián a průměr Medián je hodnota, jež dělí řadu vzestupně seřazených výsledků na dvě stejně početné poloviny. Ve statistice patří mezi míry centrální tendence. Platí, že nejméně 50 % hodnot je menších nebo rovných a nejméně 50 % hodnot je větších nebo rovných mediánu. Medián má smysl definovat pouze pro jednorozměrnou reálnou veličinu, jako je např. výška, hmotnost, výše mzdy atd. (Wikipedie)
  • 15. 2.1. Medián a průměr Aritmetický průměr je statistická veličina, která v jistém smyslu vyjadřuje typickou hodnotu popisující soubor mnoha hodnot. Aritmetický průměr se obvykle značí vodorovným pruhem nad názvem proměnné, popř. řeckým písmenem μ. Definice aritmetického průměru je (...) součet všech hodnot vydělený jejich počtem. V běžné řeči se obvykle obecným slovem průměr myslí právě aritmetický průměr. (Wikipedie)
  • 16. 2.2. Zákon velkých čísel Když máte fanoušky, kteří mají hodně followerů, asi jsou kvalitěnější (známější, vlivnější)...
  • 17. 2.2. Zákon velkých čísel Vezměme čtyři účty: @O2GuruCZ (cca 1.700) @o2_cz (cca 6.500) @tmobile_cze (cca 4.200) @Vodafone_cz (cca 32.400)
  • 19. 2.2. Zákon velkých čísel In probability theory, the law of large numbers (LLN) is a theorem that describes the result of performing the same experiment a large number of times. According to the law, the average of the results obtained from a large number of trials should be close to the expected value, and will tend to become closer as more trials are performed. (http://en.wikipedia.org/wiki/ Law_of_large_numbers)
  • 20. 2.3. Benfordův zákon Benfordův zákon je matematický zákon, který říká, že v mnoha souborech přirozených dat (ale ne ve všech) čísla mnohem častěji začínají číslicí 1 než na jiné číslice. Zhruba 30 % čísel začíná jedničkou. Čím vyšší je počáteční číslice, tím méně pravděpodobněji se na začátku čísel objevuje. (http://cs.wikipedia.org/wiki/ Benford%C5%AFv_z%C3%A1kon)
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29. 2.4. Simpsonův paradox KLM AirFrance Ruzyň 30% 25% Frankfurt 100% 75% kdo je lepší průměr 65%? průměr 50%? Kolik letů bylo zpožděných...
  • 30. 2.4. Simpsonův paradox ... no vida? KLM AirFrance Ruzyň 2 z 6 1 ze 4 Frankfurt 2 ze 2 12 z 16 kdo je lepší 4 z 8 (50%) 13 z 20 (65%)
  • 31. 2.4. Simpsonův paradox Simpsonův paradox je statistický paradox při porovnání úspěšností dvou individuí (skupin) během více období, přičemž v jednotlivých obdobích je úspěšnější skupina A, ale celkově je úspěšnější skupina B. Paradox je pojmenovaný podle Edwarda Simpsona, který jej publikoval v roce 1951.[1] Protože jde o matematickou trivialitu, je prakticky jisté, že tento paradox byl pozorovaný možná staletí před ním, ale kvůli nepředstavitelné trivialitě ho nikdo nepublikoval. (http://cs.wikipedia.org/wiki/Simpson
  • 32. 2.5. Matoušův efekt In sociology, the Matthew effect (or accumulated advantage) is the phenomenon where "the rich get richer and the poor get poorer". In both its original and typical usage it is meant metaphorically to refer to issues of fame or status but it may also be used literally to refer to cumulative advantage of economic capital. (Wikipedia)
  • 33. 2.5. Matoušův efekt >1 0 a 1 18% 82% @tmobile_cze >1 0 a 1 17% 83% @o2_cz
  • 34. 2.5. Matoušův efekt >1 0 a 1 49% 51% @radeksikorski (sample) >1 0 a 1 51% 49% @Vodafone_cz (sample)
  • 35. 2.6. Bonus Social network analysis a profiling vlivných účtů pro @stunome...
  • 36.
  • 37. 3. Social Health Index SoHI aneb případová studie: Socialbakers a Lenovo
  • 38. 3. Social Health Index Vstupní požadavky: vytvořit metriku, která bude nakonec redukovatelná na jedno číslo, které zároveň bude mít smysl, zároveň bude umožňovat porovnat výkon kampaní v sociálních sítích s konkurencí, bude transparentní, bude umžňovat porovnání klastrů, půjde rozšířit a bude stabilní proti výkyvům. Proč? Protože současné obecné metriky (Klout a spol.) řadu těchto požadavků nesplňují
  • 39. 3. Social Health Index Obecně chce většina firem na sítích: získávat nové klienty a udržet si stávající a zapojit je a udělat z nich obhájce a měřit svůj výkon proti konkurenci a počítat finančně svůj výkon
  • 40. 3. Social Health Index P - participace A - akvizice R - retence S - sdílení a KPI plus shluky
  • 47.
  • 48. 3. Social Health Index Vypadá to jednoduše, že? Ale nakonec to bylo pět měsíců diskusí a vývoje. Speciální díky patří Elišce Hutníkové!
  • 50. 4. Diskuse tedy pokud to technicky jde...
  • 51. Děkuji za pozornost! @josefslerka