10. Ověření
analýza informací o FB stránkách přes API
celkem indexujeme něco přes 23.000 stránek
jen něco přes 11.000 bylo za poslední měsíc
alespoň jednou aktivních
pro analýzu jsme využili jen stránky aktivní v
minulém měsící
11.
12.
13. Zjištění
průměrně má česká aktivní stránka 4.169
fanoušků
median je 356, tedy více než 10x méně
skoro 90 procent stránek na českém Facebooku
má méně fanoušků než je průměr
jen horních 7 procent jich má více než 10.000
v případě počtu fanoušků Facebook stránek je
metrika průměru naprostej bullshit
14. 2.1. Medián a průměr
Medián je hodnota, jež dělí řadu vzestupně
seřazených výsledků na dvě stejně početné poloviny.
Ve statistice patří mezi míry centrální tendence. Platí,
že nejméně 50 % hodnot je menších nebo rovných a
nejméně 50 % hodnot je větších nebo rovných
mediánu. Medián má smysl definovat pouze pro
jednorozměrnou reálnou veličinu, jako je např. výška,
hmotnost, výše mzdy atd. (Wikipedie)
15. 2.1. Medián a průměr
Aritmetický průměr je statistická veličina, která v jistém
smyslu vyjadřuje typickou hodnotu popisující soubor
mnoha hodnot. Aritmetický průměr se obvykle značí
vodorovným pruhem nad názvem proměnné, popř.
řeckým písmenem μ. Definice aritmetického průměru
je (...) součet všech hodnot vydělený jejich počtem. V
běžné řeči se obvykle obecným slovem průměr myslí
právě aritmetický průměr. (Wikipedie)
16. 2.2. Zákon velkých čísel
Když máte fanoušky, kteří mají hodně followerů, asi
jsou kvalitěnější (známější, vlivnější)...
17. 2.2. Zákon velkých čísel
Vezměme čtyři účty:
@O2GuruCZ (cca 1.700)
@o2_cz (cca 6.500)
@tmobile_cze (cca 4.200)
@Vodafone_cz (cca 32.400)
19. 2.2. Zákon velkých čísel
In probability theory, the law of large numbers (LLN) is
a theorem that describes the result of performing the
same experiment a large number of times. According
to the law, the average of the results obtained from a
large number of trials should be close to the expected
value, and will tend to become closer as more trials
are performed. (http://en.wikipedia.org/wiki/
Law_of_large_numbers)
20. 2.3. Benfordův zákon
Benfordův zákon je matematický zákon, který říká, že
v mnoha souborech přirozených dat (ale ne ve všech)
čísla mnohem častěji začínají číslicí 1 než na jiné
číslice. Zhruba 30 % čísel začíná jedničkou. Čím vyšší
je počáteční číslice, tím méně pravděpodobněji se na
začátku čísel objevuje. (http://cs.wikipedia.org/wiki/
Benford%C5%AFv_z%C3%A1kon)
21.
22.
23.
24.
25.
26.
27.
28.
29. 2.4. Simpsonův paradox
KLM AirFrance
Ruzyň 30% 25%
Frankfurt 100% 75%
kdo je lepší průměr 65%? průměr 50%?
Kolik letů bylo zpožděných...
30. 2.4. Simpsonův paradox
... no vida?
KLM AirFrance
Ruzyň 2 z 6 1 ze 4
Frankfurt 2 ze 2 12 z 16
kdo je lepší 4 z 8 (50%) 13 z 20 (65%)
31. 2.4. Simpsonův paradox
Simpsonův paradox je statistický paradox při
porovnání úspěšností dvou individuí (skupin) během
více období, přičemž v jednotlivých obdobích je
úspěšnější skupina A, ale celkově je úspěšnější
skupina B. Paradox je pojmenovaný podle Edwarda
Simpsona, který jej publikoval v roce 1951.[1] Protože
jde o matematickou trivialitu, je prakticky jisté, že tento
paradox byl pozorovaný možná staletí před ním, ale
kvůli nepředstavitelné trivialitě ho nikdo nepublikoval.
(http://cs.wikipedia.org/wiki/Simpson
32. 2.5. Matoušův efekt
In sociology, the Matthew effect (or accumulated
advantage) is the phenomenon where "the rich get
richer and the poor get poorer". In both its original and
typical usage it is meant metaphorically to refer to
issues of fame or status but it may also be used
literally to refer to cumulative advantage of economic
capital. (Wikipedia)
34. 2.5. Matoušův efekt
>1 0 a 1
49% 51%
@radeksikorski
(sample)
>1 0 a 1
51% 49%
@Vodafone_cz
(sample)
35. 2.6. Bonus
Social network analysis a profiling vlivných účtů pro
@stunome...
36.
37. 3. Social Health Index
SoHI aneb případová studie: Socialbakers a Lenovo
38. 3. Social Health Index
Vstupní požadavky: vytvořit metriku, která bude
nakonec redukovatelná na jedno číslo, které zároveň
bude mít smysl, zároveň bude umožňovat porovnat
výkon kampaní v sociálních sítích s konkurencí, bude
transparentní, bude umžňovat porovnání klastrů,
půjde rozšířit a bude stabilní proti výkyvům.
Proč? Protože současné obecné metriky (Klout a
spol.) řadu těchto požadavků nesplňují
39. 3. Social Health Index
Obecně chce většina firem na sítích:
získávat nové klienty a
udržet si stávající a
zapojit je a
udělat z nich obhájce a
měřit svůj výkon proti konkurenci a
počítat finančně svůj výkon
40. 3. Social Health Index
P - participace
A - akvizice
R - retence
S - sdílení
a KPI plus shluky