Aktywność i popularność w real time web na przykładzie Blipa – wyniki badań - Mikołaj Hnatiuk, Michał Podlewski, Jan Zając
1. Aktywność i popularność
w Real Time Web
na przykładzie Blipa
– wyniki badań
Mikołaj Hnatiuk*, Michał Podlewski*, dr Jan Zając**
(* Instytut Socjologii UW i GG Network)
(** Wydział Psychologii UW i GG Network)
Warszawa, 3 grudnia 2009
2. O czym powiemy?
• Popularność użytkowników i tagów – reguła Pareto
• Zmiany w czasie
• Zaangażowanie w serwis
• Aktywność „starych” i „nowych” użytkowników
• Co zrobić żeby być popularnym?
3. Blip.pl
Serwis mikrobloggingowy:
• 634 tys. Unique Users (listopad 2009)
• 322 tys. Real Users (Megapanel Gemius/PBI,
wrzesień 2009)
• 73,7 tys. zarejestrowanych użytkowników
• 27,2 tys. użytkowników obserwujących co najmniej 1
użytkownika
• (wyłączyliśmy z analiz obserwowanie użytkownika Blip)
4. Metoda analizy
• Pełne dane z historii serwisu (marzec 2008-październik 2009)
• Badanie całej populacji osób i zdarzeń
• Podejście ilościowe:
• Analiza logów serwera bazy danych
• Analiza sieci społecznych
5. POPULARNOŚĆ
Wszechobecna reguła Pareto:
• 80% subskrypcji przypada na 20% najbardziej
popularnych użytkowników
• 94% ustawień tagów przypada na 20%
najpopularniejszych
Obserwowanie jest odwzajemnione w 35%
przypadków
11. Popularność tagów - obserwowanie
(top 20 najczęściej obserwowanych)
1. drogiblipie 707 11. apple 380
2. mac 579 12. warszawa 375
3. ankieta 474 13. ciastkodnia 356
4. f1 438 14. pokacycki 349
5. blipdnia 435 15. linux 342
6. wstydliwewyznania 434 16. google 340
7. iphone 429 17. slucham 323
8. nocnemarki 418 18. php 320
9. pokakota 394 19. film 305
10. design 383 20. foto 304
12. Liczba obserwujących użytkownika
– zróżnicowanie popularności
90%
Liczba obserwujących
80%
1-5 21573
% wszystkich użytkowników
70%
6-10 2219
60%
11-15 1026
50% 16-20 600
u
21-50 1335
40%
51-100 538
30%
19 101-500 304
takich
20% 500+ 19
10%
0%
1-5 6-10 11-5 16-5 21-5 51-5 101-5 więcej niż 500
śledzących śledzących śledzących śledzących śledzących śledzących śledzących śledzących
Liczba osób śledzących użytkownika
13. Sieć 20 najpopularniejszych
użytkowników
• Strzałka oznacza obserwowanie danego użytkownika,
• Liczba – łączną liczbę osób obserwujących danego użytkownika
14.
15. ZMIANY W CZASIE
• Wzrost liczby relacji szybszy niż wzrost liczby
użytkowników
• Intensywny wzrost liczby użytkowników, relacji i
statusów
• Wzrost opisuje model wykładniczy
• Najwięcej statusów ustawionych przez WWW i API
16. Rozwój serwisu – użytkownicy i relacje
600000
449745
500000
400000
300000
199648
200000
100000
73671
36987
0
sierpień
październik
listopad
grudzień
luty
sierpień
październik
listopad
grudzień
luty
sierpień
październik
lipiec
lipiec
lipiec
styczeń
styczeń
maj
maj
czerwiec
marzec
czerwiec
marzec
czerwiec
wrzesień
kwiecień
wrzesień
kwiecień
wrzesień
2007 2008 2009
Liczba wszystkich zarejestrowanych użytkowników Liczba wszystkich stworzonych relacji
• Liczba relacji obserwowania rośnie o wiele szybciej niż liczba
użytkowników
18. Model wzrostu serwisu
• Liczba relacji rośnie o wiele szybciej
• Wzrosty obydwu wielkości opisuje model wykładniczy
Liczba użytkowników Liczba relacji obserwacji
90000
600000
80000 y= 1598,6e0,1341x y = 4617,9e0,1623x
70000
R² = 0,9697
500000
R² = 0,9882
60000 400000
50000
300000
40000
30000 200000
20000
100000
10000
0
0
Kolejne miesiące od założenia serwisu
Kolejne miesiące od założenia serwisu
Liczba wszystkich stworzonych relacji Krzywa wykładnicza
Liczba użytkowników Krzywa wykładnicza
22. Pisanie pierwszych statusów
70%
66%
• 53% wszystkich użytkowników ustawiło
60%
przynajmniej 1 status
• Kiedy użytkownik zaczyna pisać?
50%
• W pierwszych 2 godzinach od rejestreacji
40% • W pierwszych dniach
• Albo wcale…
30%
20%
10%
10%
7%
5%
3% 4%
3% 2%
0%
poniżej 2h 2h - 1 dzien 1-3 dni 3-7 dni 7-14 dni 14-31 dni 31-90 dni ponad 90 dni
23. Czas dołączenia a przywiązanie do serwisu
100%
51,1% 8,0%
90%
37,5% 46,9% 32,6% 24,4%
80% 53,8% 51,5%
70%
67,6% 38,8% 54,0% 53,7%
60%
81,5%
50% 84,6% 2,9% 11,4%
8,4%
40% 4,7% 60,2%
60,7%
30%
46,8% 51,4% 38,9%
20% 33,2%
37,0% 33,2%
10% 21,4% 25,4%
12,5% 35,5%
0%
27,1%
październik
październik
październik
lipiec
lipiec
lipiec
sierpień
listopad
grudzień
luty
sierpień
listopad
grudzień
luty
sierpień
maj
maj
maj
marzec
czerwiec
marzec
czerwiec
marzec
czerwiec
kwiecień
wrzesień
styczeń
kwiecień
wrzesień
styczeń
kwiecień
wrzesień
2007 2008 2009
Korzystający krócej niż 7 dni Korzystający między 7 a 14 dni Korzystający między 14 a 30 dni
Korzystający między 30 a 90 dni Korzystający ponad 90 dni
• Utrzymywanie się w serwisie rozumiemy jako liczba dni, które upłynęły od pierwszego do
ostatniego ustawienia statusu
• Ostatnie miesiące 2009 są niemiarodajne ze względu na brak stosownej perspektywy czasowej
24. 100%
8,0%
90% 51,1% 24,4%
37,5% 46,9% 32,6%
80% 53,8% 51,5%
70% 38,8%
67,6% 54,0% 53,7%
60%
81,5%
50% 84,6% 2,9%
11,4%
8,4%
40% 4,7% 60,2%
60,7%
30%
51,4%
46,8% 38,9%
20% 33,2%
37,0% 33,2%
25,4%
10%21,4% 35,5%
12,5% 27,1%
0%
lipiec
lipiec
lipiec
sierpień
październik
luty
sierpień
październik
luty
sierpień
październik
marzec
marzec
marzec
kwiecień
wrzesień
listopad
grudzień
styczeń
kwiecień
wrzesień
listopad
grudzień
styczeń
kwiecień
wrzesień
maj
maj
maj
czerwiec
czerwiec
czerwiec
2007 2008 2009
Korzystający krócej niż 7 dni Korzystający między 7 a 14 dni Korzystający między 14 a 30 dni
Korzystający między 30 a 90 dni Korzystający ponad 90 dni
25. Odsetek użytkowników zarejestrowanych w
danym miesiącu publikujących statusy miesiącach
• Ilu spośród użytkowników, którzy dołączyli w danym miesiącu,
ustawiało statusy w kolejnych miesiącach?
• Na dłużej 10% - 20% dołączających użytkowników
• Rezygnacja z reguły na przestrzeni pierwszego miesiąca
26. Kształtowanie aktywności w miarę korzystania z serwisu
• Średnia liczba statusów stabilizuje się na podobnym poziomie niezażnie od momentu
dołączania do serwisu
• Dane dotyczą użytkowników tylko tych użytkowników, którzy byli aktywni w danym
miesiącu
• Czyli co prawda spada liczba użytkowników ale wzrasta aktywność tych, którzy
pozostają
27. Aktywność użytkowników w zależności od czasu
dołączenia do serwisu
16,00
ustawianych tygodniowo 14,74
Średnia liczba statusów
14,00
11,88
12,00
11,25
9,72 10,09
10,00 9,30 9,22
8,26 8,66
8,08 8,16
8,00 7,43 7,72
6,92
6,16 6,62
6,00
rednia
4,82
4,00
2,00
0,00
sierpień
październik
dziernik
listopad
grudzień
luty
sierpień
październik
dziernik
listopad
grudzień
luty
sierpień
październik
dziernik
marzec
czerwiec
lipiec
marzec
czerwiec
lipiec
marzec
czerwiec
lipiec
wrzesień
styczeń
wrzesień
styczeń
wrzesień
maj
maj
maj
kwiecień
kwiecień
kwiecień
2007 2008 2009
• Dane dotyczą użytkowników aktywnych przez 7 dni lub dłużej
• Podobny wzorzec dla użytkowników „starych” i „nowych”
29. Podsumowanie
• Popularność użytkowników i tagów – reguła Pareto
• Zmiany w czasie
• Zaangażowanie w serwis
• Aktywność „starych” i „nowych” użytkowników
• Co zrobić żeby być popularnym?