SlideShare a Scribd company logo
Távközlési adatok vizsgálata a leíró
statisztika módszereinek segítségével
(csoportos házi dolgozat a „Statisztikai Elemzés” című tantárgyból)
Készítették:
Pénzügy Mesterképzés – Levelező tagozat
N02-es kurzus hallgatói:
Jánik Renáta (PE3W41)
Maticsák László (L3QIE2)
Miklós Péter (DHTYA2)
Szabó Attila Pekka (EU6MIN)
Zöldi Balázs (ZUB9CF)
2014
2
Tartalomjegyzék
I. Bevezetés ...................................................................................................................... 3
I.I Mintavétel ....................................................................................................................................... 3
II. Becslés.......................................................................................................................... 4
II.I Várható érték becslése................................................................................................................... 4
II.II Aránybecslés.................................................................................................................................. 5
II.III Szórásbecslés................................................................................................................................ 6
III. Hipotézisvizsgálat ........................................................................................................ 7
III.I Egymintás hipotézisvizsgálat......................................................................................................... 7
III.II Kétmintás hipotézisvizsgálat ........................................................................................................ 7
III.III Illeszkedésvizsgálat...................................................................................................................... 9
IV. Korreláció és regresszió ............................................................................................. 12
IV.I Korreláció .................................................................................................................................... 12
IV.II Lineáris regresszió...................................................................................................................... 13
IV.III Exponenciális és hatványos regresszió...................................................................................... 14
IV.IV Többváltozós regresszió............................................................................................................ 15
V. Összefoglalás.............................................................................................................. 17
Táblázatok jegyzéke:....................................................................................................... 19
Felhasznált Irodalom....................................................................................................... 19
Mellékletek .................................................................................................................... 20
3
I. Bevezetés
A mobil távközlési szektor a 90-es évek első felében jelent meg először Magyarországon,
egy teljesen új szolgáltatás kínálva a fogyasztók számára. Az elmúlt húsz év során a
telekommunikáció az egyik legdinamikusabban fejlődő iparággá nőtte ki magát, és e
szolgáltatások mára hétköznapok elengedhetetlen részeként vannak jelen. 1994-ben a két első
komoly digitális szolgáltatásokat nyújtó vállalat megjelenésével a mobiltelefon piac nem várt
növekedésnek indult, 1999-re a két szolgáltató előfizetéseinek száma elérte az 1 milliót, 2009-
ben ugyanez- a KSH adatai szerint – meghaladja a 11,7 milliót, ahol eléri a piac felvevő
képességének határait. Az ezt követő időszakban egészen napjainkig az előfizetések számát
tekintve stagnálás jellemzi az 1999 óta háromszereplős piacot. Ugyanez nem mondható el a
felhasználók összetételét illetően, hiszen high-tech iparág lévén az elérhető szolgáltatások
folyton bővülnek és megújulnak a ma már széles körben ismert és használt 4G/LTE hálózatot
alkalmazó „okos-telefonokon” át a machine to machine szolgáltatásokig (KSH, 2012).
A fentiekből jól érzékelhető, hogy egy jellemzően már nem növekvő piacon, de mégis
folyamatosan változó trendeket diktáló piacról van szó, ahol elengedhetetlen az iparágban
tevékenységet folytató vállalatok számára, hogy naprakész információval rendelkezzenek a
fogyasztói szokások és elvárásokat illetően. Ehhez nem elegendő megfelelő adatok
megszerzése, szükséges azok megfelelő elemzése és értelmezése. Egy profit orientált vállalat
stratégiai marketing, vagy fogyasztás ösztönzési döntéseinek előkészítése során a pénzügyi
megalapozottság mellett, legalább olyan fontos szerepet játszik a statisztikai adatok
megismerése, megfelelő következtetések levonása és azok helyes felhasználása.
A statisztika eszköztára két területre bontható: leíró statisztika és következtető statisztika.
Legfőbb eszközei a becslés, a hipotézisvizsgálat valamint a korreláció és regresszió számítás.
A felsorolt elemzési módszerekben közös, hogy az alapsokaságra megfogalmazott állítások,
akkor adnak valósághű képet, ha a részsokaság (minta) olyan módon lett kiválasztva, mely
garantálja, hogy az eljárás végeredménye véletlen minta legyen. Így a számítások mellett a
mintavételi eljárás is röviden ismertetésre kerül.
I.I Mintavétel
A kutatáshoz egy a magyarországi piacon is versenyző telekommunikációs vállalat adatai
kerültek felhasználásra, és a mobil előfizetők fogyasztói szokásait vizsgáltuk az egy főre jutó
havi átlagos költés és a mobiltelefon internet forgalom alapján. A rendelkezésre álló adatok
4
alapján ismerjük ez egyes ügyfelek életkorát, nemét és, hogy szerződéses előfizető vagy
feltöltőkártyás felhasználó-e.
A vállalat adatbázisában a 2013-as üzleti évre 2,7 millió mobiltelefon szolgáltatással
rendelkező aktív szerződés szerepelt. Az ügyfelek adatait egy az értékesítés támogatására
felállított adattárház tartalmazza, amely alkalmas az adatokban való lefúrásra, és különböző
aggregáltsági szinten való elemzésére. Az elemzéshez szükséges mintához előfizetés szinten
aggregált havi átlagos árbevétel és internet forgalmi adatok kerültek lekérdezésre. Az egyes
előfizetések a szerződés számok alapján megkülönböztethetőek. A szerződések egyedi
azonosítójának generálásakor nem tartanak szem előtt a beszédességet elősegítő
karakterválasztást, azaz a szerződés számok és a szerződő ügyfél adatai vagy a szerződésben
foglaltak között sztochasztikus kapcsolat nem áll fenn. Ez lehetőséget teremt a teljes listából
való szisztematikus kiválasztás elvégzésére, amely során egy 100 elemű minta került
összeállításra a következő módon:
A teljes listánk szerződés szám szerint sorba rendezésre kerül, amely összesen 2.710.703
darabszerződést tartalmaz. Ez alapján az alkalmazott lépésköz a következő: k = [N/n] =
2.710.703/100 = 27.107. Az excel RANDBETWEEN függvénye segítségével megkeressük a
minta első elemét: k0=RANDBETWEEN(1;27107)= 4508, így a további kiválasztásra kerülő
elemeket a következő képletbe helyettesítve kapjuk meg: kn= 4508 + n× 27107. Az így kapott
mintát az első számú melléklet teljes egészében tartalmazza.
II. Becslés
A következtető statisztika becslés módszerén keresztül lehetőség nyílik arra, hogy a
mintát felhasználva az alapsokaságra vonatkozó állítások kerüljenek megfogalmazásra.
Fontos megjegyezni, hogy 100%-ig pontos állítást az alapsokaságra nem lehet
megfogalmazni, de a módszer segítségével az elkövetett statisztikai hiba mértéke
számszerűsíthető.
II.I Várható érték becslése
A minta felhasználásával, először becsüljük meg, az átlagos árbevételt (vagyis az
árbevétel várható értékét), 98%-os megbízhatósági szint mellett. Az Excel Adatelemzés/Leíró
Statisztika eszközével a várható érték konfidenciaszintjét megadva gyakorlatilag megkapjuk a
végeredményt, az alábbiak szerint:
5
1. tábla: Az árbevétel várható értékének becslése
A kiemelt adatok segítségével meghatározható a keresett érték intervallumának alsó és
felső határa (a táblában dőlt betűvel). A táblát értelmezve: A minta alapján a szerződéseken
képződő árbevétel 98%-os valószínűséggel 2828,88 Ft és 4211,31 Ft között lesz. Amennyiben
ismert az alapsokaság elemszáma, úgy az adatokat felhasználva lehetőség nyílik az
értékösszeg becslésére is. A táblából leolvasható, hogy a becslés során elkövetett hiba átlagos
mértéke 313,47 Ft, és a becsléses eljárás okozta eltérés maximális értéke 741,22 Ft. (Mindez
98%-os megbízhatósági szinten)
II.II Aránybecslés
Valószínűsíthető, hogy a szerződéses ügyfeleken keresztül nagyobb árbevételt lehet
realizálni, ezért fontos, hogy a társaság tisztában legyen a szerződéses ügyfelek arányával az
alapsokaságban. A mintából a következők alapján megbecsülhető a keresett arány 98%-os
valószínűség mellett. A számítás menete a következő:
2. tábla: Szerződéses ügyfelek arányának becslése
A megoldás során érdemes kiemelt figyelmet fordítani arra, hogy habár a Zp értéke
meghatározható a megfelelő excel függvény segítségével, de a Standard Normális eloszlás
függvénye esetében valószínűségként nem α-t kell megadni (mint a Student féle t-eloszás
Árbevétel (Ft)
Várható érték 3570,1
Standard hiba 313,465462
Medián 2205
Módusz 13400
Szórás 3134,65462 Alsóh: 2828,88
Minta varianciája 9826059,59 Felsőh: 4311,32
Csúcsosság 1,05294702
Ferdeség 1,28899984
Tartomány 12950
Minimum 450
Maximum 13400
Összeg 357010
Darabszám 100
Konfidenciaszint(98,0%) 741,222266
n(szerződéses): 55 1-α/2: 0,99 Sp: 0,0497 max hiba: 0,116
n: 100 Z0,99: 2,33 Alsó H: 43,4%
p: 0,55 Felső H: 66,6%
6
függvény esetében), hanem 1-α/2 értékét. A tábla alapján: A szerződéses ügyfelek aránya
98%-os megbízhatóság mellett 43,4% és 66,6% között van az alapsokaságban.
II.III Szórásbecslés
A mintából a várható értékhez, értékösszeghez és arányhoz hasonlóan a szórás is
megbecsülhető. Ennek bemutatása érdekében becsüljük meg az árbevétel szórását 98%-os
valószínűség mellett. Ekkor a mintából számított variancia mellett a Χ2
becslőfüggvény
megfelelő értékére is szükség lesz, illetve a függvény esetében külön számítani kell az alsó és
a felső határhoz tartozó értéket is (a Χ2
eloszlás ugyanis nem szimmetrikus).
3. tábla: Szórásbecslés
A leíró statisztika eszközével meghatározásra került a minta alapján számított variancia.
Ezt követően a becslőfüggvény értékei kerültek meghatározásra (alsó határnál 1-α/2, felső
határnál α/2). Kijelölésre került az értékekhez köthető komplementer (1-hez) szám is, ugyanis
az Excel „Inverz.Khi” függvényének sajátossága hogy a keresett valószínűséget 1-ből kivonva
kell megadni. Az így kapott számok segítségével már meghatározható a keresetszórás
intervalluma. 98%-os megbízhatóság mellett kijelenthető, hogy az árbevétel szórása 2688 Ft
és 3749 Ft között van. A megállapítást megerősíti, hogy a minta alapján számított szórás
(3135 Ft) a kijelölt intervallumban található. A megadott intervallum relatíve tágnak
nevezhető, szükséges megjegyezni, hogy a megbízhatósági szint csökkentésével a konfidencia
intervallum szűkíthető.
Árbevétel (Ft)
Komplementer Χ
2
Várható érték 3570,1 α/2: 0,01 0,99 69,22989
Standard hiba 313,46546 1-α/2: 0,99 0,01 134,6416
Medián 2205
Módusz 13400
Szórás 3134,6546 Alsó H: 2688
Minta varianciája 9826059,6 Felső H: 3749
Csúcsosság 1,052947
Ferdeség 1,2889998
Tartomány 12950
Minimum 450
Maximum 13400
Összeg 357010
Darabszám 100
7
III. Hipotézisvizsgálat
A hipotézisvizsgálat eszközén keresztül egy az alapsokaságra megfogalmazott állítást
kerül ellenőrzésre (tesztelésre), a mintán keresztül. Az állítás függvényében
megkülönböztethetünk egymintás, kétmintás, valamint paraméteres és nem paraméteres
próbát.
III.I Egymintás hipotézisvizsgálat
Vizsgáljuk meg 5%-os szignifikancia szint mellett, hogy az átlagos árbevétel 3600Ft-nál
nagyobb-e. Ebben az esetben a hipotézisvizsgálatot aszimptotikus Z-próbával végezzük el,
mivel a sokaság szórása és eloszlása nem ismert. Ekkor a hipotézisrendszer, valamint a
próbafüggvény értékének számítása az alábbiak szerint alakul:
ܼ =
௫̅ିఓబ
ೞ
√೙
H0:µ0≥3600 H1:µ1<3600 ‫ܪ‬଴
்
: ߤ = 3600
Bal oldali kritikus tartományunk lesz, vagyis az elfogadási tartomány alsó határát
szükséges kijelölnünk, így megkapjuk az elfogadási tartományt az alábbiak szerint:
Z1-α=Z1-0,05=Z0,95=1,65 E.T.: (1,65;∞)
A Z-próba függvény kiszámításához szükségünk van a mintabeli átlagra és szórásra. A
számított értékeket pedig behelyettesítjük a képletbe:
‫̅ݔ‬ = 3570‫ݐܨ‬ s=3118 n= 100
ܼ =
3570 − 3118
ଷଵଵ଼
√ଵ଴଴
=
452
311,8
= 1,45
Z-próbafüggvény értéke kívül esik az elfogadási tartományon, vagyis H0-t elutasítjuk és
H1-et elfogadjuk, vagyis az átlagos árbevétel 3600Ft alatt van 95%-os valószínűség mellett.
III.II Kétmintás hipotézisvizsgálat
Azt vizsgáljuk, hogy a kártyás ügyfelek adatforgalma magasabb-e átlagosan, mint a
szerződéses ügyfelek adatforgalma. A feltevésünk az, hogy a kártyás ügyfelek legalább
450mb-tal több adatot használnak, mint az előfizetéses ügyfelek (5%-os szignifikancia szint
mellett). A feladatmegoldás során a kártyás ügyfeleket 1-es, míg a szerződéses ügyfeleket 2-s
8
indexszel jelöljük Ennek megvizsgálásához szükségünk van egy táblázatra, ahol az
adatfelhasználást négy egyenlő osztályközre bontjuk.
Adatforgalom (Mb) Kártyás ügyfél
(y változó)db
Szerződéses ügyfél
(x változó)db
0-2000Mb 24 45
2000-4000Mb 22 7
4000-6000Mb 0 2
6000-8000Mb 0 1
Összesen - ∑ 46 55
4. tábla: Osztályközös gyakorisági sor az adatforgalomra
A vizsgálatot baloldali alternatív hipotézissel végezzük el,a hipotézisrendszer az alábbi
lesz:
H0:µ1-µ2=450 H1:µ1-µ2<450 ܼ =
ሺ௬തି௫̅ሻିఋబ
ඨ
ೞ೤
మ
೙೤
ା
ೞೣ
మ
೙ೣ
A δ0 tetszőleges, de nem előre meghatározott érték, jelen esetben 450. Amennyiben δ0
értéke 0, ez azt jelenti, hogy a null hipotézist elfogadjuk, vagyis a két átlag megegyezik. A
képletbe való számok behelyettesítéséhez szükségünk lesz a mintabeli átlagra és
szórásnégyzetekre.
ny=45 ‫ݕ‬ത =
ଵ଴଴଴௫ଶସାଷ଴଴଴௫ଶଶ
ସ଺
= 1956,52
‫ݏ‬௬ =
ඥሺ1000 − 1956ሻଶ ∗ 24 + ሺ3000 − 1956ሻଶ ∗ 22
46 − 1
=
6447
45
= 143,26
nx=55 ‫̅ݔ‬ =
ସହ௫ଵ଴଴଴ାଷ଴଴଴௫଻ାହ଴଴଴௫ଶା଻଴଴଴௫ଵ
ହହ
= 1509,09
‫ݏ‬௫ =
ඥሺ1000 − 1509ሻଶ ∗ 45 + ሺ3000 − 1509ሻଶ ∗ 7 + ሺ5000 − 1509ሻଶ ∗ 2 + ሺ7000 − 1509ሻଶ
55 − 1
=
9041,32
54
= 167,43
Bal oldali próba lévén az alsó határ kijelölése szükséges az elfogadási tartomány definiálása
érdekében. A tartomány: (-1,96;∞)
ܼ =
ሺ1956,52 − 1509,09ሻ − 450
ට
ଵସଷ,ଶ଺మ
ସହ
+
ଵ଺଻,ସଷమ
ହହ
=
−2,57
ඥ456,07 + 509,68
=
−2,57
31,06
= −0,0827
9
A próbafüggvény értéke: -0,0827, vagyis az elfogadási tartományba esik. Megállapíthatjuk,
hogy a kártyás ügyfelek átlagosan több mint 450Mb-al több adatforgalmat használnak fel
95%-os megbízhatósági szint mellett.
Az Excel adatelemzés eszközével további kétmintás hipotézis vizsgálatok is egyszerűen
elvégezhetőek. Vizsgáljuk meg 95%-os szignifikancia szint mellett, hogy igaz-e az állítás,
mely szerint a szerződéses ügyfelek esetében az árbevétel több mint 1500 Ft-tal nagyobb,
mint a kártyás szerződők esetében. Jelölje 1-es a szerződéses, 2-es pedig a kártyás ügyfeleket.
Ekkor a hipotézisrendszer:
és
Az adatelemzés eszköztárából a kétmintás t-próbát alkalmazva az alábbi output táblát
kapjuk, melyből az eredmények leolvashatóak:
5. tábla: kétmintás t-próba az Excel adatelemzésével készítve
A táblából leolvasható, hogy nincs olyan szignifikancia szint, mely mellett a H0
hipotézis elfogadható lenne (kiemelve, P egyszélű). A hipotézisrendszer szerint a teszt
jobboldali alternatív hipotézis segítségével került elvégzésre, vagyis az elfogadási tartomány
felső határát kell meghatározni. A tábla alapján 1,67, melynél a próbafüggvény értéke, 6,03
nagyobb így a H0-t elutasítjuk. Vagyis 95%-os valószínűséggel állíthatjuk, hogy a szerződéses
ügyfelek esetében az árbevétel több mint 1500 Ft-tal magasabb, mint a kártyás ügyfelek
esetében.
III.III Illeszkedésvizsgálat
A Hipotézisvizsgálat eszköztárán keresztül lehetősségünk nyílik annak vizsgálatára,
hogy az adott minta alapján a sokaság eloszlása valamilyen nevezetes eloszlást követ-e. A
Kétmintás t-próba nem-egyenlő szórásnégyzeteknél
Változó 1 Változó 2
Várható érték 5428,363636 1298,889
Variancia 9707342,643 603011,2
Megfigyelések 55 45
Feltételezett átlagos eltérés 1500
df 62
t érték 6,034058384
P(T<=t) egyszélű 0,00000%
t kritikus egyszélű 1,669804163
P(T<=t) kétszélű 0,0000%
t kritikus kétszélű 1,998971498
mintánkon keresztül vizsgáljuk meg, hogy az árbevétel eloszlása tekinthet
eloszlásnak. Az Excel/Adatelemzés eszközének segítségével az alábbi hisztogramot
készíthetjük el:
Az ábra alapján biztosan kijelenthet
normális eloszlást, erős baloldali aszimmetria figyelhet
lehet mindig hasonlóan egyértelm
igazoljuk a fentebb megfogalmazott állítást. A megbízhatósági szint 98%. Ekkor
feltételezzük, hogy az árbevétel normális eloszlást követ, míg az alternatív hipotézis szerint
van olyan osztályköz, mely nem felel meg az egyenletes eloszlás felté
hipotézisrendszer tehát:
A feladat során a mintából becsülnünk kell a sokasági várható értéket és szórást. Emiatt
a próbafüggvény szabadságfoka kilenc lesz, mert az osztályközök száma 11. (Az
osztályközök kialakítása az Adatelemzés/Hisztogra
kapcsolódó gyakoriságokat és a számított értékeket a következ
mintánkon keresztül vizsgáljuk meg, hogy az árbevétel eloszlása tekinthet
eloszlásnak. Az Excel/Adatelemzés eszközének segítségével az alábbi hisztogramot
6. tábla: Hisztogram az árbevétel alapján
Az ábra alapján biztosan kijelenthető, hogy az árbevétel alakulása nem követi a
s baloldali aszimmetria figyelhető meg. Azonban az ábra alapján nem
lehet mindig hasonlóan egyértelmű álláspontot kialakítani. Ezért számításon
igazoljuk a fentebb megfogalmazott állítást. A megbízhatósági szint 98%. Ekkor
feltételezzük, hogy az árbevétel normális eloszlást követ, míg az alternatív hipotézis szerint
van olyan osztályköz, mely nem felel meg az egyenletes eloszlás felté
A feladat során a mintából becsülnünk kell a sokasági várható értéket és szórást. Emiatt
a próbafüggvény szabadságfoka kilenc lesz, mert az osztályközök száma 11. (Az
osztályközök kialakítása az Adatelemzés/Hisztogram eszközzel készült). Az osztályközöket,
kapcsolódó gyakoriságokat és a számított értékeket a következő táblázat tartalmazza:
10
mintánkon keresztül vizsgáljuk meg, hogy az árbevétel eloszlása tekinthető-e normális
eloszlásnak. Az Excel/Adatelemzés eszközének segítségével az alábbi hisztogramot
, hogy az árbevétel alakulása nem követi a
meg. Azonban az ábra alapján nem
álláspontot kialakítani. Ezért számításon keresztül is
igazoljuk a fentebb megfogalmazott állítást. A megbízhatósági szint 98%. Ekkor
feltételezzük, hogy az árbevétel normális eloszlást követ, míg az alternatív hipotézis szerint
van olyan osztályköz, mely nem felel meg az egyenletes eloszlás feltételének, a
A feladat során a mintából becsülnünk kell a sokasági várható értéket és szórást. Emiatt
a próbafüggvény szabadságfoka kilenc lesz, mert az osztályközök száma 11. (Az
m eszközzel készült). Az osztályközöket,
táblázat tartalmazza:
11
7. tábla: A Χ2
próbafüggvény értékének meghatározása normális eloszlás tesztelése során
Az Illeszkedésvizsgálat minden esetben Χ2
próbafüggvénnyel és jobb oldali próbával
tesztelendő, így felső kritikus értéket kell meghatározni. Az Excel „Inverz.khi” függvényének
az érték kiszámításához a valószínűség komplementerét kell rögzíteni, ami jelen esetben 0,02.
Az osztályközök standardizálását követően meghatározásra kerültek a normális eloszlás
feltételezésével számított valószínűségek, melynek segítségével felírható a próbafüggvény.
Az elfogadási tartomány felső határa 19,68, míg a próbafüggvény értéke 101,43, vagyis az
alternatív hipotézist fogadjuk el. 98%-os valószínűség mellett az árbevétel eloszlása nem
követi a normális eloszlást. Vagyis a hisztogram segítségével megfogalmazott állítás igazolást
nyert.
Vizsgálható, hogy az árbevétel alakulása követi-e az egyenletes eloszlást. Ehhez az
árbevétel alapján készített hisztogram kiegészítésre kerül egy vonallal, mely az egyenletes
eloszlás esetén feltételezett gyakoriságokat jelöli. Mivel a hisztogram nem illeszkedik a
vonalra, belátható, hogy az árbevétel nem követi az egyenletes eloszlást sem. A kiegészített
hisztogram az alábbi:
Osztályköz Gyakoriság Pi Χ
2
-450 1 -1,0398 0,1492 0,1492 12,98763
451-1745 40 -0,6129 0,2700 0,1208 64,55539
1746-3040 17 -0,1859 0,4263 0,1563 0,120414
3040-4335 11 0,2411 0,5953 0,1690 2,059157
4336-5630 6 0,6681 0,7479 0,1527 5,627324
5630-6925 10 1,0950 0,8632 0,1153 0,202969
6926-8220 5 1,5220 0,9360 0,0727 0,71133
8221-9515 4 1,9490 0,9744 0,0384 0,007052
9516-10810 2 2,3759 0,9912 0,0169 0,05697
10811-12105 2 2,8029 0,9975 0,0062 3,05297
12106- 2 1 0,0025 12,05033
∑ 100 1 101,4315
μ: 3603,82 1-α : 19,67902
σ: 3032,97 0,98
8. tábla: A feltételezett egyenletes eloszlással kiegészített hisztogram az árbevétel alapján
IV. Korreláció és regresszió
A korreláció és regresszió számítás segítségével a különböz
közti kapcsolat számszerűsíthet
esetében végezzük el. A szűkített mintát a második számú melléklet tartalmazza.
IV.I Korreláció
Vizsgáljuk meg, hogy szerz
az árbevétel és az adatforgalo
(tömbfüggvény) alkalmazva az alábbi r értéket kapjuk (melyb
determinációs együttható):
A szerződéses ügyfelek esetében az árbevétel és az adatforgalom között pozitív
közepes erősségű kapcsolat figyelhet
magyaráz az árbevétel, a maradék 72% az egyéb, nem vizsgált tényez
szerződéses ügyfelek esetében.
. tábla: A feltételezett egyenletes eloszlással kiegészített hisztogram az árbevétel alapján
és regresszió
regresszió számítás segítségével a különböző (mennyiségi) ismérvek
űsíthetővé, leírhatóvá válik. A vizsgálatokat a szerz
űkített mintát a második számú melléklet tartalmazza.
Vizsgáljuk meg, hogy szerződéses ügyfelek esetében milyen kapcsolat f
az árbevétel és az adatforgalom értéke között. A Microsoft Exel „KORREL” függvényét
(tömbfüggvény) alkalmazva az alábbi r értéket kapjuk (melyből egyszerű
9. tábla: Az r és az r
2
mutató értéke
déses ügyfelek esetében az árbevétel és az adatforgalom között pozitív
kapcsolat figyelhető meg (r). Az adatforgalom szóródásából
magyaráz az árbevétel, a maradék 72% az egyéb, nem vizsgált tényez
déses ügyfelek esetében. A keresett értékek meghatározhatóak az Excel Adatelemzés
Mutató Érték
r(x;y) 0,52942
r
2
28%
12
. tábla: A feltételezett egyenletes eloszlással kiegészített hisztogram az árbevétel alapján
(mennyiségi) ismérvek
A vizsgálatokat a szerződéses ügyfelek
kített mintát a második számú melléklet tartalmazza.
déses ügyfelek esetében milyen kapcsolat figyelhető meg
xel „KORREL” függvényét
l egyszerűen előállítható a
déses ügyfelek esetében az árbevétel és az adatforgalom között pozitív irányú,
meg (r). Az adatforgalom szóródásából 28%-ot
magyaráz az árbevétel, a maradék 72% az egyéb, nem vizsgált tényezők hatása (r2
) a
A keresett értékek meghatározhatóak az Excel Adatelemzés-
13
Regresszió eszközével is, ekkor a keresett értékek az output táblából (az első táblából)
leolvashatóak (Kiemelve).
10. tábla: Regressziós statisztika az excel adatelemzés eszközével
IV.II Lineáris regresszió
Megállapításra került tehát, hogy az ismérvek között közepes erősségű kapcsolat áll
fent. A kapcsolat leírása a regresszió számítás eszközével valósítható meg. A feladatmegoldás
során az előbb ismertetett minta kerül felhasználásra. A regresszió számítás során az ismérvek
közti kapcsolat függvények segítségével kerül leírásra, megkülönböztethetünk Lineáris,
Hatványkitevős és exponenciális regresszió függvényt.
A lineáris regressziós függvény felírása érdekében szükséges, hogy a b0 és a b1 értékek
meghatározásra kerüljenek. Az Excel segítségével a feladat többféleképpen is megoldható. A
„LIN.ILL” tömbfüggvény alkalmazásával az alábbi értékeket kapjuk, melyből felírható a
lineáris függvény:
Ebből a függvény:
A b0 paraméter jelen esetben nem értelmezhető, így a függvény alapján azt mondhatjuk,
hogy ha az árbevétel 1 Ft-tal nő, akkor az adatforgalom 0,24 MB-tal lesz több. Az állítás
ekvivalens a következő állítással, ha az árbevétel 100 FT-tal növekszik, akkor az
adatforgalom várhatóan 24 MB-tal fog nőni a szerződéses ügyfelek esetében.
A korábban már említett adatelemző eszköz mindhárom output táblájának
értelmezésével is megoldható a feladat. A táblák ekkor a következőek:
Regressziós statisztika
r értéke 0,52942
r-négyzet 0,280285
Korrigált r-négyzet 0,266706
Standard hiba 1185,571
Megfigyelések 55
b1 b0
0,24 -174,29
14
11. tábla: Regressziós statisztika az excel adatelemzés eszközével készítve (mindhárom output tála)
A felső résztáblából leolvashatóak a korrelációelemzésnél tett megállapítások a
kapcsolat erősségére és irányára vonatkozóan. A második résztáblában az F szignifikanciája
mezőben látható, hogy amennyiben H0 Hipotézisben feltételeznék, hogy a két változó között
nincs kapcsolat, akkor gyakorlatilag nem lenne olyan szignifikancia szint, mely mellett a H0
állítás elfogatható lenne, így azt mondhatjuk, hogy van kapcsolat a két változó között, a
regresszió függvény szignifikáns.
A harmadik résztáblában látható a b0 és a b1 paraméterek értéke a Koefficiensek
oszlopban. (Tengelymetszet = b0 és X változó = b1). A p-érték oszlop alsó sorában láthatjuk,
hogy ha H0 hipotézis hogy az árbevétel nincs hatással az adatforgalomra, akkor ez az
alternatíva szintén elutasításra kerül, vagyis jelen esetben az adatforgalom valóban hatással
van a bérre, a b1 paraméter szignifikáns a szerződéses ügyfelek esetében. Az alsó (95%) és
felső (95%) oszlopok pedig kijelölik azon tartomány határait, melybe a megfelelő
paraméterek 95%-os valószínűség mellett kerülnek. Fontos megjegyezni, hogy az adatelemzés
– regresszió eszköz alkalmazása során lehetőség van a valószínűségi szint változtatására, a
tábla mindig a megadott megbízhatósági szint mellett jelöli ki a tartományokat. (Illetve
minden estben megadja külön 95%-os szint mellett is.)
IV.III Exponenciális és hatványos regresszió
Két ismérv közti kapcsolat leírásának eszköze lehet a lineáris regressziós függvény
mellett az exponenciális és hatványos regressziós függvény is. A vizsgálat tárgya az előző
feladathoz hasonlóan ismét az árbevétel és az adatforgalom közti kapcsolat. A probléma Excel
segítéségével grafikus úton megoldható. Ekkor a megfigyelések vizsgálni kívánt két
ismérvéből egy pont (más néven XY) diagramot készítünk. Az X tengelyre kerül a magyarázó
Regressziós statisztika
r értéke 0,52941995
r-négyzet 0,28028549
Korrigált r-négyzet0,266705966
Standard hiba 1185,570956
Megfigyelések 55
VARIANCIAANALÍZIS
df SS MS F F szignifikanciája
Regresszió 1 29011575,84 29011575,8 20,64031002 0,0000
Maradék 53 74495660,09 1405578,49
Összesen 54 103507235,9
Koefficiensek Standard hiba t érték p-érték Alsó 95% Felső 95% Alsó 95,0% Felső 95,0%
Tengelyme
tszet
-174,285279 323,3713449 -0,53896328 0,592169043 -822,8860442 474,31549 -822,88604 474,315486
X változó 1 0,23525486 0,051782199 4,5431608 0,000032 0,131392921 0,3391168 0,13139292 0,33911679
változó, jelen esetben az árbevétel, míg Y tengelyre az adatforgalom (függ
szerkesztőségét követően lehet
szerepel két 0 érték is az adatforgalom oszlopában, ezek
megoldhatóvá válik, ellenkező
lehetséges.) A műveletek eredményeképpen a következ
12. tábla: Az exponenciális és hatványos
Az ábrán megjelenik a determinációs együttható, valamint leolvashatóak a regressziós
függvények képletei. Az ábra alapján így az exponenciális függvény: Y=65,92e
b1 paraméter: 1,0003. Vagyis ha az árbevétel 1szeresére n
szorosára fog nőni a szerződéses ügyfelek esetében. A hatványos függvény: y=0,00002x
Ebben az esetben a b1 paraméter az elaszticitásnak felel meg, va
esetében, ha az árbevétel 1%-
rugalmasnak tekinthető). A számított determinációs együtthatókból megállapítható, hogy a
három függvény közül leginkább a hatványos függvé
kapcsolatot.
IV.IV Többváltozós regresszió
A többváltozós regresszió során különböz
történik. Vizsgáljuk meg, hogy a szerz
változó, jelen esetben az árbevétel, míg Y tengelyre az adatforgalom (függő
en lehetőség van a kívánt trendvonalak felvételére. (A mintában
szerepel két 0 érték is az adatforgalom oszlopában, ezeket 0,1 értékre módosítva a feladat
megoldhatóvá válik, ellenkező esetben hatványos és exponenciális trend felvétele nem
veletek eredményeképpen a következő ábrát kapjuk:
. tábla: Az exponenciális és hatványos regressziós függvények, a kapcsolódó determinációs együtthatók valamint a
kijelölt trendek
Az ábrán megjelenik a determinációs együttható, valamint leolvashatóak a regressziós
függvények képletei. Az ábra alapján így az exponenciális függvény: Y=65,92e
b1 paraméter: 1,0003. Vagyis ha az árbevétel 1szeresére nő, akkor a adatforgalom 1,0003
ődéses ügyfelek esetében. A hatványos függvény: y=0,00002x
paraméter az elaszticitásnak felel meg, vagyis a szerz
-kal nő, akkor az adatforgalom 1,98%-kal fog n
). A számított determinációs együtthatókból megállapítható, hogy a
három függvény közül leginkább a hatványos függvény írja le a két ismérv közötti
Többváltozós regresszió
A többváltozós regresszió során különböző paraméterek együttes hatásának vizsgálata
történik. Vizsgáljuk meg, hogy a szerződéses ügyfelek esetében az árbevétel a lakóhely, az
15
változó, jelen esetben az árbevétel, míg Y tengelyre az adatforgalom (függő változó). Az ábra
ség van a kívánt trendvonalak felvételére. (A mintában
et 0,1 értékre módosítva a feladat
esetben hatványos és exponenciális trend felvétele nem
regressziós függvények, a kapcsolódó determinációs együtthatók valamint a
Az ábrán megjelenik a determinációs együttható, valamint leolvashatóak a regressziós
függvények képletei. Az ábra alapján így az exponenciális függvény: Y=65,92e0,003X
. Ebből
, akkor a adatforgalom 1,0003-
déses ügyfelek esetében. A hatványos függvény: y=0,00002x1,9824
.
gyis a szerződéses ügyfelek
kal fog nőni (a változás
). A számított determinációs együtthatókból megállapítható, hogy a
ny írja le a két ismérv közötti
paraméterek együttes hatásának vizsgálata
déses ügyfelek esetében az árbevétel a lakóhely, az
16
életkor és az adatforgalom között milyen erősségű a fennálló kapcsolat. Ekkor az árbevételt
tekintjük eredményváltozónak, míg a másik hármat magyarázó változónak. Első lépésben
fontos, hogy a lakóhely értékeket mennyiségi ismérvé alakítsuk. A példában a vidéki ügyfelek
1-es kódot, míg a budapestiek 0-ást kapnak. A már említett Adatelemzés/ Regresszió eszköz
az alábbi eredményt adja:
13. tábla: Többváltozós regressziós statisztika az excel adatelemzés eszközével készítve (első két output tábla)
A két táblából látható, hogy a vizsgált ismérvek között közepes erősségű a kapcsolat (r),
és hogy a szerződéses ügyfelek esetében a lakóhely, az életkor és az adatforgalom együttesen
30,5%-ban magyarázzák az árbevétel alakulását. A korrigált többszörös determinációs
együttható pedig kifejezi, hogy ha a számításból kihagyjuk azt (azokat) a magyarázó
ismérveket, melyek az elemzés alapján nincsenek hatással az árbevételre, akkor a modellben
maradó változók 26,4%-ban magyarázzák majd az árbevétel alakulását. Állítsunk fel egy
hipotézisrendszert:
és
Ekkor a második táblából látható, hogy lényegében 0%-az a szignifikancia szint, mely
mellett a H0 elfogadható, így H1-et fogadjuk el, vagyis a globális regresszió szignifikáns, a
vizsgáltak közt van olyan elem, amelyik hat az árbevétel alakulására.
14. tábla: Többváltozós regressziós statisztika az excel adatelemzés eszközével készítve (harmadik output tábla)
ÖSSZESÍTŐ TÁBLA
Regressziós statisztika
r értéke 0,552503
r-négyzet 0,30526
Korrigált r-négyzet 0,264393
Standard hiba 2672,226
Megfigyelések 55
VARIANCIAANALÍZIS
df SS MS F F szignifikanciája
Regresszió 3 1,6E+08 53338749,15 7,469587291 0,000307912
Maradék 51 3,64E+08 7140789,319
Összesen 54 5,24E+08
Koefficiense
k
Standard
hiba
t érték p-érték Alsó 95% Felső 95% Alsó 95,0% Felső 95,0%
Tengelymetszet 2697,98772 1317,18864 2,04829 0,04570 53,62118 5342,35426 53,62118 5342,35426
Adatforgalom (Mb) (X1) 1,27137 0,27262 4,66350 0,00002 0,72406 1,81868 0,72406 1,81868
Életkor (X2) 35,44398 26,64402 1,33028 0,18934 -18,04611 88,93408 -18,04611 88,93408
Lakhelykód (X3) 16,30898 747,10282 0,02183 0,98267 -1483,56251 1516,18047 -1483,56251 1516,18047
17
Az eredmény harmadik (itt különválasztott) táblájából megállapítható, hogy mely
magyarázó váltózók vannak valóban hatással az eredményváltózóra (Árbevétel). Mind három
magyarázó változó esetében feltételezzük, hogy az adott változó nincs hatással az
eredményváltózóra (H0, 5%-os szignifikancia szinten). A megjelölt P-értékek alapján ezt a
hipotézist a lakóhelykód és az életkor esetében elfogadjuk (előbbinél 98,26%-os szintig,
utóbbinál 18,93%-os szintig H0 az elfogadandó) vagyis ezek a változók nincsenek hatással az
árbevételre a szerződéses ügyfelek esetében 95%-os valószínűséggel. Az adatforgalom
esetében azonban közelítőleg 0% az a szignifikancia szint, mely mellett a H0 elfogadható, így
az adatforgalom 5%-os szignifikancia szint mellett hatással van az árbevételre a szerződéses
ügyfelek esetében.
V. Összefoglalás
A feladat elemzése alapján megállapítható, hogy a statisztika nagyon nagy szerepet tölt
be a profitorientált telekommunikációs iparágakban. Magyarországon kiélezett a
telekommunikációs piac, amely mára telítődött és a stagnálás jeleit mutatja. Napról-napra
változnak a felhasználói és technikai trendek, ezért rendkívül fontosak a naprakész adatok. A
piaci pozíciók megtartásához és/vagy növeléséhez, a statisztikai módszerek alkalmazásával,
gyorsan és költséghatékonyan juthatunk olyan adatokhoz, amelyekkel hatékonyan alakíthatjuk
ki a például a vezető marketingstratégiát, mellyel ösztönözhetjük a fogyasztást.
A vizsgálat kezdeteként az excel RANDBETWEEN függvénye segítségével 2,7 millió
alap sokaságból kiválasztásra került egy olyan 100 elemű minta, melyet a továbbiakban
vizsgáltunk. Ezen minta alapján megállapítottuk, hogy a szerződéseken képződő árbevétel
98%-os valószínűséggel 2828,88 Ft és 4211,31 Ft között van.
A szerződéses ügyfeleken keresztül nagyobb árbevételt lehet realizálni, ezért fontos,
hogy a telekommunikációs társaság tisztában legyen a szerződéses ügyfelek arányával. Ennek
vizsgálatára használtuk az aránybecslés módszerét. Segítségével megállapítható, hogy az
előfizetéses ügyfelek aránya 98%-os megbízhatóság mellett 43,4% és 66,6% között van az
alapsokaságban.
A mintából a várható értékhez, értékösszeghez és arányhoz hasonlóan a szórás is
megbecsülhető. 98%-os megbízhatóság mellett kijelenthető, hogy az árbevétel szórása 2688
Ft és 3749 Ft között van.
A hipotézisvizsgálat eszközén keresztül egy, az alapsokaságra megfogalmazott állítást
tesztelhetjük a mintán keresztül. A vizsgálat során a Z-próba függvény értéke kívül esik a H0
18
elfogadási tartományon, ezért a H1-et fogadjuk el, vagyis az egymintás hipotézis vizsgálaton
keresztül 95%-os valószínűséggel meghatároztuk, hogy a szerződésenkénti átlagos árbevétel
3600 Ft alatt van.
A kétmintás hipotézis vizsgálattal 95%-os valószínűséggel megállíthatjuk, hogy a
szerződéses ügyfelek esetében az árbevétel több, mint 1500 Ft-tal magasabb, mint a kártyás
ügyfelek esetében.
Az árbevétel hisztogramjáról és az illeszkedésvizsgálat alapján biztosan kijelenthető,
hogy az árbevétel alakulása nem követi a normális eloszlást, erős baloldali aszimmetria
figyelhető meg.
A korreláció és regresszió számítás segítségével konstatáltuk, hogy a szerződéses
ügyfelek esetében az árbevétel és az adatforgalom között pozitív irányú, közepes erősségű
kapcsolat figyelhető meg (0,5297).
A többváltozós regresszió számítás során megvizsgáltuk, hogy a szerződéses ügyfelek
esetében milyen erősségű a fennálló kapcsolat az árbevétel, a lakóhely, az életkor és az
adatforgalom között. Ebben az esetben az árbevételt tekintjük eredményváltozónak. A
vizsgált ismérvek között közepes erősségű a kapcsolat (0,5525), és hogy a szerződéses
ügyfelek esetében a lakóhely, az életkor és az adatforgalom együttesen 30,5%-ban
magyarázzák az árbevétel alakulását. A hipotézist a lakóhelykód és az életkor esetében
elfogadjuk, vagyis ezek a változók nincsenek hatással az árbevételre a szerződéses ügyfelek
esetében 95%-os valószínűséggel.
19
Táblázatok jegyzéke:
1. tábla: Az árbevétel várható értékének becslése.............................................................................. 5
2. tábla: Szerződéses ügyfelek arányának becslése............................................................................. 5
3. tábla: Szórásbecslés............................................................................................................................. 6
4. tábla: Osztályközös gyakorisági sor az adatforgalomra ...................................................................... 8
5. tábla: kétmintás t-próba az Excel adatelemzésével készítve ......................................................... 9
6. tábla: Hisztogram az árbevétel alapján.............................................................................................. 10
7. tábla: A Χ2
próbafüggvény értékének meghatározása normális eloszlás tesztelése során ................ 11
8. tábla: A feltételezett egyenletes eloszlással kiegészített hisztogram az árbevétel alapján.............. 12
9. tábla: Az r és az r2
mutató értéke...................................................................................................... 12
10. tábla: Regressziós statisztika az excel adatelemzés eszközével ...................................................... 13
11. tábla: Regressziós statisztika az excel adatelemzés eszközével készítve (mindhárom output tála) 14
12. tábla: Az exponenciális és hatványos regressziós függvények, a kapcsolódó determinációs
együtthatók valamint a kijelölt trendek................................................................................................. 15
13. tábla: Többváltozós regressziós statisztika az excel adatelemzés eszközével készítve (első két
output tábla)........................................................................................................................................... 16
14. tábla: Többváltozós regressziós statisztika az excel adatelemzés eszközével készítve (harmadik
output tábla)........................................................................................................................................... 16
Felhasznált Irodalom
Korpás Attiláné dr.: Általános statisztika I., Nemzeti Tankönyvkiadó, 2003
Sándorné Dr. Kriszt Éva, Varga Edit, Veitzné Kenyeres Erika, Korpás Attiláné Dr.. (szerk.):
Általános Statisztika II.(Nemzeti Tankönyvkiadó, Budapest 1997)
Központi Statisztikai Hivatal: Statisztikai évkönyv, 2012
20
Mellékletek
1. számú melléklet: A feladatmegoldás során használt minta (teljes):
Nem Életkor Budapest/Vidék Előfizetés/Feltöltő kártyás Árbevétel (Ft) Adatforgalom (Mb)
F 36 Vidék szerződéses 4 480 423
N 24 Budapest szerződéses 6 310 1 320
N 50 Vidék szerződéses 5 750 334
N 40 Vidék szerződéses 13 400 340
F 24 Vidék szerződéses 1 670 0
N 25 Vidék szerződéses 4 210 550
F 59 Budapest szerződéses 5 760 140
N 63 Vidék szerződéses 1 430 3
N 37 Budapest szerződéses 3 720 519
N 20 Budapest szerződéses 5 210 1 430
F 33 Budapest szerződéses 5 850 1 135
F 33 Vidék szerződéses 12 020 5 103
N 29 Vidék szerződéses 7 730 1 640
N 49 Vidék szerződéses 1 410 7
F 26 Budapest szerződéses 7 430 6 470
F 21 Vidék szerződéses 2 180 204
N 27 Vidék szerződéses 7 230 3 220
N 44 Vidék szerződéses 1 670 78
F 54 Vidék szerződéses 2 060 273
F 78 Budapest szerződéses 7 840 217
N 36 Budapest szerződéses 1 650 25
N 29 Budapest szerződéses 13 400 2 683
N 33 Vidék szerződéses 2 870 48
F 31 Vidék szerződéses 4 505 646
N 53 Budapest szerződéses 7 980 4 750
N 23 Vidék szerződéses 6 740 3 012
N 29 Budapest szerződéses 3 650 785
N 35 Vidék szerződéses 9 350 570
F 27 Vidék szerződéses 3 820 742
N 54 Budapest szerződéses 2 740 148
N 20 Budapest szerződéses 3 010 428
F 38 Vidék szerződéses 3 200 574
F 39 Vidék szerződéses 8 300 447
N 30 Budapest szerződéses 8 910 2 171
F 28 Vidék szerződéses 8 950 694
F 30 Vidék szerződéses 1 860 174
F 57 Vidék szerződéses 6 300 612
F 54 Budapest szerződéses 6 750 0
N 71 Budapest szerződéses 1 970 73
N 19 Vidék szerződéses 2 360 863
N 29 Budapest szerződéses 6 410 2 730
F 49 Budapest szerződéses 2 900 482
N 54 Budapest szerződéses 3 600 663
F 19 Budapest szerződéses 3 405 649
N 19 Budapest szerződéses 4 640 1 360
F 57 Budapest szerződéses 10 130 1 710
F 22 Vidék szerződéses 2 870 142
Havi átlagos
21
N 32 Vidék szerződéses 5 190 910
N 21 Vidék szerződéses 6 340 1 745
F 50 Budapest szerződéses 9 710 210
N 48 Vidék szerződéses 11 040 3 120
F 31 Vidék szerződéses 2 230 163
F 44 Vidék szerződéses 3 750 379
F 35 Vidék szerződéses 5 640 2 754
F 29 Budapest szerződéses 5 030 784
N 26 Vidék kártyás 740 1901
N 74 Vidék kártyás 630 621
F 81 Vidék kártyás 450 1277
F 35 Vidék kártyás 1 320 1274
F 18 Vidék kártyás 3 760 1539
F 16 Budapest kártyás 2 100 2226
N 56 Vidék kártyás 540 2368
F 21 Vidék kártyás 760 2531
N 15 Budapest kártyás 840 2581
N 64 Vidék kártyás 1 090 2677
F 52 Vidék kártyás 675 2238
N 43 Vidék kártyás 1 110 2799
F 40 Vidék kártyás 570 784
F 30 Vidék kártyás 675 2133
F 20 Budapest kártyás 1 230 2729
F 41 Budapest kártyás 1 240 2756
F 22 Vidék kártyás 3 540 2737
F 61 Vidék kártyás 1 340 898
F 65 Budapest kártyás 535 916
N 22 Budapest kártyás 1 220 1396
N 79 Vidék kártyás 810 1480
N 32 Vidék kártyás 930 1347
F 68 Budapest kártyás 1 030 2706
N 47 Vidék kártyás 1 710 2126
N 47 Budapest kártyás 2 710 2199
F 76 Vidék kártyás 935 1041
N 16 Budapest kártyás 745 2853
F 36 Budapest kártyás 1 750 767
F 29 Budapest kártyás 1 830 802
N 16 Budapest kártyás 1 390 453
F 62 Vidék kártyás 1 160 2810
F 17 Vidék kártyás 2 020 2801
N 28 Vidék kártyás 1 090 1403
N 32 Budapest kártyás 1 250 2773
F 34 Budapest kártyás 1 550 1272
F 66 Budapest kártyás 1 870 1379
N 20 Vidék kártyás 1 130 2123
F 27 Vidék kártyás 1 130 1051
N 20 Vidék kártyás 470 1675
F 37 Vidék kártyás 540 2241
F 38 Vidék kártyás 1 065 2418
F 40 Vidék kártyás 1 210 560
F 20 Vidék kártyás 3 300 1103
F 19 Vidék kártyás 1 650 1569
F 24 Vidék kártyás 810 2668
22
2. számú melléklet: A szerződéses ügyfelekre szűkített minta
Előfizetés/Feltöltő kártyás Árbevétel (Ft) (X) Adatforgalom (Mb)(Y)
szerződéses 4480 423
szerződéses 6310 1320
szerződéses 5750 334
szerződéses 13400 340
szerződéses 1670 0
szerződéses 4210 550
szerződéses 5760 140
szerződéses 1430 3
szerződéses 3720 519
szerződéses 5210 1430
szerződéses 5850 1135
szerződéses 12020 5103
szerződéses 7730 1640
szerződéses 1410 7
szerződéses 7430 6470
szerződéses 2180 204
szerződéses 7230 3220
szerződéses 1670 78
szerződéses 2060 273
szerződéses 7840 217
szerződéses 1650 25
szerződéses 13400 2683
szerződéses 2870 48
szerződéses 4505 646
szerződéses 7980 4750
szerződéses 6740 3012
szerződéses 3650 785
szerződéses 9350 570
szerződéses 3820 742
szerződéses 2740 148
szerződéses 3010 428
szerződéses 3200 574
szerződéses 8300 447
szerződéses 8910 2171
szerződéses 8950 694
szerződéses 1860 174
szerződéses 6300 612
szerződéses 6750 0
szerződéses 1970 73
szerződéses 2360 863
szerződéses 6410 2730
szerződéses 2900 482
szerződéses 3600 663
szerződéses 3405 649
szerződéses 4640 1360
szerződéses 10130 1710
szerződéses 2870 142
szerződéses 5190 910
szerződéses 6340 1745
szerződéses 9710 210
szerződéses 11040 3120
szerződéses 2230 163
szerződéses 3750 379
szerződéses 5640 2754
szerződéses 5030 784
A felhasznált minta (alapmintából szűrve)

More Related Content

Similar to Statisztika_házi_dolgozat

Jánosi István (Planimeter) előadása - BNI 301 2019.06.26.
Jánosi István (Planimeter) előadása - BNI 301 2019.06.26.Jánosi István (Planimeter) előadása - BNI 301 2019.06.26.
Jánosi István (Planimeter) előadása - BNI 301 2019.06.26.
BNI301
 
Rejtett lakossági jövedelmek kistérségi szintű becslése
Rejtett lakossági jövedelmek kistérségi szintű becsléseRejtett lakossági jövedelmek kistérségi szintű becslése
Rejtett lakossági jövedelmek kistérségi szintű becslése
Bence Bublik
 
A budapesti értéktőzsde zrt ppt
A budapesti értéktőzsde zrt pptA budapesti értéktőzsde zrt ppt
A budapesti értéktőzsde zrt pptekkert
 
A budapesti értéktőzsde zrt pdf
A budapesti értéktőzsde zrt pdfA budapesti értéktőzsde zrt pdf
A budapesti értéktőzsde zrt pdfekkert
 
Tanácsadási módszertan
Tanácsadási módszertan Tanácsadási módszertan
Tanácsadási módszertan Peter Buglavecz
 
Jánosi István előadása - BNI 301
Jánosi István előadása - BNI 301Jánosi István előadása - BNI 301
Jánosi István előadása - BNI 301
BNI301
 
Jánosi István előadása - BNI 301
Jánosi István előadása - BNI 301Jánosi István előadása - BNI 301
Jánosi István előadása - BNI 301
BNI301
 

Similar to Statisztika_házi_dolgozat (7)

Jánosi István (Planimeter) előadása - BNI 301 2019.06.26.
Jánosi István (Planimeter) előadása - BNI 301 2019.06.26.Jánosi István (Planimeter) előadása - BNI 301 2019.06.26.
Jánosi István (Planimeter) előadása - BNI 301 2019.06.26.
 
Rejtett lakossági jövedelmek kistérségi szintű becslése
Rejtett lakossági jövedelmek kistérségi szintű becsléseRejtett lakossági jövedelmek kistérségi szintű becslése
Rejtett lakossági jövedelmek kistérségi szintű becslése
 
A budapesti értéktőzsde zrt ppt
A budapesti értéktőzsde zrt pptA budapesti értéktőzsde zrt ppt
A budapesti értéktőzsde zrt ppt
 
A budapesti értéktőzsde zrt pdf
A budapesti értéktőzsde zrt pdfA budapesti értéktőzsde zrt pdf
A budapesti értéktőzsde zrt pdf
 
Tanácsadási módszertan
Tanácsadási módszertan Tanácsadási módszertan
Tanácsadási módszertan
 
Jánosi István előadása - BNI 301
Jánosi István előadása - BNI 301Jánosi István előadása - BNI 301
Jánosi István előadása - BNI 301
 
Jánosi István előadása - BNI 301
Jánosi István előadása - BNI 301Jánosi István előadása - BNI 301
Jánosi István előadása - BNI 301
 

Statisztika_házi_dolgozat

  • 1. Távközlési adatok vizsgálata a leíró statisztika módszereinek segítségével (csoportos házi dolgozat a „Statisztikai Elemzés” című tantárgyból) Készítették: Pénzügy Mesterképzés – Levelező tagozat N02-es kurzus hallgatói: Jánik Renáta (PE3W41) Maticsák László (L3QIE2) Miklós Péter (DHTYA2) Szabó Attila Pekka (EU6MIN) Zöldi Balázs (ZUB9CF) 2014
  • 2. 2 Tartalomjegyzék I. Bevezetés ...................................................................................................................... 3 I.I Mintavétel ....................................................................................................................................... 3 II. Becslés.......................................................................................................................... 4 II.I Várható érték becslése................................................................................................................... 4 II.II Aránybecslés.................................................................................................................................. 5 II.III Szórásbecslés................................................................................................................................ 6 III. Hipotézisvizsgálat ........................................................................................................ 7 III.I Egymintás hipotézisvizsgálat......................................................................................................... 7 III.II Kétmintás hipotézisvizsgálat ........................................................................................................ 7 III.III Illeszkedésvizsgálat...................................................................................................................... 9 IV. Korreláció és regresszió ............................................................................................. 12 IV.I Korreláció .................................................................................................................................... 12 IV.II Lineáris regresszió...................................................................................................................... 13 IV.III Exponenciális és hatványos regresszió...................................................................................... 14 IV.IV Többváltozós regresszió............................................................................................................ 15 V. Összefoglalás.............................................................................................................. 17 Táblázatok jegyzéke:....................................................................................................... 19 Felhasznált Irodalom....................................................................................................... 19 Mellékletek .................................................................................................................... 20
  • 3. 3 I. Bevezetés A mobil távközlési szektor a 90-es évek első felében jelent meg először Magyarországon, egy teljesen új szolgáltatás kínálva a fogyasztók számára. Az elmúlt húsz év során a telekommunikáció az egyik legdinamikusabban fejlődő iparággá nőtte ki magát, és e szolgáltatások mára hétköznapok elengedhetetlen részeként vannak jelen. 1994-ben a két első komoly digitális szolgáltatásokat nyújtó vállalat megjelenésével a mobiltelefon piac nem várt növekedésnek indult, 1999-re a két szolgáltató előfizetéseinek száma elérte az 1 milliót, 2009- ben ugyanez- a KSH adatai szerint – meghaladja a 11,7 milliót, ahol eléri a piac felvevő képességének határait. Az ezt követő időszakban egészen napjainkig az előfizetések számát tekintve stagnálás jellemzi az 1999 óta háromszereplős piacot. Ugyanez nem mondható el a felhasználók összetételét illetően, hiszen high-tech iparág lévén az elérhető szolgáltatások folyton bővülnek és megújulnak a ma már széles körben ismert és használt 4G/LTE hálózatot alkalmazó „okos-telefonokon” át a machine to machine szolgáltatásokig (KSH, 2012). A fentiekből jól érzékelhető, hogy egy jellemzően már nem növekvő piacon, de mégis folyamatosan változó trendeket diktáló piacról van szó, ahol elengedhetetlen az iparágban tevékenységet folytató vállalatok számára, hogy naprakész információval rendelkezzenek a fogyasztói szokások és elvárásokat illetően. Ehhez nem elegendő megfelelő adatok megszerzése, szükséges azok megfelelő elemzése és értelmezése. Egy profit orientált vállalat stratégiai marketing, vagy fogyasztás ösztönzési döntéseinek előkészítése során a pénzügyi megalapozottság mellett, legalább olyan fontos szerepet játszik a statisztikai adatok megismerése, megfelelő következtetések levonása és azok helyes felhasználása. A statisztika eszköztára két területre bontható: leíró statisztika és következtető statisztika. Legfőbb eszközei a becslés, a hipotézisvizsgálat valamint a korreláció és regresszió számítás. A felsorolt elemzési módszerekben közös, hogy az alapsokaságra megfogalmazott állítások, akkor adnak valósághű képet, ha a részsokaság (minta) olyan módon lett kiválasztva, mely garantálja, hogy az eljárás végeredménye véletlen minta legyen. Így a számítások mellett a mintavételi eljárás is röviden ismertetésre kerül. I.I Mintavétel A kutatáshoz egy a magyarországi piacon is versenyző telekommunikációs vállalat adatai kerültek felhasználásra, és a mobil előfizetők fogyasztói szokásait vizsgáltuk az egy főre jutó havi átlagos költés és a mobiltelefon internet forgalom alapján. A rendelkezésre álló adatok
  • 4. 4 alapján ismerjük ez egyes ügyfelek életkorát, nemét és, hogy szerződéses előfizető vagy feltöltőkártyás felhasználó-e. A vállalat adatbázisában a 2013-as üzleti évre 2,7 millió mobiltelefon szolgáltatással rendelkező aktív szerződés szerepelt. Az ügyfelek adatait egy az értékesítés támogatására felállított adattárház tartalmazza, amely alkalmas az adatokban való lefúrásra, és különböző aggregáltsági szinten való elemzésére. Az elemzéshez szükséges mintához előfizetés szinten aggregált havi átlagos árbevétel és internet forgalmi adatok kerültek lekérdezésre. Az egyes előfizetések a szerződés számok alapján megkülönböztethetőek. A szerződések egyedi azonosítójának generálásakor nem tartanak szem előtt a beszédességet elősegítő karakterválasztást, azaz a szerződés számok és a szerződő ügyfél adatai vagy a szerződésben foglaltak között sztochasztikus kapcsolat nem áll fenn. Ez lehetőséget teremt a teljes listából való szisztematikus kiválasztás elvégzésére, amely során egy 100 elemű minta került összeállításra a következő módon: A teljes listánk szerződés szám szerint sorba rendezésre kerül, amely összesen 2.710.703 darabszerződést tartalmaz. Ez alapján az alkalmazott lépésköz a következő: k = [N/n] = 2.710.703/100 = 27.107. Az excel RANDBETWEEN függvénye segítségével megkeressük a minta első elemét: k0=RANDBETWEEN(1;27107)= 4508, így a további kiválasztásra kerülő elemeket a következő képletbe helyettesítve kapjuk meg: kn= 4508 + n× 27107. Az így kapott mintát az első számú melléklet teljes egészében tartalmazza. II. Becslés A következtető statisztika becslés módszerén keresztül lehetőség nyílik arra, hogy a mintát felhasználva az alapsokaságra vonatkozó állítások kerüljenek megfogalmazásra. Fontos megjegyezni, hogy 100%-ig pontos állítást az alapsokaságra nem lehet megfogalmazni, de a módszer segítségével az elkövetett statisztikai hiba mértéke számszerűsíthető. II.I Várható érték becslése A minta felhasználásával, először becsüljük meg, az átlagos árbevételt (vagyis az árbevétel várható értékét), 98%-os megbízhatósági szint mellett. Az Excel Adatelemzés/Leíró Statisztika eszközével a várható érték konfidenciaszintjét megadva gyakorlatilag megkapjuk a végeredményt, az alábbiak szerint:
  • 5. 5 1. tábla: Az árbevétel várható értékének becslése A kiemelt adatok segítségével meghatározható a keresett érték intervallumának alsó és felső határa (a táblában dőlt betűvel). A táblát értelmezve: A minta alapján a szerződéseken képződő árbevétel 98%-os valószínűséggel 2828,88 Ft és 4211,31 Ft között lesz. Amennyiben ismert az alapsokaság elemszáma, úgy az adatokat felhasználva lehetőség nyílik az értékösszeg becslésére is. A táblából leolvasható, hogy a becslés során elkövetett hiba átlagos mértéke 313,47 Ft, és a becsléses eljárás okozta eltérés maximális értéke 741,22 Ft. (Mindez 98%-os megbízhatósági szinten) II.II Aránybecslés Valószínűsíthető, hogy a szerződéses ügyfeleken keresztül nagyobb árbevételt lehet realizálni, ezért fontos, hogy a társaság tisztában legyen a szerződéses ügyfelek arányával az alapsokaságban. A mintából a következők alapján megbecsülhető a keresett arány 98%-os valószínűség mellett. A számítás menete a következő: 2. tábla: Szerződéses ügyfelek arányának becslése A megoldás során érdemes kiemelt figyelmet fordítani arra, hogy habár a Zp értéke meghatározható a megfelelő excel függvény segítségével, de a Standard Normális eloszlás függvénye esetében valószínűségként nem α-t kell megadni (mint a Student féle t-eloszás Árbevétel (Ft) Várható érték 3570,1 Standard hiba 313,465462 Medián 2205 Módusz 13400 Szórás 3134,65462 Alsóh: 2828,88 Minta varianciája 9826059,59 Felsőh: 4311,32 Csúcsosság 1,05294702 Ferdeség 1,28899984 Tartomány 12950 Minimum 450 Maximum 13400 Összeg 357010 Darabszám 100 Konfidenciaszint(98,0%) 741,222266 n(szerződéses): 55 1-α/2: 0,99 Sp: 0,0497 max hiba: 0,116 n: 100 Z0,99: 2,33 Alsó H: 43,4% p: 0,55 Felső H: 66,6%
  • 6. 6 függvény esetében), hanem 1-α/2 értékét. A tábla alapján: A szerződéses ügyfelek aránya 98%-os megbízhatóság mellett 43,4% és 66,6% között van az alapsokaságban. II.III Szórásbecslés A mintából a várható értékhez, értékösszeghez és arányhoz hasonlóan a szórás is megbecsülhető. Ennek bemutatása érdekében becsüljük meg az árbevétel szórását 98%-os valószínűség mellett. Ekkor a mintából számított variancia mellett a Χ2 becslőfüggvény megfelelő értékére is szükség lesz, illetve a függvény esetében külön számítani kell az alsó és a felső határhoz tartozó értéket is (a Χ2 eloszlás ugyanis nem szimmetrikus). 3. tábla: Szórásbecslés A leíró statisztika eszközével meghatározásra került a minta alapján számított variancia. Ezt követően a becslőfüggvény értékei kerültek meghatározásra (alsó határnál 1-α/2, felső határnál α/2). Kijelölésre került az értékekhez köthető komplementer (1-hez) szám is, ugyanis az Excel „Inverz.Khi” függvényének sajátossága hogy a keresett valószínűséget 1-ből kivonva kell megadni. Az így kapott számok segítségével már meghatározható a keresetszórás intervalluma. 98%-os megbízhatóság mellett kijelenthető, hogy az árbevétel szórása 2688 Ft és 3749 Ft között van. A megállapítást megerősíti, hogy a minta alapján számított szórás (3135 Ft) a kijelölt intervallumban található. A megadott intervallum relatíve tágnak nevezhető, szükséges megjegyezni, hogy a megbízhatósági szint csökkentésével a konfidencia intervallum szűkíthető. Árbevétel (Ft) Komplementer Χ 2 Várható érték 3570,1 α/2: 0,01 0,99 69,22989 Standard hiba 313,46546 1-α/2: 0,99 0,01 134,6416 Medián 2205 Módusz 13400 Szórás 3134,6546 Alsó H: 2688 Minta varianciája 9826059,6 Felső H: 3749 Csúcsosság 1,052947 Ferdeség 1,2889998 Tartomány 12950 Minimum 450 Maximum 13400 Összeg 357010 Darabszám 100
  • 7. 7 III. Hipotézisvizsgálat A hipotézisvizsgálat eszközén keresztül egy az alapsokaságra megfogalmazott állítást kerül ellenőrzésre (tesztelésre), a mintán keresztül. Az állítás függvényében megkülönböztethetünk egymintás, kétmintás, valamint paraméteres és nem paraméteres próbát. III.I Egymintás hipotézisvizsgálat Vizsgáljuk meg 5%-os szignifikancia szint mellett, hogy az átlagos árbevétel 3600Ft-nál nagyobb-e. Ebben az esetben a hipotézisvizsgálatot aszimptotikus Z-próbával végezzük el, mivel a sokaság szórása és eloszlása nem ismert. Ekkor a hipotézisrendszer, valamint a próbafüggvény értékének számítása az alábbiak szerint alakul: ܼ = ௫̅ିఓబ ೞ √೙ H0:µ0≥3600 H1:µ1<3600 ‫ܪ‬଴ ் : ߤ = 3600 Bal oldali kritikus tartományunk lesz, vagyis az elfogadási tartomány alsó határát szükséges kijelölnünk, így megkapjuk az elfogadási tartományt az alábbiak szerint: Z1-α=Z1-0,05=Z0,95=1,65 E.T.: (1,65;∞) A Z-próba függvény kiszámításához szükségünk van a mintabeli átlagra és szórásra. A számított értékeket pedig behelyettesítjük a képletbe: ‫̅ݔ‬ = 3570‫ݐܨ‬ s=3118 n= 100 ܼ = 3570 − 3118 ଷଵଵ଼ √ଵ଴଴ = 452 311,8 = 1,45 Z-próbafüggvény értéke kívül esik az elfogadási tartományon, vagyis H0-t elutasítjuk és H1-et elfogadjuk, vagyis az átlagos árbevétel 3600Ft alatt van 95%-os valószínűség mellett. III.II Kétmintás hipotézisvizsgálat Azt vizsgáljuk, hogy a kártyás ügyfelek adatforgalma magasabb-e átlagosan, mint a szerződéses ügyfelek adatforgalma. A feltevésünk az, hogy a kártyás ügyfelek legalább 450mb-tal több adatot használnak, mint az előfizetéses ügyfelek (5%-os szignifikancia szint mellett). A feladatmegoldás során a kártyás ügyfeleket 1-es, míg a szerződéses ügyfeleket 2-s
  • 8. 8 indexszel jelöljük Ennek megvizsgálásához szükségünk van egy táblázatra, ahol az adatfelhasználást négy egyenlő osztályközre bontjuk. Adatforgalom (Mb) Kártyás ügyfél (y változó)db Szerződéses ügyfél (x változó)db 0-2000Mb 24 45 2000-4000Mb 22 7 4000-6000Mb 0 2 6000-8000Mb 0 1 Összesen - ∑ 46 55 4. tábla: Osztályközös gyakorisági sor az adatforgalomra A vizsgálatot baloldali alternatív hipotézissel végezzük el,a hipotézisrendszer az alábbi lesz: H0:µ1-µ2=450 H1:µ1-µ2<450 ܼ = ሺ௬തି௫̅ሻିఋబ ඨ ೞ೤ మ ೙೤ ା ೞೣ మ ೙ೣ A δ0 tetszőleges, de nem előre meghatározott érték, jelen esetben 450. Amennyiben δ0 értéke 0, ez azt jelenti, hogy a null hipotézist elfogadjuk, vagyis a két átlag megegyezik. A képletbe való számok behelyettesítéséhez szükségünk lesz a mintabeli átlagra és szórásnégyzetekre. ny=45 ‫ݕ‬ത = ଵ଴଴଴௫ଶସାଷ଴଴଴௫ଶଶ ସ଺ = 1956,52 ‫ݏ‬௬ = ඥሺ1000 − 1956ሻଶ ∗ 24 + ሺ3000 − 1956ሻଶ ∗ 22 46 − 1 = 6447 45 = 143,26 nx=55 ‫̅ݔ‬ = ସହ௫ଵ଴଴଴ାଷ଴଴଴௫଻ାହ଴଴଴௫ଶା଻଴଴଴௫ଵ ହହ = 1509,09 ‫ݏ‬௫ = ඥሺ1000 − 1509ሻଶ ∗ 45 + ሺ3000 − 1509ሻଶ ∗ 7 + ሺ5000 − 1509ሻଶ ∗ 2 + ሺ7000 − 1509ሻଶ 55 − 1 = 9041,32 54 = 167,43 Bal oldali próba lévén az alsó határ kijelölése szükséges az elfogadási tartomány definiálása érdekében. A tartomány: (-1,96;∞) ܼ = ሺ1956,52 − 1509,09ሻ − 450 ට ଵସଷ,ଶ଺మ ସହ + ଵ଺଻,ସଷమ ହହ = −2,57 ඥ456,07 + 509,68 = −2,57 31,06 = −0,0827
  • 9. 9 A próbafüggvény értéke: -0,0827, vagyis az elfogadási tartományba esik. Megállapíthatjuk, hogy a kártyás ügyfelek átlagosan több mint 450Mb-al több adatforgalmat használnak fel 95%-os megbízhatósági szint mellett. Az Excel adatelemzés eszközével további kétmintás hipotézis vizsgálatok is egyszerűen elvégezhetőek. Vizsgáljuk meg 95%-os szignifikancia szint mellett, hogy igaz-e az állítás, mely szerint a szerződéses ügyfelek esetében az árbevétel több mint 1500 Ft-tal nagyobb, mint a kártyás szerződők esetében. Jelölje 1-es a szerződéses, 2-es pedig a kártyás ügyfeleket. Ekkor a hipotézisrendszer: és Az adatelemzés eszköztárából a kétmintás t-próbát alkalmazva az alábbi output táblát kapjuk, melyből az eredmények leolvashatóak: 5. tábla: kétmintás t-próba az Excel adatelemzésével készítve A táblából leolvasható, hogy nincs olyan szignifikancia szint, mely mellett a H0 hipotézis elfogadható lenne (kiemelve, P egyszélű). A hipotézisrendszer szerint a teszt jobboldali alternatív hipotézis segítségével került elvégzésre, vagyis az elfogadási tartomány felső határát kell meghatározni. A tábla alapján 1,67, melynél a próbafüggvény értéke, 6,03 nagyobb így a H0-t elutasítjuk. Vagyis 95%-os valószínűséggel állíthatjuk, hogy a szerződéses ügyfelek esetében az árbevétel több mint 1500 Ft-tal magasabb, mint a kártyás ügyfelek esetében. III.III Illeszkedésvizsgálat A Hipotézisvizsgálat eszköztárán keresztül lehetősségünk nyílik annak vizsgálatára, hogy az adott minta alapján a sokaság eloszlása valamilyen nevezetes eloszlást követ-e. A Kétmintás t-próba nem-egyenlő szórásnégyzeteknél Változó 1 Változó 2 Várható érték 5428,363636 1298,889 Variancia 9707342,643 603011,2 Megfigyelések 55 45 Feltételezett átlagos eltérés 1500 df 62 t érték 6,034058384 P(T<=t) egyszélű 0,00000% t kritikus egyszélű 1,669804163 P(T<=t) kétszélű 0,0000% t kritikus kétszélű 1,998971498
  • 10. mintánkon keresztül vizsgáljuk meg, hogy az árbevétel eloszlása tekinthet eloszlásnak. Az Excel/Adatelemzés eszközének segítségével az alábbi hisztogramot készíthetjük el: Az ábra alapján biztosan kijelenthet normális eloszlást, erős baloldali aszimmetria figyelhet lehet mindig hasonlóan egyértelm igazoljuk a fentebb megfogalmazott állítást. A megbízhatósági szint 98%. Ekkor feltételezzük, hogy az árbevétel normális eloszlást követ, míg az alternatív hipotézis szerint van olyan osztályköz, mely nem felel meg az egyenletes eloszlás felté hipotézisrendszer tehát: A feladat során a mintából becsülnünk kell a sokasági várható értéket és szórást. Emiatt a próbafüggvény szabadságfoka kilenc lesz, mert az osztályközök száma 11. (Az osztályközök kialakítása az Adatelemzés/Hisztogra kapcsolódó gyakoriságokat és a számított értékeket a következ mintánkon keresztül vizsgáljuk meg, hogy az árbevétel eloszlása tekinthet eloszlásnak. Az Excel/Adatelemzés eszközének segítségével az alábbi hisztogramot 6. tábla: Hisztogram az árbevétel alapján Az ábra alapján biztosan kijelenthető, hogy az árbevétel alakulása nem követi a s baloldali aszimmetria figyelhető meg. Azonban az ábra alapján nem lehet mindig hasonlóan egyértelmű álláspontot kialakítani. Ezért számításon igazoljuk a fentebb megfogalmazott állítást. A megbízhatósági szint 98%. Ekkor feltételezzük, hogy az árbevétel normális eloszlást követ, míg az alternatív hipotézis szerint van olyan osztályköz, mely nem felel meg az egyenletes eloszlás felté A feladat során a mintából becsülnünk kell a sokasági várható értéket és szórást. Emiatt a próbafüggvény szabadságfoka kilenc lesz, mert az osztályközök száma 11. (Az osztályközök kialakítása az Adatelemzés/Hisztogram eszközzel készült). Az osztályközöket, kapcsolódó gyakoriságokat és a számított értékeket a következő táblázat tartalmazza: 10 mintánkon keresztül vizsgáljuk meg, hogy az árbevétel eloszlása tekinthető-e normális eloszlásnak. Az Excel/Adatelemzés eszközének segítségével az alábbi hisztogramot , hogy az árbevétel alakulása nem követi a meg. Azonban az ábra alapján nem álláspontot kialakítani. Ezért számításon keresztül is igazoljuk a fentebb megfogalmazott állítást. A megbízhatósági szint 98%. Ekkor feltételezzük, hogy az árbevétel normális eloszlást követ, míg az alternatív hipotézis szerint van olyan osztályköz, mely nem felel meg az egyenletes eloszlás feltételének, a A feladat során a mintából becsülnünk kell a sokasági várható értéket és szórást. Emiatt a próbafüggvény szabadságfoka kilenc lesz, mert az osztályközök száma 11. (Az m eszközzel készült). Az osztályközöket, táblázat tartalmazza:
  • 11. 11 7. tábla: A Χ2 próbafüggvény értékének meghatározása normális eloszlás tesztelése során Az Illeszkedésvizsgálat minden esetben Χ2 próbafüggvénnyel és jobb oldali próbával tesztelendő, így felső kritikus értéket kell meghatározni. Az Excel „Inverz.khi” függvényének az érték kiszámításához a valószínűség komplementerét kell rögzíteni, ami jelen esetben 0,02. Az osztályközök standardizálását követően meghatározásra kerültek a normális eloszlás feltételezésével számított valószínűségek, melynek segítségével felírható a próbafüggvény. Az elfogadási tartomány felső határa 19,68, míg a próbafüggvény értéke 101,43, vagyis az alternatív hipotézist fogadjuk el. 98%-os valószínűség mellett az árbevétel eloszlása nem követi a normális eloszlást. Vagyis a hisztogram segítségével megfogalmazott állítás igazolást nyert. Vizsgálható, hogy az árbevétel alakulása követi-e az egyenletes eloszlást. Ehhez az árbevétel alapján készített hisztogram kiegészítésre kerül egy vonallal, mely az egyenletes eloszlás esetén feltételezett gyakoriságokat jelöli. Mivel a hisztogram nem illeszkedik a vonalra, belátható, hogy az árbevétel nem követi az egyenletes eloszlást sem. A kiegészített hisztogram az alábbi: Osztályköz Gyakoriság Pi Χ 2 -450 1 -1,0398 0,1492 0,1492 12,98763 451-1745 40 -0,6129 0,2700 0,1208 64,55539 1746-3040 17 -0,1859 0,4263 0,1563 0,120414 3040-4335 11 0,2411 0,5953 0,1690 2,059157 4336-5630 6 0,6681 0,7479 0,1527 5,627324 5630-6925 10 1,0950 0,8632 0,1153 0,202969 6926-8220 5 1,5220 0,9360 0,0727 0,71133 8221-9515 4 1,9490 0,9744 0,0384 0,007052 9516-10810 2 2,3759 0,9912 0,0169 0,05697 10811-12105 2 2,8029 0,9975 0,0062 3,05297 12106- 2 1 0,0025 12,05033 ∑ 100 1 101,4315 μ: 3603,82 1-α : 19,67902 σ: 3032,97 0,98
  • 12. 8. tábla: A feltételezett egyenletes eloszlással kiegészített hisztogram az árbevétel alapján IV. Korreláció és regresszió A korreláció és regresszió számítás segítségével a különböz közti kapcsolat számszerűsíthet esetében végezzük el. A szűkített mintát a második számú melléklet tartalmazza. IV.I Korreláció Vizsgáljuk meg, hogy szerz az árbevétel és az adatforgalo (tömbfüggvény) alkalmazva az alábbi r értéket kapjuk (melyb determinációs együttható): A szerződéses ügyfelek esetében az árbevétel és az adatforgalom között pozitív közepes erősségű kapcsolat figyelhet magyaráz az árbevétel, a maradék 72% az egyéb, nem vizsgált tényez szerződéses ügyfelek esetében. . tábla: A feltételezett egyenletes eloszlással kiegészített hisztogram az árbevétel alapján és regresszió regresszió számítás segítségével a különböző (mennyiségi) ismérvek űsíthetővé, leírhatóvá válik. A vizsgálatokat a szerz űkített mintát a második számú melléklet tartalmazza. Vizsgáljuk meg, hogy szerződéses ügyfelek esetében milyen kapcsolat f az árbevétel és az adatforgalom értéke között. A Microsoft Exel „KORREL” függvényét (tömbfüggvény) alkalmazva az alábbi r értéket kapjuk (melyből egyszerű 9. tábla: Az r és az r 2 mutató értéke déses ügyfelek esetében az árbevétel és az adatforgalom között pozitív kapcsolat figyelhető meg (r). Az adatforgalom szóródásából magyaráz az árbevétel, a maradék 72% az egyéb, nem vizsgált tényez déses ügyfelek esetében. A keresett értékek meghatározhatóak az Excel Adatelemzés Mutató Érték r(x;y) 0,52942 r 2 28% 12 . tábla: A feltételezett egyenletes eloszlással kiegészített hisztogram az árbevétel alapján (mennyiségi) ismérvek A vizsgálatokat a szerződéses ügyfelek kített mintát a második számú melléklet tartalmazza. déses ügyfelek esetében milyen kapcsolat figyelhető meg xel „KORREL” függvényét l egyszerűen előállítható a déses ügyfelek esetében az árbevétel és az adatforgalom között pozitív irányú, meg (r). Az adatforgalom szóródásából 28%-ot magyaráz az árbevétel, a maradék 72% az egyéb, nem vizsgált tényezők hatása (r2 ) a A keresett értékek meghatározhatóak az Excel Adatelemzés-
  • 13. 13 Regresszió eszközével is, ekkor a keresett értékek az output táblából (az első táblából) leolvashatóak (Kiemelve). 10. tábla: Regressziós statisztika az excel adatelemzés eszközével IV.II Lineáris regresszió Megállapításra került tehát, hogy az ismérvek között közepes erősségű kapcsolat áll fent. A kapcsolat leírása a regresszió számítás eszközével valósítható meg. A feladatmegoldás során az előbb ismertetett minta kerül felhasználásra. A regresszió számítás során az ismérvek közti kapcsolat függvények segítségével kerül leírásra, megkülönböztethetünk Lineáris, Hatványkitevős és exponenciális regresszió függvényt. A lineáris regressziós függvény felírása érdekében szükséges, hogy a b0 és a b1 értékek meghatározásra kerüljenek. Az Excel segítségével a feladat többféleképpen is megoldható. A „LIN.ILL” tömbfüggvény alkalmazásával az alábbi értékeket kapjuk, melyből felírható a lineáris függvény: Ebből a függvény: A b0 paraméter jelen esetben nem értelmezhető, így a függvény alapján azt mondhatjuk, hogy ha az árbevétel 1 Ft-tal nő, akkor az adatforgalom 0,24 MB-tal lesz több. Az állítás ekvivalens a következő állítással, ha az árbevétel 100 FT-tal növekszik, akkor az adatforgalom várhatóan 24 MB-tal fog nőni a szerződéses ügyfelek esetében. A korábban már említett adatelemző eszköz mindhárom output táblájának értelmezésével is megoldható a feladat. A táblák ekkor a következőek: Regressziós statisztika r értéke 0,52942 r-négyzet 0,280285 Korrigált r-négyzet 0,266706 Standard hiba 1185,571 Megfigyelések 55 b1 b0 0,24 -174,29
  • 14. 14 11. tábla: Regressziós statisztika az excel adatelemzés eszközével készítve (mindhárom output tála) A felső résztáblából leolvashatóak a korrelációelemzésnél tett megállapítások a kapcsolat erősségére és irányára vonatkozóan. A második résztáblában az F szignifikanciája mezőben látható, hogy amennyiben H0 Hipotézisben feltételeznék, hogy a két változó között nincs kapcsolat, akkor gyakorlatilag nem lenne olyan szignifikancia szint, mely mellett a H0 állítás elfogatható lenne, így azt mondhatjuk, hogy van kapcsolat a két változó között, a regresszió függvény szignifikáns. A harmadik résztáblában látható a b0 és a b1 paraméterek értéke a Koefficiensek oszlopban. (Tengelymetszet = b0 és X változó = b1). A p-érték oszlop alsó sorában láthatjuk, hogy ha H0 hipotézis hogy az árbevétel nincs hatással az adatforgalomra, akkor ez az alternatíva szintén elutasításra kerül, vagyis jelen esetben az adatforgalom valóban hatással van a bérre, a b1 paraméter szignifikáns a szerződéses ügyfelek esetében. Az alsó (95%) és felső (95%) oszlopok pedig kijelölik azon tartomány határait, melybe a megfelelő paraméterek 95%-os valószínűség mellett kerülnek. Fontos megjegyezni, hogy az adatelemzés – regresszió eszköz alkalmazása során lehetőség van a valószínűségi szint változtatására, a tábla mindig a megadott megbízhatósági szint mellett jelöli ki a tartományokat. (Illetve minden estben megadja külön 95%-os szint mellett is.) IV.III Exponenciális és hatványos regresszió Két ismérv közti kapcsolat leírásának eszköze lehet a lineáris regressziós függvény mellett az exponenciális és hatványos regressziós függvény is. A vizsgálat tárgya az előző feladathoz hasonlóan ismét az árbevétel és az adatforgalom közti kapcsolat. A probléma Excel segítéségével grafikus úton megoldható. Ekkor a megfigyelések vizsgálni kívánt két ismérvéből egy pont (más néven XY) diagramot készítünk. Az X tengelyre kerül a magyarázó Regressziós statisztika r értéke 0,52941995 r-négyzet 0,28028549 Korrigált r-négyzet0,266705966 Standard hiba 1185,570956 Megfigyelések 55 VARIANCIAANALÍZIS df SS MS F F szignifikanciája Regresszió 1 29011575,84 29011575,8 20,64031002 0,0000 Maradék 53 74495660,09 1405578,49 Összesen 54 103507235,9 Koefficiensek Standard hiba t érték p-érték Alsó 95% Felső 95% Alsó 95,0% Felső 95,0% Tengelyme tszet -174,285279 323,3713449 -0,53896328 0,592169043 -822,8860442 474,31549 -822,88604 474,315486 X változó 1 0,23525486 0,051782199 4,5431608 0,000032 0,131392921 0,3391168 0,13139292 0,33911679
  • 15. változó, jelen esetben az árbevétel, míg Y tengelyre az adatforgalom (függ szerkesztőségét követően lehet szerepel két 0 érték is az adatforgalom oszlopában, ezek megoldhatóvá válik, ellenkező lehetséges.) A műveletek eredményeképpen a következ 12. tábla: Az exponenciális és hatványos Az ábrán megjelenik a determinációs együttható, valamint leolvashatóak a regressziós függvények képletei. Az ábra alapján így az exponenciális függvény: Y=65,92e b1 paraméter: 1,0003. Vagyis ha az árbevétel 1szeresére n szorosára fog nőni a szerződéses ügyfelek esetében. A hatványos függvény: y=0,00002x Ebben az esetben a b1 paraméter az elaszticitásnak felel meg, va esetében, ha az árbevétel 1%- rugalmasnak tekinthető). A számított determinációs együtthatókból megállapítható, hogy a három függvény közül leginkább a hatványos függvé kapcsolatot. IV.IV Többváltozós regresszió A többváltozós regresszió során különböz történik. Vizsgáljuk meg, hogy a szerz változó, jelen esetben az árbevétel, míg Y tengelyre az adatforgalom (függő en lehetőség van a kívánt trendvonalak felvételére. (A mintában szerepel két 0 érték is az adatforgalom oszlopában, ezeket 0,1 értékre módosítva a feladat megoldhatóvá válik, ellenkező esetben hatványos és exponenciális trend felvétele nem veletek eredményeképpen a következő ábrát kapjuk: . tábla: Az exponenciális és hatványos regressziós függvények, a kapcsolódó determinációs együtthatók valamint a kijelölt trendek Az ábrán megjelenik a determinációs együttható, valamint leolvashatóak a regressziós függvények képletei. Az ábra alapján így az exponenciális függvény: Y=65,92e b1 paraméter: 1,0003. Vagyis ha az árbevétel 1szeresére nő, akkor a adatforgalom 1,0003 ődéses ügyfelek esetében. A hatványos függvény: y=0,00002x paraméter az elaszticitásnak felel meg, vagyis a szerz -kal nő, akkor az adatforgalom 1,98%-kal fog n ). A számított determinációs együtthatókból megállapítható, hogy a három függvény közül leginkább a hatványos függvény írja le a két ismérv közötti Többváltozós regresszió A többváltozós regresszió során különböző paraméterek együttes hatásának vizsgálata történik. Vizsgáljuk meg, hogy a szerződéses ügyfelek esetében az árbevétel a lakóhely, az 15 változó, jelen esetben az árbevétel, míg Y tengelyre az adatforgalom (függő változó). Az ábra ség van a kívánt trendvonalak felvételére. (A mintában et 0,1 értékre módosítva a feladat esetben hatványos és exponenciális trend felvétele nem regressziós függvények, a kapcsolódó determinációs együtthatók valamint a Az ábrán megjelenik a determinációs együttható, valamint leolvashatóak a regressziós függvények képletei. Az ábra alapján így az exponenciális függvény: Y=65,92e0,003X . Ebből , akkor a adatforgalom 1,0003- déses ügyfelek esetében. A hatványos függvény: y=0,00002x1,9824 . gyis a szerződéses ügyfelek kal fog nőni (a változás ). A számított determinációs együtthatókból megállapítható, hogy a ny írja le a két ismérv közötti paraméterek együttes hatásának vizsgálata déses ügyfelek esetében az árbevétel a lakóhely, az
  • 16. 16 életkor és az adatforgalom között milyen erősségű a fennálló kapcsolat. Ekkor az árbevételt tekintjük eredményváltozónak, míg a másik hármat magyarázó változónak. Első lépésben fontos, hogy a lakóhely értékeket mennyiségi ismérvé alakítsuk. A példában a vidéki ügyfelek 1-es kódot, míg a budapestiek 0-ást kapnak. A már említett Adatelemzés/ Regresszió eszköz az alábbi eredményt adja: 13. tábla: Többváltozós regressziós statisztika az excel adatelemzés eszközével készítve (első két output tábla) A két táblából látható, hogy a vizsgált ismérvek között közepes erősségű a kapcsolat (r), és hogy a szerződéses ügyfelek esetében a lakóhely, az életkor és az adatforgalom együttesen 30,5%-ban magyarázzák az árbevétel alakulását. A korrigált többszörös determinációs együttható pedig kifejezi, hogy ha a számításból kihagyjuk azt (azokat) a magyarázó ismérveket, melyek az elemzés alapján nincsenek hatással az árbevételre, akkor a modellben maradó változók 26,4%-ban magyarázzák majd az árbevétel alakulását. Állítsunk fel egy hipotézisrendszert: és Ekkor a második táblából látható, hogy lényegében 0%-az a szignifikancia szint, mely mellett a H0 elfogadható, így H1-et fogadjuk el, vagyis a globális regresszió szignifikáns, a vizsgáltak közt van olyan elem, amelyik hat az árbevétel alakulására. 14. tábla: Többváltozós regressziós statisztika az excel adatelemzés eszközével készítve (harmadik output tábla) ÖSSZESÍTŐ TÁBLA Regressziós statisztika r értéke 0,552503 r-négyzet 0,30526 Korrigált r-négyzet 0,264393 Standard hiba 2672,226 Megfigyelések 55 VARIANCIAANALÍZIS df SS MS F F szignifikanciája Regresszió 3 1,6E+08 53338749,15 7,469587291 0,000307912 Maradék 51 3,64E+08 7140789,319 Összesen 54 5,24E+08 Koefficiense k Standard hiba t érték p-érték Alsó 95% Felső 95% Alsó 95,0% Felső 95,0% Tengelymetszet 2697,98772 1317,18864 2,04829 0,04570 53,62118 5342,35426 53,62118 5342,35426 Adatforgalom (Mb) (X1) 1,27137 0,27262 4,66350 0,00002 0,72406 1,81868 0,72406 1,81868 Életkor (X2) 35,44398 26,64402 1,33028 0,18934 -18,04611 88,93408 -18,04611 88,93408 Lakhelykód (X3) 16,30898 747,10282 0,02183 0,98267 -1483,56251 1516,18047 -1483,56251 1516,18047
  • 17. 17 Az eredmény harmadik (itt különválasztott) táblájából megállapítható, hogy mely magyarázó váltózók vannak valóban hatással az eredményváltózóra (Árbevétel). Mind három magyarázó változó esetében feltételezzük, hogy az adott változó nincs hatással az eredményváltózóra (H0, 5%-os szignifikancia szinten). A megjelölt P-értékek alapján ezt a hipotézist a lakóhelykód és az életkor esetében elfogadjuk (előbbinél 98,26%-os szintig, utóbbinál 18,93%-os szintig H0 az elfogadandó) vagyis ezek a változók nincsenek hatással az árbevételre a szerződéses ügyfelek esetében 95%-os valószínűséggel. Az adatforgalom esetében azonban közelítőleg 0% az a szignifikancia szint, mely mellett a H0 elfogadható, így az adatforgalom 5%-os szignifikancia szint mellett hatással van az árbevételre a szerződéses ügyfelek esetében. V. Összefoglalás A feladat elemzése alapján megállapítható, hogy a statisztika nagyon nagy szerepet tölt be a profitorientált telekommunikációs iparágakban. Magyarországon kiélezett a telekommunikációs piac, amely mára telítődött és a stagnálás jeleit mutatja. Napról-napra változnak a felhasználói és technikai trendek, ezért rendkívül fontosak a naprakész adatok. A piaci pozíciók megtartásához és/vagy növeléséhez, a statisztikai módszerek alkalmazásával, gyorsan és költséghatékonyan juthatunk olyan adatokhoz, amelyekkel hatékonyan alakíthatjuk ki a például a vezető marketingstratégiát, mellyel ösztönözhetjük a fogyasztást. A vizsgálat kezdeteként az excel RANDBETWEEN függvénye segítségével 2,7 millió alap sokaságból kiválasztásra került egy olyan 100 elemű minta, melyet a továbbiakban vizsgáltunk. Ezen minta alapján megállapítottuk, hogy a szerződéseken képződő árbevétel 98%-os valószínűséggel 2828,88 Ft és 4211,31 Ft között van. A szerződéses ügyfeleken keresztül nagyobb árbevételt lehet realizálni, ezért fontos, hogy a telekommunikációs társaság tisztában legyen a szerződéses ügyfelek arányával. Ennek vizsgálatára használtuk az aránybecslés módszerét. Segítségével megállapítható, hogy az előfizetéses ügyfelek aránya 98%-os megbízhatóság mellett 43,4% és 66,6% között van az alapsokaságban. A mintából a várható értékhez, értékösszeghez és arányhoz hasonlóan a szórás is megbecsülhető. 98%-os megbízhatóság mellett kijelenthető, hogy az árbevétel szórása 2688 Ft és 3749 Ft között van. A hipotézisvizsgálat eszközén keresztül egy, az alapsokaságra megfogalmazott állítást tesztelhetjük a mintán keresztül. A vizsgálat során a Z-próba függvény értéke kívül esik a H0
  • 18. 18 elfogadási tartományon, ezért a H1-et fogadjuk el, vagyis az egymintás hipotézis vizsgálaton keresztül 95%-os valószínűséggel meghatároztuk, hogy a szerződésenkénti átlagos árbevétel 3600 Ft alatt van. A kétmintás hipotézis vizsgálattal 95%-os valószínűséggel megállíthatjuk, hogy a szerződéses ügyfelek esetében az árbevétel több, mint 1500 Ft-tal magasabb, mint a kártyás ügyfelek esetében. Az árbevétel hisztogramjáról és az illeszkedésvizsgálat alapján biztosan kijelenthető, hogy az árbevétel alakulása nem követi a normális eloszlást, erős baloldali aszimmetria figyelhető meg. A korreláció és regresszió számítás segítségével konstatáltuk, hogy a szerződéses ügyfelek esetében az árbevétel és az adatforgalom között pozitív irányú, közepes erősségű kapcsolat figyelhető meg (0,5297). A többváltozós regresszió számítás során megvizsgáltuk, hogy a szerződéses ügyfelek esetében milyen erősségű a fennálló kapcsolat az árbevétel, a lakóhely, az életkor és az adatforgalom között. Ebben az esetben az árbevételt tekintjük eredményváltozónak. A vizsgált ismérvek között közepes erősségű a kapcsolat (0,5525), és hogy a szerződéses ügyfelek esetében a lakóhely, az életkor és az adatforgalom együttesen 30,5%-ban magyarázzák az árbevétel alakulását. A hipotézist a lakóhelykód és az életkor esetében elfogadjuk, vagyis ezek a változók nincsenek hatással az árbevételre a szerződéses ügyfelek esetében 95%-os valószínűséggel.
  • 19. 19 Táblázatok jegyzéke: 1. tábla: Az árbevétel várható értékének becslése.............................................................................. 5 2. tábla: Szerződéses ügyfelek arányának becslése............................................................................. 5 3. tábla: Szórásbecslés............................................................................................................................. 6 4. tábla: Osztályközös gyakorisági sor az adatforgalomra ...................................................................... 8 5. tábla: kétmintás t-próba az Excel adatelemzésével készítve ......................................................... 9 6. tábla: Hisztogram az árbevétel alapján.............................................................................................. 10 7. tábla: A Χ2 próbafüggvény értékének meghatározása normális eloszlás tesztelése során ................ 11 8. tábla: A feltételezett egyenletes eloszlással kiegészített hisztogram az árbevétel alapján.............. 12 9. tábla: Az r és az r2 mutató értéke...................................................................................................... 12 10. tábla: Regressziós statisztika az excel adatelemzés eszközével ...................................................... 13 11. tábla: Regressziós statisztika az excel adatelemzés eszközével készítve (mindhárom output tála) 14 12. tábla: Az exponenciális és hatványos regressziós függvények, a kapcsolódó determinációs együtthatók valamint a kijelölt trendek................................................................................................. 15 13. tábla: Többváltozós regressziós statisztika az excel adatelemzés eszközével készítve (első két output tábla)........................................................................................................................................... 16 14. tábla: Többváltozós regressziós statisztika az excel adatelemzés eszközével készítve (harmadik output tábla)........................................................................................................................................... 16 Felhasznált Irodalom Korpás Attiláné dr.: Általános statisztika I., Nemzeti Tankönyvkiadó, 2003 Sándorné Dr. Kriszt Éva, Varga Edit, Veitzné Kenyeres Erika, Korpás Attiláné Dr.. (szerk.): Általános Statisztika II.(Nemzeti Tankönyvkiadó, Budapest 1997) Központi Statisztikai Hivatal: Statisztikai évkönyv, 2012
  • 20. 20 Mellékletek 1. számú melléklet: A feladatmegoldás során használt minta (teljes): Nem Életkor Budapest/Vidék Előfizetés/Feltöltő kártyás Árbevétel (Ft) Adatforgalom (Mb) F 36 Vidék szerződéses 4 480 423 N 24 Budapest szerződéses 6 310 1 320 N 50 Vidék szerződéses 5 750 334 N 40 Vidék szerződéses 13 400 340 F 24 Vidék szerződéses 1 670 0 N 25 Vidék szerződéses 4 210 550 F 59 Budapest szerződéses 5 760 140 N 63 Vidék szerződéses 1 430 3 N 37 Budapest szerződéses 3 720 519 N 20 Budapest szerződéses 5 210 1 430 F 33 Budapest szerződéses 5 850 1 135 F 33 Vidék szerződéses 12 020 5 103 N 29 Vidék szerződéses 7 730 1 640 N 49 Vidék szerződéses 1 410 7 F 26 Budapest szerződéses 7 430 6 470 F 21 Vidék szerződéses 2 180 204 N 27 Vidék szerződéses 7 230 3 220 N 44 Vidék szerződéses 1 670 78 F 54 Vidék szerződéses 2 060 273 F 78 Budapest szerződéses 7 840 217 N 36 Budapest szerződéses 1 650 25 N 29 Budapest szerződéses 13 400 2 683 N 33 Vidék szerződéses 2 870 48 F 31 Vidék szerződéses 4 505 646 N 53 Budapest szerződéses 7 980 4 750 N 23 Vidék szerződéses 6 740 3 012 N 29 Budapest szerződéses 3 650 785 N 35 Vidék szerződéses 9 350 570 F 27 Vidék szerződéses 3 820 742 N 54 Budapest szerződéses 2 740 148 N 20 Budapest szerződéses 3 010 428 F 38 Vidék szerződéses 3 200 574 F 39 Vidék szerződéses 8 300 447 N 30 Budapest szerződéses 8 910 2 171 F 28 Vidék szerződéses 8 950 694 F 30 Vidék szerződéses 1 860 174 F 57 Vidék szerződéses 6 300 612 F 54 Budapest szerződéses 6 750 0 N 71 Budapest szerződéses 1 970 73 N 19 Vidék szerződéses 2 360 863 N 29 Budapest szerződéses 6 410 2 730 F 49 Budapest szerződéses 2 900 482 N 54 Budapest szerződéses 3 600 663 F 19 Budapest szerződéses 3 405 649 N 19 Budapest szerződéses 4 640 1 360 F 57 Budapest szerződéses 10 130 1 710 F 22 Vidék szerződéses 2 870 142 Havi átlagos
  • 21. 21 N 32 Vidék szerződéses 5 190 910 N 21 Vidék szerződéses 6 340 1 745 F 50 Budapest szerződéses 9 710 210 N 48 Vidék szerződéses 11 040 3 120 F 31 Vidék szerződéses 2 230 163 F 44 Vidék szerződéses 3 750 379 F 35 Vidék szerződéses 5 640 2 754 F 29 Budapest szerződéses 5 030 784 N 26 Vidék kártyás 740 1901 N 74 Vidék kártyás 630 621 F 81 Vidék kártyás 450 1277 F 35 Vidék kártyás 1 320 1274 F 18 Vidék kártyás 3 760 1539 F 16 Budapest kártyás 2 100 2226 N 56 Vidék kártyás 540 2368 F 21 Vidék kártyás 760 2531 N 15 Budapest kártyás 840 2581 N 64 Vidék kártyás 1 090 2677 F 52 Vidék kártyás 675 2238 N 43 Vidék kártyás 1 110 2799 F 40 Vidék kártyás 570 784 F 30 Vidék kártyás 675 2133 F 20 Budapest kártyás 1 230 2729 F 41 Budapest kártyás 1 240 2756 F 22 Vidék kártyás 3 540 2737 F 61 Vidék kártyás 1 340 898 F 65 Budapest kártyás 535 916 N 22 Budapest kártyás 1 220 1396 N 79 Vidék kártyás 810 1480 N 32 Vidék kártyás 930 1347 F 68 Budapest kártyás 1 030 2706 N 47 Vidék kártyás 1 710 2126 N 47 Budapest kártyás 2 710 2199 F 76 Vidék kártyás 935 1041 N 16 Budapest kártyás 745 2853 F 36 Budapest kártyás 1 750 767 F 29 Budapest kártyás 1 830 802 N 16 Budapest kártyás 1 390 453 F 62 Vidék kártyás 1 160 2810 F 17 Vidék kártyás 2 020 2801 N 28 Vidék kártyás 1 090 1403 N 32 Budapest kártyás 1 250 2773 F 34 Budapest kártyás 1 550 1272 F 66 Budapest kártyás 1 870 1379 N 20 Vidék kártyás 1 130 2123 F 27 Vidék kártyás 1 130 1051 N 20 Vidék kártyás 470 1675 F 37 Vidék kártyás 540 2241 F 38 Vidék kártyás 1 065 2418 F 40 Vidék kártyás 1 210 560 F 20 Vidék kártyás 3 300 1103 F 19 Vidék kártyás 1 650 1569 F 24 Vidék kártyás 810 2668
  • 22. 22 2. számú melléklet: A szerződéses ügyfelekre szűkített minta Előfizetés/Feltöltő kártyás Árbevétel (Ft) (X) Adatforgalom (Mb)(Y) szerződéses 4480 423 szerződéses 6310 1320 szerződéses 5750 334 szerződéses 13400 340 szerződéses 1670 0 szerződéses 4210 550 szerződéses 5760 140 szerződéses 1430 3 szerződéses 3720 519 szerződéses 5210 1430 szerződéses 5850 1135 szerződéses 12020 5103 szerződéses 7730 1640 szerződéses 1410 7 szerződéses 7430 6470 szerződéses 2180 204 szerződéses 7230 3220 szerződéses 1670 78 szerződéses 2060 273 szerződéses 7840 217 szerződéses 1650 25 szerződéses 13400 2683 szerződéses 2870 48 szerződéses 4505 646 szerződéses 7980 4750 szerződéses 6740 3012 szerződéses 3650 785 szerződéses 9350 570 szerződéses 3820 742 szerződéses 2740 148 szerződéses 3010 428 szerződéses 3200 574 szerződéses 8300 447 szerződéses 8910 2171 szerződéses 8950 694 szerződéses 1860 174 szerződéses 6300 612 szerződéses 6750 0 szerződéses 1970 73 szerződéses 2360 863 szerződéses 6410 2730 szerződéses 2900 482 szerződéses 3600 663 szerződéses 3405 649 szerződéses 4640 1360 szerződéses 10130 1710 szerződéses 2870 142 szerződéses 5190 910 szerződéses 6340 1745 szerződéses 9710 210 szerződéses 11040 3120 szerződéses 2230 163 szerződéses 3750 379 szerződéses 5640 2754 szerződéses 5030 784 A felhasznált minta (alapmintából szűrve)