More Related Content Similar to Chương 02 (20) Chương 021. Phaân tích döõ lieäu baèng SPSS
CHÖÔNG 5: CAÙC PHEÙP BIEÁN ÑOÅI VAØ THAO TAÙC TREÂN TAÄP DÖÕ LIEÄU
1. Maõ hoùa laïi (Recode)
Recode laø coâng cuï duøng ñeå maõ hoùa laïi caùc giaù trò trong moät bieán thaønh caùc giaù trò
maõ hoùa môùi phuø hôïp vôùi ñoøi hoûi cuûa quaù trình phaân tích döõ lieäu. Ví duï ñoái vôùi caâu
hoûi nguoàn goác nhaän bieát quaûng caùo cuûa saûn phaåm X, ngöôøi traû lôøi coù theå traû lôøi cuï
theå treân baùo Saøi Goøn, Tuoåi Treû, Taïp chí Söùc Khoûe vaø Ñôøi soáng, Treân ñaøi HTV7,
Treân ñaøi VTV3, … Coù theå ban ñaàu caùc nguoàn quaûng caùo ñöôïc maõ hoùa moät caùch
rieâng bieät. Tuy nhieân do nhu caàu xöõ lyù sau naøy, ngöôøi nghieân cöùu muoán nhoùm caùc
giaù trò ñöôïc maõ hoùa rieâng bieät naøy thaønh ba loaïi nguoàn quaûng caùo chính laø Baùo,
Taïp Chí vaø Tivi. Coâng cuï Recode cho pheùp ta ñònh laïi caùc giaù trò rieâng bieät veà
nguoàn quaûng caùo ban ñaàu thaønh ba nguoàn quaûng caùo chung laø Baùo, Tivi vaø taïp
chí.
SPSS cung caáp cho ta hai loaïi Recode laø Recode treân cuøng moät bieán (Recode into
same variables) vaø recode vaøo bieán khaùc (Recode into different variable).
1.1. Maõ hoùa laïi treân cuøng moät bieán (Recode into same variables)
Recode treân cuøng moät bieán laø maõ hoùa laïi nhöõng giaù trò trong moät bieán hieän höõu
thaønh nhöõng giaù trò môùi vaø caùc giaù trò môùi naøy seõ naèm ngay trong bieán hieän höõu vaø
thay theá caùc giaù trò cuû treân bieán ñoù. Khi söû duïng coâng cuï naøy ta seõ maát ñi caùc giaù
trò ñaõ khai baùo ban ñaàu trong bieán maø ta thöïc hieän leänh Recode. Chuù yù caùc giaù trò
vöøa ñöôïc taïo ra chöa coù nhaõn, do ñoù sau khi thöïc hieän leänh ta phaûi tieán haønh khai
baùo nhaõn cho giaù trò (ñaõ ñeà caäp trong phaàn khai baùo bieán). Phöông phaùp naøy ñöôïc
thöïc hieän qua caùc böôùc sau:
- Choïn transform/recode töø thanh menu chính. ÔÛ ñaây ta löïa choïn Recode into
same variable ñeå tieán haønh ñònh laïi giaù trò cuûa bieán treân cuøng moät bieán. Ta
coù hoäp thoaïi nhö hình 5-1:
Hình 5-1
Bieân soaïn: Ñaøo Hoaøi Nam 19
2. Phaân tích döõ lieäu baèng SPSS
- Chuyeån caùc bieán caàn maõ hoùa laïi sang hoäp thoaïi variables, nhaán thanh Old
and New Values ñeå chuyeån caùc giaù trò cuû caàn thay ñoåi thaønh caùc giaù trò môùi.
Ta coù hoäp thoaïi Old and New values nhö hình 5-2:
Hình 5-2
- Old value duøng ñeå khai baùo giaù trò cuû caàn chuyeån ñoåi. Giaù trò cuû naøy coù theå
laø moät giaù trò ñôn leû(Value), moät giaù trò khuyeát maëc ñònh hay giaù trò khuyeát
khai baùo (System-missing or User-missing), moät daõy caùc giaù trò (Range),
hoaëc toaøn boä caùc giaù trò naøo ñoù trong bieán (All other values). New value
duøng ñeå khai baùo giaù trò môùi seõ thay theá cho giaù trò cuû töông öùng. Nhaán
thanh Add ñeå löu söï chuyeån ñoåi naøy. Caùc giaù trò chuyeån ñoåi coù theå söûa chöûa
hoaëc loaïi boû baèng caùch di chuyeån veät toái ñeán bieåu thöùc theå hieän söï chuyeån
ñoåi trong hoäp thoaïi Old->New vaø nhaán thanh Change cho söï thay ñoåi hoaëc
Remove ñeå loaïi boû.
- Neáu vieäc ñònh laïi giaù trò cuûa caùc giaù trò cuûa bieán coù moät soá ñieàu kieän keøm
theo, ta coù theå duøng coâng cuï if ñeå ñònh ra caùc ñieàu kieän cho leänh recode.
Hoäp thoaïi If Cases nhö hình 5-3:
Hình 5-3
- Trong hoäp thoaïi If Cases, maëc ñònh laø khoâng coù ñieàu kieän naøo caû, pheùp ñònh
laïi giaù trò cuûa bieán ñöôïc thöïc hieän cho taát caû caùc quan saùt, ôû ñaây hieån thò laø
Bieân soaïn: Ñaøo Hoaøi Nam 20
3. Phaân tích döõ lieäu baèng SPSS
Include all cases. Choïn leänh include if case satisfies condition ñeå xaùc ñònh
caùc ñieàu kieän trong vieäc ñònh laïi giaù trò cuûa bieán. Chuyeån teân bieán caàn ñònh
laïi caùc giaù trò vaøo hoäp thoaïi beân phaûi. Luùc naøy pheùp ñònh laïi giaù trò cuûa bieán
noùi treân chæ ñöôïc thöïc hieän ñoái vôùi caùc quan saùt naøo thoûa maõn ñöôïc bieåu
thöùc ñieàu kieän ñöôïc theå hieän trong hoäp thoaïi ñieàu kieän naøy. Ví duï chæ thöïc
hieän leänh recode ñoái vôùi nhöõng tröôøng hôïp quan saùt ôû khu vöïc (bieán kvuc)
TP.HCM (coù giaù trò maõ hoùa laø 2) ta khai baùo bieåu thöùc ñieàu kieän nhö sau
kvuc = 2.
1.2. Maõ hoùa laïi vaøo moät bieán khaùc (Recode into different variables)
Trong tröôøng hôïp ñònh laïi caùc giaù trò hieän taïi cuûa moät bieán thaønh caùc giaù trò môùi
trong moät bieán môùi ta seõ löïa choïn transform/recode/into different variable vaø ta coù
hoäp thoaïi nhö hình 5-4:
Hình 5-4
Söû duïng phöông phaùp recode vaøo moät bieán môùi maùy tính seõ töï ñoäng taïo ra moät
bieán môùi treân cô sôû döõ lieäu ñeå chöùa caùc giaù trò môùi vöøa ñöôïc taïo ra, ñoàng thôøi ta
cuõng vaãn löu giöõ ñöôïc bieán cuû vôùi caùc giaù trò maõ hoùa cuû treân cô sôû döõ lieäu. Chuù yù
caùc giaù trò vöøa ñöôïc taïo ra chöa coù nhaõn, do ñoù sau khi thöïc hieän leänh ta phaûi tieán
haønh khai baùo nhaõn cho giaù trò (ñaõ ñeà caäp trong phaàn khai baùo bieán). Vieäc maõ hoùa
laïi caùc giaù trò vaøo trong moät bieán môùi ñöôïc thöïc hieän qua caùc böôùc sau:
- Chuyeån teân bieán caàn ñònh laïi giaù trò vaøo trong hoäp thoaïi variables. Khai baùo
teân bieán môùi vaø nhaõn bieán môùi seõ chöùa caùc giaù trò vöøa ñöôïc maõ hoùa laïi
trong hoäp thoaïi Output variable. Nhaán thanh change ñeå xaùc nhaän söï khaùi
baùo naøy.
- Caùc coâng cuï If vaø Old and New Values cuõng coù yù nghóa vaø thao taùc töông
töï nhö tröôøng hôïp ñònh laïi giaù trò cho cuøng moät bieán, ñaõ ñöôïc ñeà caäp ôû phaàn
treân.
Bieân soaïn: Ñaøo Hoaøi Nam 21
4. Phaân tích döõ lieäu baèng SPSS
Coâng cuï naøy coù öa ñieåm laø ta vöøa taïo ra ñöôïc moät bieán môùi vôùi caùc giaù trò ñöôïc
maõ hoùa theo caùch môùi nhöng ñoàng thôøi vaãn giöõa ñöôïc bieán goác vôùi caùc giaù trò maõ
hoùa ban ñaàu. Trong khi vôùi phöông phaùp maõ hoùa laïi döõ lieäu treân cuøng moät bieán,
caùc giaù trò maõ hoùa môùi seõ choàng leân caùc giaù trò cuû vaø ta ñaõ maát ñi caùc giaù trò maõ
hoùa ban ñaàu treân bieán ñoù.
2. Coâng cuï töï ñoäng maõ hoùa laïi (Automatic Recode)
Laø phöông phaùp maõ hoùa töï ñoäng caùc giaù trò daïng chuoåi sang daïng soá vaøo trong
moät bieán môùi. Bieán môùi naøy seõ chöùa caùc con soá nguyeân lieân tuïc, moãi con soá
nguyeân trong bieán môùi seõ ñaïi dieän cho caùc giaù trò daïng chuoåi gioáng nhau .
Ví duï khi ban ñaàu ta nhaäp döõ lieäu ñòa baøn nghieân cöùu (quaän) nhö Bình Thaïnh,
Quaän 1, Quaän 2, Taân Bình, … ôû daïng chuoåi. Ta coù theå recode caùc giaù trò naøy thaønh
caùc giaù trò soá nhö 1, 2, 3 moät caùc töï ñoäng baèng coâng cuï Automatic Recode. Vaø moãi
con soá nguyeân naøy seõ ñaïi dieän cho töøng ñòa baøn nghieân cöùu, nhö Quaän 1 ñöôïc
chuyeån thaønh 1, quaän 2 laø 2, …, Quaän Taân Bình laø 19. Ñoái vôùi caùch Recode naøy
caùc giaù trò nguyeân thuûy (quaän 1, quaän 2, …) seõ ñöôïc söõ duïng nhö laø nhaõn cuûa giaù
trò ñaõ ñöôïc recode trong bieán môùi ñöôïc taïo ra töø leänh Automatic Recode. Caùc giaù
trò daïng chuoåi ñöôïc maõ hoùa theo thöù töï alphabe.
3. Löïa choïn caùc quan saùt (Select Cases)
Coâng cuï Select Cases ñöa ra moät vaøi phöông phaùp cho pheùp ta löïa choïn ra nhöõng
nhoùm nhoû caùc tröôøng hôïp quan saùt döïa treân tieâu chuaån hay ñieàu kieän cuï theå. Ta
cuõng coù theå duøng phöông phaùp naøy ñeå löïa choïn moät maãu ngaãu nhieân caùc tröôøng
hôïp quan saùt töø toång theå döõ lieäu. Ñeå thöïc hieän leänh löïa choïn caùc quan saùt naøy ta
choïn Data/select cases töø menu ta seõ coù hoäp thoaïi nhö hình 5-5:
Trong hoäp thoaïi Select Cases caùc bieán ñöôïc lieät keâ ôû beân traùi hoäp thoaïi, Beân phaûi
hoäp thoaïi lieät keâ caùc daïng löïa choïn. Löïa choïn All Cases laø traïng thaùi löïa choïn
maëc ñònh vaø ôû traïng thaùi naøy coù yù nghóa laø toaøn boä caùc tröôøng hôïp quan saùt ñang
ñöôïc löïa choïn.
Chuù yù sau khi thöïc hieän vieäc choïn löïa caùc tröôøng hôïp. Caùc thao taùc thoáng keâ trong
SPSS luùc naøy chæ thöïc hieän treân caùc tröôøng hôïp ñöôïc löïa choïn. Do ñoù sau khi thöïc
hieän vieäc phaân tích treân caùc tröôøng hôïp ñöôïc löïa choïn, ta caàn traû döõ lieäu laïi traïng
thaùi ban ñaàu (kh6ng coù löïa choïn caùc tröôøng hôïp) baèng caùch choïn All Cases trong
phaàn Select cuûa hoäp thoaïi Select Cases.
Trong phaàn Unselected Cases cho bieát traïng thaùi cuûa caùc tröôøng hôïp khoâng ñöôïc
löïa choïn. Filtered chæ ra caùc tröôøng hôïp khoâng ñöôïc choïn vaãn ñöôïc giöõ laïi trong
taäp tin nhöng seõ bò loaïi tröø ra moïi phaân tích thoáng keâ. Select Cases taïo ra moät bieán
loïc (FILTER_$), vôùi caùc tröôøng hôïp ñöôïc choïn coù giaù trò 1 vaø caùc tröôøng hôïp
khoâng ñöôïc choïn coù giaù trò 0. Deleted cho pheùp loaïi boû toaøn boä caùc tröôøng hôïp
khoâng ñöôïc choïn ra khoûi döõ lieäu.
Bieân soaïn: Ñaøo Hoaøi Nam 22
5. Phaân tích döõ lieäu baèng SPSS
Ñeå nhaän bieát ñöôïc caùc tröôøng hôïp naøo ñöôïc choïn hoaëc khoâng ñöôïc choïn ta coù theå
nhìn vaøo caùc giaù trò trong bieán FILTER_$, caùc tröôøng hôïp ñöôïc choïn coù giaù trò 1 vaø
nhöõng tröôøng hôïp khoâng ñöôïc choïn coù giaù trò 0. Hoaëc ta coù theå nhìn vaøo maøn hình
Data ñeå phaân bieät caùc tröôøng hôïp. Vôùi caùc tröôøng hôïp khoâng ñöôïc löïa choïn seõ coù
moät gaïch cheùo trong thanh soá thöù töï haøng beân traùi maøn hình (Xem hình 20). Coù theå
duøng coâng cuï Sort Cases ñeå xaép xeáp theo thöù töï caùc tröôøng hôïp ñöôïc choïn hay
khoâng ñöôïc choïn (Sort cases theo bieán FILTER_$).
Hình 5-5
Ñeå tieán haønh choïn löïa caùc tröôøng hôïp ta coù theå duøng caùc caùch sau:
- Löïa choïn coâng cuï If conditions are satisfied (xem hình 5-6) cho pheùp ta löïa
choïn caùc tröôøng hôïp döïa treân caùc bieåu thöùc ñieàu kieän. Moät bieåu thöùc ñieàu
kieän cho ta caùc giaù trò ñuùng hoaëc sai cuûa caùc tröôøng hôïp. Neáu keát quaû cuûa
bieàu thöùc ñieàu kieän laø ñuùng, tröôøng hôïp ñoù ñöôïc löïa choïn. Neáu keát quaû naøy
laø sai hoaëc thieáu thì caùc tröôøng hôïp ñoù khoâng ñöôïc choïn. Ví duï ñoái vôùi bieán
giôùi tính (GTinh)coù hai giaù trò laø Nam: 1 vaø Nöõ: 2. Ta tieán haønh choïn caùc
tröôøng hôïp laø Nam baèng caùch choïn bieán giôùi tính trong hoäp beân traùi vaø
chuyeån sang hoäp beân phaûi. Hieãn thò bieåu thöùc ñieàu kieän nhö sau Gtinh=1.
Luùc ñoù caùc tröôøng hôïp naøo thoûa maõn ñieàu kieän Gtinh=1 seõ ñöôïc löïa choïn.
Caùc bieåu thöùc ñieàu kieän coù theå bao goàm teân bieán, caùc haèng soá, caùc toaùn töû,
caùc con soá, caùc haøm soá, …
- Coâng cuï random sample of cases (hình 5-7) cho pheùp chuùng ta löïa choïn moät
maãu ngaãu nhieân döïa treân moät tyû leä phaàn traêm hoaëc moät soá chính xaùc caùc
tröôøng hôïp seõ löïa choïn.
Bieân soaïn: Ñaøo Hoaøi Nam 23
6. Phaân tích döõ lieäu baèng SPSS
- Coâng cuï Base range (hình 5-8) cho pheùp löïa choïn caùc tröoøng hôïp theo soá
thöù töï haøng hieãn thò beân traùi maøn hình döõ lieäu cuûa SPSS
Hình 5-6
Hình 5-7
Hình 5-8
4. Taùch taäp döõ lieäu (Split File)
Coâng cuï Split File cho pheùp taùch döõ lieäu trong taäp döõ lieäu ñang quan saùt thaønh
nhöõng nhoùm nhoû rieâng bieät vaø sau khi thöïc hieän leänh Split file naøy caùc phaân tích
xöõ lyù thoáng keâ seõ cho ta caùc keát quaû thoáng keâ ñaõ ñöôïc thöïc hieän rieâng bieät theo
töøng nhoùm nhoû döõ lieäu naøy.
Bieân soaïn: Ñaøo Hoaøi Nam 24
7. Phaân tích döõ lieäu baèng SPSS
Ñeå thöïc hieän leänh naøy ta choïn Data/Split File töø menu ta coù hoäp thoaïi nhö hình 5-
9:
Hình 5-9
Vieäc phaân taùch naøy döïa treân vieäc phaân döõ lieäu thaønh nhöõng nhoùm töông ñöông vôùi
caùc giaù trò trong bieán ñöôïc löïa choïn ñeå tieán haønh phaân nhoùm. Ñöôïc söû duïng cho
vieäc phaân tích döïa treân nhöõng giaù trò cuûa moät hay nhieàu bieán ñaõ ñöôïc phaân nhoùm.
Neáu ta löïa choïn vieäc phaân taùch döïa treân nhieàu bieán, döõ lieäu seõ ñöôïc nhoùm theo
thöù töï bieán ñöôïc khai baùo trong hoäp thoaïi Groups Based On list.
- Choïn Compare groups: Caùc döõ lieäu phaân tích seõ ñöôïc taùch theo caùc giaù trò
cuûa bieán ñöôïc löïa choïn ñeå taùch döõ lieäu (hieãn thò trong hoäp Groups Based
On list), vaø vieäc taùch naøy mang tính chaát so saùnh do ñoù khi tieán haønh phaân
tích döõ lieäu caùc phaân tích döïa treân söï phaân taùch naøy nhöõng vaãn ñöôïc theå
hieän treân cuøng moät baûng.
- Choïn Organize output by groups: Caùc döõ lieäu phaân tích seõ ñöôïc taùch theo
caùc giaù trò cuûa bieán ñöôïc löïa choïn ñeå taùch döõ lieäu (hieãn thò trong hoäp
Groups Based On list), vaø vieäc taùch naøy mang tính chaát toå chöùc laïi döõ lieäu
thaønh nhöõng nhoùm nhoû do ñoù khi tieán haønh phaân tích döõ lieäu caùc phaân tích
döïa treân söï phaân taùch vaø ñöôïc theå hieän moät caùc rieâng bieät giöõa caùc nhoùm
phaân taùch
Chuù yù sau ki tieán haønh phaân tích treân söï phaân taùch, ñeå trôû laïi traïng thaùi bình
thöôøng cuûa döõ lieäu ñoøi hoûi phaûi boû ñi leänh taùch döõ lieäu vöøa ñöa ra baèng caùch choïn
phaàn Analyze all cases, do not create groups trong hoäp thoaïi Slipt Files
5. Coâng cuï tính toaùn giöõa caùc bieán (Compute)
Bieân soaïn: Ñaøo Hoaøi Nam 25
8. Phaân tích döõ lieäu baèng SPSS
Coâng cuï compute ñöôïc duøng ñeå tính toaùn giöõa caùc giaù trò trong caùc bieán vaø keát
quaû seõ ñöôïc löu giöõ trong moät bieán môùi hoaëc laø moät bieán khaùc saún coù hoaëc bieán
chöùa ñöïng giaù trò ñang tính toaùn.
Ñeå thöïc hieän coâng cuï naøy ta truy xuaát coâng cuï compute variable töø transform treân
thanh menu ta coù hoäp thoaïi nhö hình 5-10:
Hình 5-10
- Target variable chöùa ñöïng teân bieán seõ nhaän giaù trò ñöôïc tính. Ta coù theå khaùi
baùo kieåu vaø gaùn nhaõn cho caùc giaù trò cuûa bieán baèng caùch nhaán vaøo thanh
Type&lable. OÂ Numeric Expression chöùa ñöïng caùc bieåu thöùc soá ñöôïc duøng
ñeå tính giaù trò cho bieán ñích (bieán chöùa ñöïng giaù trò môùi), bieåu thöùc naøy coù
theå duøng teân caùc bieán saün coù, caùc haèng, caùc toaùn töû vaø caùc haøm soá. Chuùng
ta co theå soaïn caùc bieåu thöùc tính toaùn vaøo thaüng oâ Numeric Expression, vaø
coù theå söõ duïng caùc coâng cuï ñöôïc hieån thò trong hoäp thoaïi nhö caùc phieám (+),
(-), Function,…
- Coâng cuï if duøng ñeå ñònh ra nhöõng ñieàu kieän caàn thieát keøm theo trong tính
toaùn neáu coù, ñöôïc söû duïng gioáng nhöù gioáng nhö coâng cuï if trong hoäp thoaïi
recode, ñaõ ñöôïc ñeà caäp ôû phaàn treân.
6. Coâng cuï ñeám (Count)
Bieân soaïn: Ñaøo Hoaøi Nam 26
9. Phaân tích döõ lieäu baèng SPSS
Coâng cuï naøy ñöôïc duøng ñeå taïo ra moät bieán môùi chöùa keát quaû soá laàn xuaát hieän (soá
ñeám) cuûa moät giaù trò hay nhieàu giaù trò ñöôïc chæ ñònh ra trong danh saùch caùc bieán
ñöôïc choïn trong ô variables trong moãi tröôøng hôïp. Töø menus ta choïn
Transform/count ñeå coù ñöôïc hoäp thoaïi nhö hình 5-11
Hình 5-11
Moät bieán môùi seõ ñöôïc taïo ra khi ta thöïc hieän thuû tuïc Count goïi laø bieán ñích (Taget
variable) seõ chöùa ñöïng giaù trò coäng doàn moãi khi gaëp ñöôïc giaù trò caàn ñeám trong
moät hoaëc nhieàu bieán ñaõ ñöôïc khai baùo tröôùc trong hoäp thoaïi Numeric variables.
Giaù trò caàn ñeám seõ ñöôïc ñònh roõ trong phaàn Define values (hình 5-12). Giaù trò khai
baùo ñeå ñeám coù theå laø nhöõng giaù trò cuï theå naøu ñoù (Value), hoaëc nhöõng giaù trò roãng
(System missing) hoaëc laø moät daõy caùc giaù trò (range). Sau khi khai baùo giaù trò caàn
ñeám ta duøng thanh Add ñeå xaùc nhaän giaù trò caàn ñeám vaøo trong hoäp thoaïi Values to
count. Söû duïng Change hoaëc Remove ñeå thay theá hoaëc loaïi boû giaù trò caàn ñeá m
(giaù trò ñaõ ñöôïc ñaùnh daáu baèng veát ñen).
Hình 5-12
Coâng cuï If duøng ñeå xaùc ñònh caùc ñieàu kieän neáu coù khi thöïc hieän leänh Count,
(gioáng nhö coâng cuï if trong phaàn recode ñaõ ñöoïc ñeà caäp ôû treân)
7. Hôïp nhaát caùc taäp döõ lieäu (Merge files)
Bieân soaïn: Ñaøo Hoaøi Nam 27
10. Phaân tích döõ lieäu baèng SPSS
SPSS cho pheùp ta hôïp caùc döõ lieäu quan saùt töø trong moät taäp döõ lieäu beân ngoaøi vaøo
taäp döõ lieäu ñang söû duïng. Hoaëc hôïp caùc bieán môùi trong taäp döõ lieäu beân ngoaøi vaøo
taäp döõ lieäu ñang hoaït ñoäng. Caû hai ñeàu taïo ra moät taäp döõ lieäu môùi coù theå chöùa taát
caû caùc quan saùt ñöôïc hôïp laïi hoaëc taát caû caùc bieán ñöoïc hôïp tuøy theo ta choïn Add
Cases hay Add Variables
7.1. Theâm vaøo caùc quan saùt (Add Cases)
Coâng cuï Add Cases cho pheùp ta hôïp döõ lieäu trong taäp döõ lieäu ñang hoaït ñoäng vôùi
döõ lieäu trong moät taäp döõ lieäu beân ngoaøi, vôùi ñieàu kieän taäp döõ lieäu ñoù phaûi chöùa
caùc bieán gioáng nhö bieán trong taäp döõ lieäu ñang hoaït ñoäng. Sau khi thao taùc, moät
taäp döõ lieäu môùi (chöa ñöôïc khai baùo teân, vaø ta phaûi tieán haønh löu vaø khai baùo teân
môùi) seõ ñöôïc taïo ra chöùa caùc döõ lieäu trong caû hai taäp döõ lieäu vöøa ñöôïc hôïp laïi vôùi
nhau. Trong tröôøng hôïp hai taäp döõ lieäu hôïp vôùi nhau nhöng coù caùc bieán khaùc nhau
(khaùc nhau veà teân bieán hoaëc loaïi bieán) thì sau khi hôïp taäp döõ lieäu môùi seõ töï ñoäng
loaïi boû caùc bieán khaùc nhau naøy, ta coù theå seõ bò maát döõ lieäu chöùa trong caùc bieán bò
loaïi boû naøy.
Coâng cuï naøy raát thích hôïp cho vieäc hôïp nhaát döõ lieäu nghieân cöùu ôû caùc khu vöïc
khaùc nhau, ví duï nhö moät cuoäc khaûo saùt ñöôïc tieán haønh ôû ba khu vöïc Haø Noäi, Ñaø
Naüng, vaø TP.HCM, döõ lieäu thu thaäp veà seõ ñöôïc nhaäp, chænh söûa cho ba khu vöïc
rieâng bieät. Tuy nhieân sau ñoù ta coù theå tieán haønh hôïp döõ lieäu ôû ba khu vöïc naøy vaøo
moät taäp döõ lieäu thoáng nhaát ñeå tieán haønh phaân tích vaø xöõ lyù. Chuù yù phaûi thoáng nhaát
veà caùc teân bieán, loaïi bieán vaø soá löôïng bieán trong caû ba khu vöïc tröôùc khi nhaäp 3
file naøy laïi vôùi nhau.
Choïn Data/Merge Files/Adds Cases (Xem hình 5-13)
Hình 5-13
Hoäp thoaïi Read File cho pheùp ta löïa choïn taäp döõ lieäu seõ ñöôïc hôïp vôùi taäp döõ lieäu
ñang hoaït ñoäng (working file). Nhaán Open ñeå xaùc nhaän vieäc löïa choïn naøy
Bieân soaïn: Ñaøo Hoaøi Nam 28
11. Phaân tích döõ lieäu baèng SPSS
Sau khi löïa choïn xong taäp döõ seõ ñöôïc keát hôïp, ta seõ coù moät hoäp thoaïi môùi nhö
hình 5-14:
Hình 5-14
Unpaired Variables: lieät keâ caùc bieán khoâng gioáng nhau giöõa hai taäp döõ lieäu
ñang ñöôïc tieán haønh hôïp nhaát laïi, caùc bieán khoâng gioáng nhau naøy seõ bò loaïi
ra vaø khoâng coù trong taäp döõ lieäu môùi ñöôïc taïo ra töø vieäc hôïp nhaát hai taäp döõ
lieäu ban ñaàu. Caùc bieán naøy ñöôïc kyù hieäu khaùc nhau vôùi kyù hieäu (*) ñaïi dieän
cho caùc bieán trong taäp döõ lieäu ñang hoaït ñoäng vaø (+) ñaïi dieän cho caùc bieán
trong taäp döõ lieäu ñöôïc truy xuaát töø beân ngoaøi. Nhöõng bieán ñöôïc lieät keâ
trong hoäp thoaïi Unpaired Variables laø nhöõng bieán coù nhöõng ñaëc ñieåm nhö
sau:
- Hai bieán coù teân bieán ñöôïc khai baùo khaùc nhau
- Nhöõng bieán coù daïng döõ lieäu khaùc nhau
- Caû hai bieán bieán cuøng laø daïng chuoåi nhöng lai khoâng baèng nhau veà
soá kyù töï trong chuoåi.
Cac bieán naøy nhö ñaõ noùi seõ bò loaïi boû ra khoûi taäp döõ lieäu vöøa hôïp nhaát, ñieàu
naøy ñoàng nghóa ta bò maát döõ lieäu sau khi hôïp nhaát, do ñoù caàn phaûi khaéc
phuïc sai soùt naøy ñeå baûo ñaûm tính ñaày ñuû cuûa döõ lieäu sau khi hôïp nhaát. Caùc
bieán naøy seõ ñöôïc hôïp laïi vôùi nhau baèng caùnh ñaùnh daáu hai bieán ñoù (trong
hoäp thoaïi Unpaired Variables) vaø nhaán thanh Pair, luùc ñoù döõ lieäu trong hai
bieán naøy seõ ñöôïc hôïp nhaát vaø ñöôïc chöùa ñöïng trong bieán laáy teân bieán gioáng
nhö teân bieán trong taäp tin ñang hoaït ñoäng. Hoaëc ta coù theå duøng coâng cuï
Rename ñeå khai baùo laïi teân bieán hoaëc kieåu bieán cho gioáng nhau.
Hoäp thoaïi Variables in New Working Data File lieät keâ caùc bieán seõ coù trong
taäp tin môùi ñöôïc taïo ra töø vieäc hôïp nhaát hai taäp döõ lieäu ban ñaàu. Toaøn boä
Bieân soaïn: Ñaøo Hoaøi Nam 29
12. Phaân tích döõ lieäu baèng SPSS
caùc bieán trong hai taäp tin ban ñaàu thoûa maõn caùc ñieàu kieän gioáng nhau veà
teân vaø loaïi döõ lieäu (soá hoaëc chuoåi) seõ ñöôïc lieät keâ vaøo hoäp thoaïi naøy
Chuùng ta cuõng coù theå loaïi boû nhöõng bieán maø chuùng ta khoâng muoán coù trong
taäp döõ lieäu hôïp nhaát. Baèng caùch ñaùnh daáu caùc bieán ñoù (trong oâ variables in
new data working file) vaø chuyeån sang oâ Unpaired Variables
1.2. Theâm vaøo caùc bieán (Add Variables)
Coâng cuï Add Variables cho pheùp hôïp nhaát döõ lieäu trong taäp tin ñang hoaït ñoäng vôùi
moät taäp tin beân ngoaøi vôùi ñieàu kieän taäp tin beân ngoaøi naøy phaûi chöùa ñöïng cuøng caùc
quan saùt vôùi taäp tin ñang söû duïng, nhöng khaùc nhau veà bieán (khai baùo teân bieán
khaùc vôùi taäp tin ñang ñöôïc söû duïng), quaù trình naøy seõ taïo ra moät taäp döõ lieäu môùi
chöùa cuøng caùc quan saùt nhöng taäp hôïp taát caû caùc bieán khaùc nhau trong hai taäp döõ
lieäu ban ñaàu.
Coâng cuï naøy thích hôïp vôùi caùc cuoäc nghieân cöùu ñöôïc chia laøm nhieàu giai ñoaïn. Ví
duï nhö nghieân cöùu veà möùc ñoä aûnh höôûng cuûa moät chöông trình quaûng caùo, ngöôøi
ta thöôøng nghieân cöùu moät soá ñoái töôïng ngöôøi traû lôøi veà saûn phaåm xaép ñöôïc quaûng
caùo tröôùc khi tung chöông trình quaûng caùo ñoù ra thò tröôøng, goïi laø Pre-test. Sau ñoù
seõ tieán haønh moät cuoäc nghieân cöùu nöõa treân ñuùng caùc ñoái töôïng ñoù sau khi chöông
trình quaûng caùo ñaõ ñöôïc tung ra thò tröôøng, ta goïi laø Post-test. Phaân tích thoáng keâ
ñoøi hoûi moät soá so saùnh (nhö Paired-sample t test) caùc yù kieán cuûa nhöõng ngöôøi tieâu
duøng naøy tröôùc vaø sau khi coù chöông trình quaûng caùo. Ñeå thöïc hieän coâng vieäc naøy
caàn chuù yù nhöõng ñieåm sau:
- Caùc quan saùt (Cases) trong caû hai taäp tin caàn hôïp nhaát bieán phaûi ñöôïc xaép xeáp
theo cuøng moät thöù töï, thoâng thöôøng thöù töï naøy ñöôïc quaûn lyù baèng moät taäp tin
chöùa caùc giaù trò laø soá baûng caâu hoûi. Chuù yù caùc baûng caâu hoûi cuûa ñoái töôïng
nghieân cöùu trong laàn phoûng vaán tröôùc phaûi gioáng vôùi soá baûng caâu hoûi duøng ñeå
phoùng vaán chính ñoái töôïng ñoù trong laàn sau. Khi loaïi boû baûng caâu hoûi naøo cuûa
laàn phoûng vaán tröôùc hoaëc sau ta phaûi loaïi boû luoân baûng caâu hoûi ñoù tröôùc khi
tieán haønh hôïp nhaát.
- Thoâng thöôøng ta duøng moät hay nhieàu bieán khoùa ñeå baûo ñaûm caùc tröôøng hôïp
khôùp vôùi nhau (thöôøng söû duïng bieán ID chöùa soá baûng caâu hoûi). Ñieàu phaûi baûo
ñaûm tröôùc khi tieán haønh hôïp nhaát bieán giöõa hai taäp döõ lieäu naøy laø ta phaûi xaép
xeáp döõ lieäu trong hai bieán khoùa cuûa hai taäp döõ lieäu theo thöù töï töø nhoû ñeán lôùn.
- Caùc bieán coù teân gioáng nhau trong taäp tin ñang hoaït ñoäng vaøo taäp tin beân ngoaøi
seõ bò loaïi tröø khoûi taäp tin môùi ñöôïc taïo.
Bieân soaïn: Ñaøo Hoaøi Nam 30
13. Phaân tích döõ lieäu baèng SPSS
Töø taäp döõ lieäu ñang thao taùc ta môû coâng cuï Data/Merge Files/Adds Variables töø
menu, SPSS seõ truy suaát hoäp thoaïi Add Variables: Read File ñeå ta löïa choïn taäp döõ
lieäu seõ ñöôïc hôïp vôùi taäp döõ lieäu ñang hoaït ñoäng. Nhaán Open ñeå xaùc nhaän vieäc löïa
choïn naøy (gioáng nhö tröôøng hôïp Adds Cases - Xem hình 5-13). Sau khi löïa choïn
ñöôïc taäp döõ lieäu seõ hôïp bieán vôùi taäp döõ lieäu ñang hoaït ñoäng. SPSS seõ truy suaát
cho ta hoäp thoaïi nhö hình 5-15:
Hình 5-15
- Excluded Variables lieät keâ caùc bieán seõ bò loaïi tröø ra khoûi bieán môùi hôïp thaønh.
Nhöõng bieán naøy laø nhöõng bieán coù teân bieán gioáng nhau. Bieán trong taäp tin ñang
hoaït ñoäng ñöôïc kyù hieäu laø (*), vaø nhöõng bieán trong taäp tin beân ngoaøi laø (+).
Neáu muoán caùc bieán gioáng teân nhau naøy coù trong taäp döõ lieäu môùi ta phaûi tieán
haønh rename noù laïi vaø chuyeån noù sang hoäp thoaïi chöùa caùc bieán seõ coù trong taäp
tin môùi (New Working Data File)
- Key Variables. Bieán khoùa döïa vaøo ñoù caùc quan saùt gioáng nhau ñöôïc xaùc ñònh.
Chuù yù bieán khoùa naøy phaûi coù cuøng teân ôû caùc hai taäp tin caàn hôïp nhaát. Caùc
tröôøng hôïp khoâng thoûa maõn vôùi bieán khoùa thì vaãn bao haøm trong taäp döõ lieäu
môùi nhöng seõ khoâng ñöôïc hôïp vôùi caùc tröôøng hôïp trong taäp tin khaùc. Nhöõng
tröôøng hôïp naøy chæ chöùa ñöïng giaù trò rieâng bieät cuûa taäp döõ lieäu maø noù bao haøm
töø tröôùc (tröôùc khi tieán haønh hôïp nhaát) vaø caùc tröôøng hôïp naøy seõ coù giaù trò
khuyeát trong caùc bieán chöùa ñöïng trong taäp tin thöù hai maø ta seõ hôïp nhaát.
_____o0o______
Bieân soaïn: Ñaøo Hoaøi Nam 31