SAS 實習課      2012/10/11許景淳     honli1027@gmail.com
Content• SAS資料處理:強迫式及條件式執行• PROC UNIVARIATE
強迫式及條件式執行
強迫式執行• 變項=被指派的值或函數• 例如: – 常數的指派:N=20; – 文字的指派:sex=’female’; – 產生新變項:income=revenue-expenses;
條件式執行• if……then……;else……;  – if score < 60 then grade = ‘fail’;   else grade = ‘pass’;• if……then do;……end;  – if major = ‘...
DATA a1;     INPUT A @@;  if A< 20 then grade=fail;  else grade=pass;CARDS;18 15 22 19 18 17 18 20 17 1220 15 18 17 19 20 ...
Result
PROC UNIVARIATE
功用• 可計算指定變數的基本敘述性統計量 – 集中趨勢指標(眾數、中數、平均數) – 離散趨勢指標(全距、四分位差、變異數、標準差) – 偏度、峰度
常用格式PROC UNIVARIATE options;  VAR variables;  BY variables;  FREQ variable;  OUTPUT OUT=輸出檔名 輸出的統計量;
PROC UNIVARIATE– DATA= 指定對哪個資料檔分析– NOPRINT= 不產生報表– PLOT= 莖葉圖 / 盒圖 / 常態機率圖– FREQ= 次數分配表 (次數 / 百分比 / 累積百分比)– NORMAL= 檢定資料是否為...
• VAR: 列舉需要進行分析的變項• BY: 依列舉的變項將資料分為幾個小資料檔      再就每個小資料檔分別執行分析      (要先排序,可用PROC SORT達成)• FREQ: 欲分析的變數重複出現的次數        (必須是整數...
OUTPUT 輸出統計量  指令           說明        指令          說明   N         有效觀察體數量     Q3       第三四分位數  NMISS     遺失的觀察體個數   MEDIAN  ...
例子• 以下是 50 人的統計小考成績 – 畫莖葉圖、次數分配表 & 百分比分配表 – 算標準差、平均數、中位數
CodeDATA a1;   INPUT A @@;CARDS;18 15 22 19 18 17 18 20 17 1220 15 18 17 19 20 23 22 10 1731 16 17 15 19 20 18 18 40 1820 ...
PROC UNIVARIATE PLOT FREQ;     VAR A;     OUTPUT out=demo     STD=SD Mean=MEAN MEDIAN=mdn     N=n NMISS=nmiss NOBS=nobs VA...
Result
Result
Result
THE END
1011 sas 實習課
1011 sas 實習課
1011 sas 實習課
1011 sas 實習課
1011 sas 實習課
1011 sas 實習課
Upcoming SlideShare
Loading in …5
×

1011 sas 實習課

1,719
-1

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,719
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

1011 sas 實習課

  1. 1. SAS 實習課 2012/10/11許景淳 honli1027@gmail.com
  2. 2. Content• SAS資料處理:強迫式及條件式執行• PROC UNIVARIATE
  3. 3. 強迫式及條件式執行
  4. 4. 強迫式執行• 變項=被指派的值或函數• 例如: – 常數的指派:N=20; – 文字的指派:sex=’female’; – 產生新變項:income=revenue-expenses;
  5. 5. 條件式執行• if……then……;else……; – if score < 60 then grade = ‘fail’; else grade = ‘pass’;• if……then do;……end; – if major = ‘psycho’ then do; passing = 70; end;
  6. 6. DATA a1; INPUT A @@; if A< 20 then grade=fail; else grade=pass;CARDS;18 15 22 19 18 17 18 20 17 1220 15 18 17 19 20 23 22 10 1731 16 17 15 19 20 18 18 40 1820 21 20 24 11 19 17 21 21 2018 18 23 18 16 16 19 19 19 16;PROC PRINT;RUN;
  7. 7. Result
  8. 8. PROC UNIVARIATE
  9. 9. 功用• 可計算指定變數的基本敘述性統計量 – 集中趨勢指標(眾數、中數、平均數) – 離散趨勢指標(全距、四分位差、變異數、標準差) – 偏度、峰度
  10. 10. 常用格式PROC UNIVARIATE options; VAR variables; BY variables; FREQ variable; OUTPUT OUT=輸出檔名 輸出的統計量;
  11. 11. PROC UNIVARIATE– DATA= 指定對哪個資料檔分析– NOPRINT= 不產生報表– PLOT= 莖葉圖 / 盒圖 / 常態機率圖– FREQ= 次數分配表 (次數 / 百分比 / 累積百分比)– NORMAL= 檢定資料是否為常態分配– PCDLDEF= 決定計算百分位數的方法– VARDEF= 決定計算變異數時的分母
  12. 12. • VAR: 列舉需要進行分析的變項• BY: 依列舉的變項將資料分為幾個小資料檔 再就每個小資料檔分別執行分析 (要先排序,可用PROC SORT達成)• FREQ: 欲分析的變數重複出現的次數 (必須是整數,若 < 1會被視為遺失)
  13. 13. OUTPUT 輸出統計量 指令 說明 指令 說明 N 有效觀察體數量 Q3 第三四分位數 NMISS 遺失的觀察體個數 MEDIAN 中位數 NOBS 觀察體總數 Q1 第一四分位數 MEAN 平均數 QRANGE Q3 - Q1 SUM 總和 P1 第 1 百分位數 STD 標準差 P5 第 5 百分位數 VAR 變異數 P10 第 10 百分位數SKEWENESS 偏度 P90 第 90 百分位數KURTOSIS 峰度 P95 第 95 百分位數 SUMWT 加權值總和 P99 第 99 百分位數 MAX 最大值 MODE 眾數 MIN 最小值 SIGNRANK 等級符號檢定 RANGE 全距 NORMAL 常態分配檢定
  14. 14. 例子• 以下是 50 人的統計小考成績 – 畫莖葉圖、次數分配表 & 百分比分配表 – 算標準差、平均數、中位數
  15. 15. CodeDATA a1; INPUT A @@;CARDS;18 15 22 19 18 17 18 20 17 1220 15 18 17 19 20 23 22 10 1731 16 17 15 19 20 18 18 40 1820 21 20 24 11 19 17 21 21 2018 18 23 18 16 16 19 19 19 16;
  16. 16. PROC UNIVARIATE PLOT FREQ; VAR A; OUTPUT out=demo STD=SD Mean=MEAN MEDIAN=mdn N=n NMISS=nmiss NOBS=nobs VAR=var SUM=sum MAX=max RANGE=range P1=p1 P95=p95; HISTOGRAM A /NORMAL;PROC PRINT;RUN;
  17. 17. Result
  18. 18. Result
  19. 19. Result
  20. 20. THE END

×