SlideShare a Scribd company logo
SAS 實習課
      2012/10/11

許景淳     honli1027@gmail.com
Content

• SAS資料處理:強迫式及條件式執行

• PROC UNIVARIATE
強迫式及條件式執行
強迫式執行
• 變項=被指派的值或函數

• 例如:
 – 常數的指派:N=20;
 – 文字的指派:sex=’female’;
 – 產生新變項:income=revenue-expenses;
條件式執行
• if……then……;else……;
  – if score < 60 then grade = ‘fail’;
   else grade = ‘pass’;


• if……then do;……end;
  – if major = ‘psycho’ then do;
       passing = 70;
    end;
DATA a1;
     INPUT A @@;
  if A< 20 then grade='fail';
  else grade='pass';
CARDS;
18 15 22 19 18 17 18 20 17 12
20 15 18 17 19 20 23 22 10 17
31 16 17 15 19 20 18 18 40 18
20 21 20 24 11 19 17 21 21 20
18 18 23 18 16 16 19 19 19 16
;
PROC PRINT;
RUN;
Result
PROC UNIVARIATE
功用
• 可計算指定變數的基本敘述性統計量

 – 集中趨勢指標(眾數、中數、平均數)

 – 離散趨勢指標(全距、四分位差、變異數、標準差)

 – 偏度、峰度
常用格式
PROC UNIVARIATE options;
  VAR variables;
  BY variables;
  FREQ variable;
  OUTPUT OUT=輸出檔名 輸出的統計量;
PROC UNIVARIATE
– DATA= 指定對哪個資料檔分析

– NOPRINT= 不產生報表

– PLOT= 莖葉圖 / 盒圖 / 常態機率圖

– FREQ= 次數分配表 (次數 / 百分比 / 累積百分比)

– NORMAL= 檢定資料是否為常態分配

– PCDLDEF= 決定計算百分位數的方法

– VARDEF= 決定計算變異數時的分母
• VAR: 列舉需要進行分析的變項

• BY: 依列舉的變項將資料分為幾個小資料檔
      再就每個小資料檔分別執行分析
      (要先排序,可用PROC SORT達成)

• FREQ: 欲分析的變數重複出現的次數
        (必須是整數,若 < 1會被視為遺失)
OUTPUT 輸出統計量
  指令           說明        指令          說明
   N         有效觀察體數量     Q3       第三四分位數
  NMISS     遺失的觀察體個數   MEDIAN       中位數
  NOBS       觀察體總數       Q1       第一四分位數
  MEAN        平均數      QRANGE       Q3 - Q1
  SUM          總和         P1      第 1 百分位數
   STD        標準差         P5      第 5 百分位數
  VAR         變異數        P10      第 10 百分位數
SKEWENESS      偏度        P90      第 90 百分位數
KURTOSIS       峰度        P95      第 95 百分位數
 SUMWT       加權值總和       P99      第 99 百分位數
  MAX         最大值       MODE         眾數
  MIN         最小值      SIGNRANK   等級符號檢定
 RANGE         全距      NORMAL     常態分配檢定
例子
• 以下是 50 人的統計小考成績
 – 畫莖葉圖、次數分配表 & 百分比分配表
 – 算標準差、平均數、中位數
Code
DATA a1;
   INPUT A @@;
CARDS;
18 15 22 19 18 17 18 20 17 12
20 15 18 17 19 20 23 22 10 17
31 16 17 15 19 20 18 18 40 18
20 21 20 24 11 19 17 21 21 20
18 18 23 18 16 16 19 19 19 16
;
PROC UNIVARIATE PLOT FREQ;
     VAR A;
     OUTPUT out=demo
     STD=SD Mean=MEAN MEDIAN=mdn
     N=n NMISS=nmiss NOBS=nobs VAR=var
     SUM=sum MAX=max RANGE=range
     P1=p1 P95=p95; HISTOGRAM A
  /NORMAL;
PROC PRINT;
RUN;
Result
Result
Result
THE END

More Related Content

Viewers also liked

11/01 SAS 快速複習
11/01 SAS 快速複習11/01 SAS 快速複習
11/01 SAS 快速複習景淳 許
 
2013 感性工學概述
2013  感性工學概述2013  感性工學概述
2013 感性工學概述景淳 許
 
服務設計Ncku2013
服務設計Ncku2013服務設計Ncku2013
服務設計Ncku2013景淳 許
 
0927 sas english version
0927 sas english version0927 sas english version
0927 sas english version
景淳 許
 

Viewers also liked (7)

11/01 SAS 快速複習
11/01 SAS 快速複習11/01 SAS 快速複習
11/01 SAS 快速複習
 
1013 sas 實習課
1013 sas 實習課1013 sas 實習課
1013 sas 實習課
 
0313學習
0313學習0313學習
0313學習
 
意識
意識意識
意識
 
2013 感性工學概述
2013  感性工學概述2013  感性工學概述
2013 感性工學概述
 
服務設計Ncku2013
服務設計Ncku2013服務設計Ncku2013
服務設計Ncku2013
 
0927 sas english version
0927 sas english version0927 sas english version
0927 sas english version
 

More from 景淳 許

2010淺談日本新產品開發之感心技術s
2010淺談日本新產品開發之感心技術s2010淺談日本新產品開發之感心技術s
2010淺談日本新產品開發之感心技術s景淳 許
 
20130318 社群網路與人工智慧
20130318 社群網路與人工智慧20130318 社群網路與人工智慧
20130318 社群網路與人工智慧
景淳 許
 
Class 1 f_mri_intro
Class 1 f_mri_introClass 1 f_mri_intro
Class 1 f_mri_intro
景淳 許
 
0220課程介紹(1)
0220課程介紹(1)0220課程介紹(1)
0220課程介紹(1)景淳 許
 
0306大腦與行為
0306大腦與行為0306大腦與行為
0306大腦與行為景淳 許
 
0227心理學史簡介
0227心理學史簡介0227心理學史簡介
0227心理學史簡介景淳 許
 
SAS 11/01
SAS 11/01SAS 11/01
SAS 11/01
景淳 許
 

More from 景淳 許 (8)

2010淺談日本新產品開發之感心技術s
2010淺談日本新產品開發之感心技術s2010淺談日本新產品開發之感心技術s
2010淺談日本新產品開發之感心技術s
 
0320記憶(2)
0320記憶(2)0320記憶(2)
0320記憶(2)
 
20130318 社群網路與人工智慧
20130318 社群網路與人工智慧20130318 社群網路與人工智慧
20130318 社群網路與人工智慧
 
Class 1 f_mri_intro
Class 1 f_mri_introClass 1 f_mri_intro
Class 1 f_mri_intro
 
0220課程介紹(1)
0220課程介紹(1)0220課程介紹(1)
0220課程介紹(1)
 
0306大腦與行為
0306大腦與行為0306大腦與行為
0306大腦與行為
 
0227心理學史簡介
0227心理學史簡介0227心理學史簡介
0227心理學史簡介
 
SAS 11/01
SAS 11/01SAS 11/01
SAS 11/01
 

1011 sas 實習課

  • 1. SAS 實習課 2012/10/11 許景淳 honli1027@gmail.com
  • 4. 強迫式執行 • 變項=被指派的值或函數 • 例如: – 常數的指派:N=20; – 文字的指派:sex=’female’; – 產生新變項:income=revenue-expenses;
  • 5. 條件式執行 • if……then……;else……; – if score < 60 then grade = ‘fail’; else grade = ‘pass’; • if……then do;……end; – if major = ‘psycho’ then do; passing = 70; end;
  • 6. DATA a1; INPUT A @@; if A< 20 then grade='fail'; else grade='pass'; CARDS; 18 15 22 19 18 17 18 20 17 12 20 15 18 17 19 20 23 22 10 17 31 16 17 15 19 20 18 18 40 18 20 21 20 24 11 19 17 21 21 20 18 18 23 18 16 16 19 19 19 16 ; PROC PRINT; RUN;
  • 9. 功用 • 可計算指定變數的基本敘述性統計量 – 集中趨勢指標(眾數、中數、平均數) – 離散趨勢指標(全距、四分位差、變異數、標準差) – 偏度、峰度
  • 10. 常用格式 PROC UNIVARIATE options; VAR variables; BY variables; FREQ variable; OUTPUT OUT=輸出檔名 輸出的統計量;
  • 11. PROC UNIVARIATE – DATA= 指定對哪個資料檔分析 – NOPRINT= 不產生報表 – PLOT= 莖葉圖 / 盒圖 / 常態機率圖 – FREQ= 次數分配表 (次數 / 百分比 / 累積百分比) – NORMAL= 檢定資料是否為常態分配 – PCDLDEF= 決定計算百分位數的方法 – VARDEF= 決定計算變異數時的分母
  • 12. • VAR: 列舉需要進行分析的變項 • BY: 依列舉的變項將資料分為幾個小資料檔 再就每個小資料檔分別執行分析 (要先排序,可用PROC SORT達成) • FREQ: 欲分析的變數重複出現的次數 (必須是整數,若 < 1會被視為遺失)
  • 13. OUTPUT 輸出統計量 指令 說明 指令 說明 N 有效觀察體數量 Q3 第三四分位數 NMISS 遺失的觀察體個數 MEDIAN 中位數 NOBS 觀察體總數 Q1 第一四分位數 MEAN 平均數 QRANGE Q3 - Q1 SUM 總和 P1 第 1 百分位數 STD 標準差 P5 第 5 百分位數 VAR 變異數 P10 第 10 百分位數 SKEWENESS 偏度 P90 第 90 百分位數 KURTOSIS 峰度 P95 第 95 百分位數 SUMWT 加權值總和 P99 第 99 百分位數 MAX 最大值 MODE 眾數 MIN 最小值 SIGNRANK 等級符號檢定 RANGE 全距 NORMAL 常態分配檢定
  • 14. 例子 • 以下是 50 人的統計小考成績 – 畫莖葉圖、次數分配表 & 百分比分配表 – 算標準差、平均數、中位數
  • 15. Code DATA a1; INPUT A @@; CARDS; 18 15 22 19 18 17 18 20 17 12 20 15 18 17 19 20 23 22 10 17 31 16 17 15 19 20 18 18 40 18 20 21 20 24 11 19 17 21 21 20 18 18 23 18 16 16 19 19 19 16 ;
  • 16. PROC UNIVARIATE PLOT FREQ; VAR A; OUTPUT out=demo STD=SD Mean=MEAN MEDIAN=mdn N=n NMISS=nmiss NOBS=nobs VAR=var SUM=sum MAX=max RANGE=range P1=p1 P95=p95; HISTOGRAM A /NORMAL; PROC PRINT; RUN;
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 23.