• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
1011 sas 實習課
 

1011 sas 實習課

on

  • 1,598 views

 

Statistics

Views

Total Views
1,598
Views on SlideShare
1,071
Embed Views
527

Actions

Likes
0
Downloads
0
Comments
0

1 Embed 527

http://140.116.183.229 527

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    1011 sas 實習課 1011 sas 實習課 Presentation Transcript

    • SAS 實習課 2012/10/11許景淳 honli1027@gmail.com
    • Content• SAS資料處理:強迫式及條件式執行• PROC UNIVARIATE
    • 強迫式及條件式執行
    • 強迫式執行• 變項=被指派的值或函數• 例如: – 常數的指派:N=20; – 文字的指派:sex=’female’; – 產生新變項:income=revenue-expenses;
    • 條件式執行• if……then……;else……; – if score < 60 then grade = ‘fail’; else grade = ‘pass’;• if……then do;……end; – if major = ‘psycho’ then do; passing = 70; end;
    • DATA a1; INPUT A @@; if A< 20 then grade=fail; else grade=pass;CARDS;18 15 22 19 18 17 18 20 17 1220 15 18 17 19 20 23 22 10 1731 16 17 15 19 20 18 18 40 1820 21 20 24 11 19 17 21 21 2018 18 23 18 16 16 19 19 19 16;PROC PRINT;RUN;
    • Result
    • PROC UNIVARIATE
    • 功用• 可計算指定變數的基本敘述性統計量 – 集中趨勢指標(眾數、中數、平均數) – 離散趨勢指標(全距、四分位差、變異數、標準差) – 偏度、峰度
    • 常用格式PROC UNIVARIATE options; VAR variables; BY variables; FREQ variable; OUTPUT OUT=輸出檔名 輸出的統計量;
    • PROC UNIVARIATE– DATA= 指定對哪個資料檔分析– NOPRINT= 不產生報表– PLOT= 莖葉圖 / 盒圖 / 常態機率圖– FREQ= 次數分配表 (次數 / 百分比 / 累積百分比)– NORMAL= 檢定資料是否為常態分配– PCDLDEF= 決定計算百分位數的方法– VARDEF= 決定計算變異數時的分母
    • • VAR: 列舉需要進行分析的變項• BY: 依列舉的變項將資料分為幾個小資料檔 再就每個小資料檔分別執行分析 (要先排序,可用PROC SORT達成)• FREQ: 欲分析的變數重複出現的次數 (必須是整數,若 < 1會被視為遺失)
    • OUTPUT 輸出統計量 指令 說明 指令 說明 N 有效觀察體數量 Q3 第三四分位數 NMISS 遺失的觀察體個數 MEDIAN 中位數 NOBS 觀察體總數 Q1 第一四分位數 MEAN 平均數 QRANGE Q3 - Q1 SUM 總和 P1 第 1 百分位數 STD 標準差 P5 第 5 百分位數 VAR 變異數 P10 第 10 百分位數SKEWENESS 偏度 P90 第 90 百分位數KURTOSIS 峰度 P95 第 95 百分位數 SUMWT 加權值總和 P99 第 99 百分位數 MAX 最大值 MODE 眾數 MIN 最小值 SIGNRANK 等級符號檢定 RANGE 全距 NORMAL 常態分配檢定
    • 例子• 以下是 50 人的統計小考成績 – 畫莖葉圖、次數分配表 & 百分比分配表 – 算標準差、平均數、中位數
    • CodeDATA a1; INPUT A @@;CARDS;18 15 22 19 18 17 18 20 17 1220 15 18 17 19 20 23 22 10 1731 16 17 15 19 20 18 18 40 1820 21 20 24 11 19 17 21 21 2018 18 23 18 16 16 19 19 19 16;
    • PROC UNIVARIATE PLOT FREQ; VAR A; OUTPUT out=demo STD=SD Mean=MEAN MEDIAN=mdn N=n NMISS=nmiss NOBS=nobs VAR=var SUM=sum MAX=max RANGE=range P1=p1 P95=p95; HISTOGRAM A /NORMAL;PROC PRINT;RUN;
    • Result
    • Result
    • Result
    • THE END