More Related Content
More from SAS Institute Japan (18)
SAS Visual Analytics 8.3 におけるデータのインポート時の注意点
- 1. Copyright © SAS Institute Inc. All rights reserved.
SAS Visual Analytics 8.3 における
データのインポート時の注意点
SAS Institute Japan 株式会社
アカデミア推進室
- 2. Copyright © SAS Institute Inc. All rights reserved.
概要
• インポートされたデータ列のうち、数値データは「メジャー」、
文字列データは「カテゴリ」という変数区分になり、それぞれ分
析の役割が異なる。
• インポート時に数値データに文字列が入ってしまうと、「メ
ジャー」ではなく「カテゴリ」として分類され、分析に活用でき
ない。
• そこで、インポート前にデータを加工する必要がある。
- 3. Copyright © SAS Institute Inc. All rights reserved.
対象データ
• 総務省統計局の平成29年「就業構造基本調査 都道府県編」から、「男女,育
児の有無・頻度・育児休業等制度利用の有無,年齢,就業希望の有無・求職
活動の有無別人口(無業者)-全国,全国市部,都道府県,都道府県市部,
政令指定都市」を利用する
• 政府統計の窓口「e-Stat」より、
「データベースから探す」
→「就業構造基本調査」
→「平成29年就業構造基本調査」
→「都道府県編」の「人口・就業に関する統計表」
→ 表番号 08104 のDB
• データのURLはこちら
https://www.e-stat.go.jp/dbview?sid=0003222887
- 4. Copyright © SAS Institute Inc. All rights reserved.
https://www.e-stat.go.jp/dbview?sid=0003222887
クリック
- 5. Copyright © SAS Institute Inc. All rights reserved.
• ダウンロード範囲:全データ
• ファイル形式:CSV形式
• ヘッダの出力:出力しない
• コードの出力:出力しない
• 「注釈を表示する」のチェック
を外す
• 「桁区切り(,)を使用しない
を選択してからダウンロード
- 6. Copyright © SAS Institute Inc. All rights reserved.
ダウンロードされたデータをExcelで開くとこのように見える。
ダウンロードされたファイル名をわかりやすくするため、
「育児有無別_就業希望人口.csv」に変更
- 7. Copyright © SAS Institute Inc. All rights reserved.
SAS Visual Analytics にインポートしてみます。
(インポートの方法は別スライドを参照)
ソースのエンコードを
「SHIFT-JIS」に変更
- 8. Copyright © SAS Institute Inc. All rights reserved.
数値変数であるべき「求職者」や「就業希望者」が
「カテゴリ」変数としてインポートされています。
ダブルクリックして変数の
内容をチェックします
- 9. Copyright © SAS Institute Inc. All rights reserved.
グラフを右クリック
→「棒グラフを変更」
→「リスト表」
でデータリストを表示します。
- 10. Copyright © SAS Institute Inc. All rights reserved.
データに「-」や「***」の文字列が
欠損値として入っているのが問題です。
これを回避するため、インポート前に
データを加工します。
e-Statからダウンロードした
「育児有無別_就業希望人口.csv」
をメモ帳などのテキストエディタで開きます。
- 11. Copyright © SAS Institute Inc. All rights reserved.
• メニューから「編集」→「置換」
• 「検索する文字列」に “***” を記入
• 「置換後の文字列」に “” を記入
• 「すべて置換」をクリック
• そのまま、「検索する文字列」を
“-” に書き換え
• 「すべて置換」をクリック
• 「キャンセル」をクリックしてから、ファイルを上書き保存します。
- 12. Copyright © SAS Institute Inc. All rights reserved.
再度、「育児有無別_就業希望人口.csv 」を
SAS Visual Analytics でインポートします。
(インポート操作は省略)
「求職者」「就業希望者」などの列が
「メジャー」(数値変数)として
インポートされました。
これで数値データとしての分析が可能になります。