SlideShare a Scribd company logo
1 of 12
Copyright © SAS Institute Inc. All rights reserved.
SAS Visual Analytics 8.3 における
データのインポート時の注意点
SAS Institute Japan 株式会社
アカデミア推進室
Copyright © SAS Institute Inc. All rights reserved.
概要
• インポートされたデータ列のうち、数値データは「メジャー」、
文字列データは「カテゴリ」という変数区分になり、それぞれ分
析の役割が異なる。
• インポート時に数値データに文字列が入ってしまうと、「メ
ジャー」ではなく「カテゴリ」として分類され、分析に活用でき
ない。
• そこで、インポート前にデータを加工する必要がある。
Copyright © SAS Institute Inc. All rights reserved.
対象データ
• 総務省統計局の平成29年「就業構造基本調査 都道府県編」から、「男女,育
児の有無・頻度・育児休業等制度利用の有無,年齢,就業希望の有無・求職
活動の有無別人口(無業者)-全国,全国市部,都道府県,都道府県市部,
政令指定都市」を利用する
• 政府統計の窓口「e-Stat」より、
「データベースから探す」
→「就業構造基本調査」
→「平成29年就業構造基本調査」
→「都道府県編」の「人口・就業に関する統計表」
→ 表番号 08104 のDB
• データのURLはこちら
https://www.e-stat.go.jp/dbview?sid=0003222887
Copyright © SAS Institute Inc. All rights reserved.
https://www.e-stat.go.jp/dbview?sid=0003222887
クリック
Copyright © SAS Institute Inc. All rights reserved.
• ダウンロード範囲:全データ
• ファイル形式:CSV形式
• ヘッダの出力:出力しない
• コードの出力:出力しない
• 「注釈を表示する」のチェック
を外す
• 「桁区切り(,)を使用しない
を選択してからダウンロード
Copyright © SAS Institute Inc. All rights reserved.
ダウンロードされたデータをExcelで開くとこのように見える。
ダウンロードされたファイル名をわかりやすくするため、
「育児有無別_就業希望人口.csv」に変更
Copyright © SAS Institute Inc. All rights reserved.
SAS Visual Analytics にインポートしてみます。
(インポートの方法は別スライドを参照)
ソースのエンコードを
「SHIFT-JIS」に変更
Copyright © SAS Institute Inc. All rights reserved.
数値変数であるべき「求職者」や「就業希望者」が
「カテゴリ」変数としてインポートされています。
ダブルクリックして変数の
内容をチェックします
Copyright © SAS Institute Inc. All rights reserved.
グラフを右クリック
→「棒グラフを変更」
→「リスト表」
でデータリストを表示します。
Copyright © SAS Institute Inc. All rights reserved.
データに「-」や「***」の文字列が
欠損値として入っているのが問題です。
これを回避するため、インポート前に
データを加工します。
e-Statからダウンロードした
「育児有無別_就業希望人口.csv」
をメモ帳などのテキストエディタで開きます。
Copyright © SAS Institute Inc. All rights reserved.
• メニューから「編集」→「置換」
• 「検索する文字列」に “***” を記入
• 「置換後の文字列」に “” を記入
• 「すべて置換」をクリック
• そのまま、「検索する文字列」を
“-” に書き換え
• 「すべて置換」をクリック
• 「キャンセル」をクリックしてから、ファイルを上書き保存します。
Copyright © SAS Institute Inc. All rights reserved.
再度、「育児有無別_就業希望人口.csv 」を
SAS Visual Analytics でインポートします。
(インポート操作は省略)
「求職者」「就業希望者」などの列が
「メジャー」(数値変数)として
インポートされました。
これで数値データとしての分析が可能になります。

More Related Content

More from SAS Institute Japan

SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~
SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~
SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~SAS Institute Japan
 
SAS Viya Deep Dive: 予測モデリング
SAS Viya Deep Dive: 予測モデリングSAS Viya Deep Dive: 予測モデリング
SAS Viya Deep Dive: 予測モデリングSAS Institute Japan
 
SAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AISAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AISAS Institute Japan
 
SAS University Editionにおける日本語を含むファイルの取り扱い
SAS University Editionにおける日本語を含むファイルの取り扱いSAS University Editionにおける日本語を含むファイルの取り扱い
SAS University Editionにおける日本語を含むファイルの取り扱いSAS Institute Japan
 
SAS言語派集まれ!SAS StudioからSAS Viyaを使ってみよう!
SAS言語派集まれ!SAS StudioからSAS Viyaを使ってみよう!SAS言語派集まれ!SAS StudioからSAS Viyaを使ってみよう!
SAS言語派集まれ!SAS StudioからSAS Viyaを使ってみよう!SAS Institute Japan
 
SAS Viya で異常検知してみよう!
SAS Viya で異常検知してみよう!SAS Viya で異常検知してみよう!
SAS Viya で異常検知してみよう!SAS Institute Japan
 
Pythonで操るSAS Viyaの画像処理技術入門編
Pythonで操るSAS Viyaの画像処理技術入門編Pythonで操るSAS Viyaの画像処理技術入門編
Pythonで操るSAS Viyaの画像処理技術入門編SAS Institute Japan
 
SAS OnDemand for Academics 登録方法
SAS OnDemand for Academics 登録方法SAS OnDemand for Academics 登録方法
SAS OnDemand for Academics 登録方法SAS Institute Japan
 
無料統計・予測分析ツールを提供:SAS Analytics U
無料統計・予測分析ツールを提供:SAS Analytics U無料統計・予測分析ツールを提供:SAS Analytics U
無料統計・予測分析ツールを提供:SAS Analytics USAS Institute Japan
 
SASによるテキスト・アナリティクス入門
SASによるテキスト・アナリティクス入門SASによるテキスト・アナリティクス入門
SASによるテキスト・アナリティクス入門SAS Institute Japan
 
SAS Enterprise Minerを使用した機械学習
SAS Enterprise Minerを使用した機械学習SAS Enterprise Minerを使用した機械学習
SAS Enterprise Minerを使用した機械学習SAS Institute Japan
 
SAS High-Performance Analyticsによるビッグデータ解析
SAS High-Performance Analyticsによるビッグデータ解析SAS High-Performance Analyticsによるビッグデータ解析
SAS High-Performance Analyticsによるビッグデータ解析SAS Institute Japan
 
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門SAS Institute Japan
 
Hadoopでアナリティクス8チェックリスト
Hadoopでアナリティクス8チェックリストHadoopでアナリティクス8チェックリスト
Hadoopでアナリティクス8チェックリストSAS Institute Japan
 

More from SAS Institute Japan (18)

SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~
SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~
SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~
 
SAS Viya Deep Dive: 予測モデリング
SAS Viya Deep Dive: 予測モデリングSAS Viya Deep Dive: 予測モデリング
SAS Viya Deep Dive: 予測モデリング
 
SAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AISAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AI
 
SAS University Editionにおける日本語を含むファイルの取り扱い
SAS University Editionにおける日本語を含むファイルの取り扱いSAS University Editionにおける日本語を含むファイルの取り扱い
SAS University Editionにおける日本語を含むファイルの取り扱い
 
SAS言語派集まれ!SAS StudioからSAS Viyaを使ってみよう!
SAS言語派集まれ!SAS StudioからSAS Viyaを使ってみよう!SAS言語派集まれ!SAS StudioからSAS Viyaを使ってみよう!
SAS言語派集まれ!SAS StudioからSAS Viyaを使ってみよう!
 
SAS Viya で異常検知してみよう!
SAS Viya で異常検知してみよう!SAS Viya で異常検知してみよう!
SAS Viya で異常検知してみよう!
 
Pythonで操るSAS Viyaの画像処理技術入門編
Pythonで操るSAS Viyaの画像処理技術入門編Pythonで操るSAS Viyaの画像処理技術入門編
Pythonで操るSAS Viyaの画像処理技術入門編
 
Python / R で使うSAS Viya
Python / R で使うSAS ViyaPython / R で使うSAS Viya
Python / R で使うSAS Viya
 
SAS OnDemand for Academics 登録方法
SAS OnDemand for Academics 登録方法SAS OnDemand for Academics 登録方法
SAS OnDemand for Academics 登録方法
 
無料統計・予測分析ツールを提供:SAS Analytics U
無料統計・予測分析ツールを提供:SAS Analytics U無料統計・予測分析ツールを提供:SAS Analytics U
無料統計・予測分析ツールを提供:SAS Analytics U
 
SASによるテキスト・アナリティクス入門
SASによるテキスト・アナリティクス入門SASによるテキスト・アナリティクス入門
SASによるテキスト・アナリティクス入門
 
SAS Enterprise Minerを使用した機械学習
SAS Enterprise Minerを使用した機械学習SAS Enterprise Minerを使用した機械学習
SAS Enterprise Minerを使用した機械学習
 
SAS High-Performance Analyticsによるビッグデータ解析
SAS High-Performance Analyticsによるビッグデータ解析SAS High-Performance Analyticsによるビッグデータ解析
SAS High-Performance Analyticsによるビッグデータ解析
 
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
 
SASによる機械学習入門
SASによる機械学習入門SASによる機械学習入門
SASによる機械学習入門
 
SASとHadoopとの連携 2015
SASとHadoopとの連携 2015SASとHadoopとの連携 2015
SASとHadoopとの連携 2015
 
Hadoopでアナリティクス8チェックリスト
Hadoopでアナリティクス8チェックリストHadoopでアナリティクス8チェックリスト
Hadoopでアナリティクス8チェックリスト
 
SASとHadoopとの連携
SASとHadoopとの連携SASとHadoopとの連携
SASとHadoopとの連携
 

SAS Visual Analytics 8.3 におけるデータのインポート時の注意点

  • 1. Copyright © SAS Institute Inc. All rights reserved. SAS Visual Analytics 8.3 における データのインポート時の注意点 SAS Institute Japan 株式会社 アカデミア推進室
  • 2. Copyright © SAS Institute Inc. All rights reserved. 概要 • インポートされたデータ列のうち、数値データは「メジャー」、 文字列データは「カテゴリ」という変数区分になり、それぞれ分 析の役割が異なる。 • インポート時に数値データに文字列が入ってしまうと、「メ ジャー」ではなく「カテゴリ」として分類され、分析に活用でき ない。 • そこで、インポート前にデータを加工する必要がある。
  • 3. Copyright © SAS Institute Inc. All rights reserved. 対象データ • 総務省統計局の平成29年「就業構造基本調査 都道府県編」から、「男女,育 児の有無・頻度・育児休業等制度利用の有無,年齢,就業希望の有無・求職 活動の有無別人口(無業者)-全国,全国市部,都道府県,都道府県市部, 政令指定都市」を利用する • 政府統計の窓口「e-Stat」より、 「データベースから探す」 →「就業構造基本調査」 →「平成29年就業構造基本調査」 →「都道府県編」の「人口・就業に関する統計表」 → 表番号 08104 のDB • データのURLはこちら https://www.e-stat.go.jp/dbview?sid=0003222887
  • 4. Copyright © SAS Institute Inc. All rights reserved. https://www.e-stat.go.jp/dbview?sid=0003222887 クリック
  • 5. Copyright © SAS Institute Inc. All rights reserved. • ダウンロード範囲:全データ • ファイル形式:CSV形式 • ヘッダの出力:出力しない • コードの出力:出力しない • 「注釈を表示する」のチェック を外す • 「桁区切り(,)を使用しない を選択してからダウンロード
  • 6. Copyright © SAS Institute Inc. All rights reserved. ダウンロードされたデータをExcelで開くとこのように見える。 ダウンロードされたファイル名をわかりやすくするため、 「育児有無別_就業希望人口.csv」に変更
  • 7. Copyright © SAS Institute Inc. All rights reserved. SAS Visual Analytics にインポートしてみます。 (インポートの方法は別スライドを参照) ソースのエンコードを 「SHIFT-JIS」に変更
  • 8. Copyright © SAS Institute Inc. All rights reserved. 数値変数であるべき「求職者」や「就業希望者」が 「カテゴリ」変数としてインポートされています。 ダブルクリックして変数の 内容をチェックします
  • 9. Copyright © SAS Institute Inc. All rights reserved. グラフを右クリック →「棒グラフを変更」 →「リスト表」 でデータリストを表示します。
  • 10. Copyright © SAS Institute Inc. All rights reserved. データに「-」や「***」の文字列が 欠損値として入っているのが問題です。 これを回避するため、インポート前に データを加工します。 e-Statからダウンロードした 「育児有無別_就業希望人口.csv」 をメモ帳などのテキストエディタで開きます。
  • 11. Copyright © SAS Institute Inc. All rights reserved. • メニューから「編集」→「置換」 • 「検索する文字列」に “***” を記入 • 「置換後の文字列」に “” を記入 • 「すべて置換」をクリック • そのまま、「検索する文字列」を “-” に書き換え • 「すべて置換」をクリック • 「キャンセル」をクリックしてから、ファイルを上書き保存します。
  • 12. Copyright © SAS Institute Inc. All rights reserved. 再度、「育児有無別_就業希望人口.csv 」を SAS Visual Analytics でインポートします。 (インポート操作は省略) 「求職者」「就業希望者」などの列が 「メジャー」(数値変数)として インポートされました。 これで数値データとしての分析が可能になります。