SlideShare a Scribd company logo
Copyright © SAS Institute Inc. All rights reserved.
SAS University Editionにおける
日本語を含むファイルの取り扱い
SAS Institute Japan 株式会社
アカデミア推進室 竹村 尚大
Copyright © SAS Institute Inc. All rights reserved.
Agenda
• セッション・エンコーディング
• 日本語ファイル名
• Excelファイルのインポート
• CSV・Textファイルのインポート
• エクスポート
※ この資料でのSAS製品名の省略:
SAS University Edition = UE
SAS OnDemand for Academics = ODA
2
Copyright © SAS Institute Inc. All rights reserved.
セッション・エンコーディング
3
セッション・エンコーディングとは:
Base SAS がデフォルトで内部的に取り扱うマルチバイトの文字コード
製品名 セッション・エンコーディング
Windows版 SAS 9.4 (日本語) Shift-JIS
UE および ODA UTF-8
通常、WindowsのファイルはShift-JISエンコーディング
⇒ UE・ODAはインポート時にUTF-8に変換してデータを扱う
※ セッション・エンコーディングはSASのシステムオプションで設定できるが、
UE・ODAでは、システムオプションを変更できない
Copyright © SAS Institute Inc. All rights reserved.
セッション・エンコーディングの確認方法
4
proc options option = encoding;
run;
Copyright © SAS Institute Inc. All rights reserved.
日本語ファイル名
5
アップロードボタン
問題なく表示される
日本語ファイル名でインポートも可
UEで直接共有フォルダにファイルを置く方法でも大丈夫
Copyright © SAS Institute Inc. All rights reserved.
Excelファイルのインポート
ファイル内容
6
Copyright © SAS Institute Inc. All rights reserved.
Excelファイルのインポート
下準備: 変数名ポリシーの変更
7
プリファレンスの設定
「ANY」にする
※ この操作は、日本語変数名
を許可するため
Copyright © SAS Institute Inc. All rights reserved.
Excelファイルのインポート (IMPORTプロシジャ)
拡張子が .xlsx (Excel 2007以降) の場合
8
ダブルクリック
または
右クリック
SAS Studioのタスクでインポート
日本語シート名の指定も可
生成されたコード
Copyright © SAS Institute Inc. All rights reserved.
Excelファイルのインポート (IMPORTプロシジャ結果)
拡張子が .xlsx (Excel 2007以降) の場合
9
※日本語文字列の長さは予
想できない
(UTF-8が可変長のため)
Copyright © SAS Institute Inc. All rights reserved.
Excelファイルのインポート (LIBNAMEステートメント)
拡張子が .xlsx (Excel 2007以降) の場合
10
LIBNAMEステートメントによる入力も可能
libname INDATA xlsx '~/データ.xlsx';
proc contents data=INDATA.'シート1'n;
run;
日本語シート名も取り扱い可
※ ただし、日本語シート名(データセット名)
のタスクでの指定は不可
Copyright © SAS Institute Inc. All rights reserved.
Excelファイルのインポート (IMPORTプロシジャ)
拡張子が .xls (Excel 2003以前) の場合
11
インポート自体は通るが、文字コードは無効
コードを編集し、ENCODINGオプションをつけてみる
通らない…
※ XLS エンジンはトランスコーディングをサポートしない
Copyright © SAS Institute Inc. All rights reserved.
Excelファイルのインポート (LIBNAMEステートメント)
拡張子が .xls (Excel 2003以前) の場合
12
libname INDATA xls '~/データ.xls';
libname INDATA excel '~/データ.xls';
libname INDATA xlsx '~/データ.xlsx';
proc contents data=INDATA.'シート1'n;
run;
LIBNAMEステートメントでも読み込めない
※ EXCEL エンジンはWindowsシステムのみ (UEは仮想Linux上で動作)
Copyright © SAS Institute Inc. All rights reserved.
Excelファイルのインポート
拡張子が .xls (Excel 2003以前) の場合
13
xlsファイルはどのように読み込めば…? ⇒ Excel側で操作をする
1. Excel 2007以降を利用できる場合 ⇒ .xlsx ファイルとして保存
2. 「Unicodeテキストとして保存」 ⇒ タブ区切りデータのファイルとして読み込む
3. CSVとして保存 ⇒
A) ENCODINGオプションを指定してインポート
B) メモ帳などでUTF-8に変換
Copyright © SAS Institute Inc. All rights reserved.
ExcelファイルをUnicodeテキストとして保存
14
タブ区切りテキストデータ
Unicodeテキスト (*.txt)
Copyright © SAS Institute Inc. All rights reserved.
テキストファイル(Unicode)のインポート
15
ダブルクリック
ドラッグ&ドロップ
’09’x
チェックを外す
生成されたコード
これでインポート可
Copyright © SAS Institute Inc. All rights reserved.
ExcelファイルをCSVとして保存
16
メモ帳からUTF-8で保存
CSVカンマ区切り (*.csv)
UTF-8
Copyright © SAS Institute Inc. All rights reserved.
CSVファイル (Shift-JIS) のインポート
17
ダブルクリック or
右クリック
⇒データのインポート
このままでは文字化け
クリック
encoding=sjis オプションを追加
これでインポート可
Copyright © SAS Institute Inc. All rights reserved.
CSVファイル (UTF-8) のインポート
18
ダブルクリック or
右クリック
⇒データのインポート
このままでインポート可
Copyright © SAS Institute Inc. All rights reserved.
CSVエクスポート (メニューから)
19
右クリック
文字コード: UTF-8
改行コード: LF
のCSVとして出力
このボタンでローカル
にダウンロード可
Copyright © SAS Institute Inc. All rights reserved.
XLSXエクスポート (メニューから)
20
右クリック
通常のxlsxファイル
このボタンでローカル
にダウンロード可
Copyright © SAS Institute Inc. All rights reserved.
EXPORTプロシジャ
21
proc export data=work.import
outfile='~/export.xlsx'
dbms=xlsx replace;
run;
proc export data=work.import
outfile='~/export.xls'
dbms=xls replace;
run;
OK
文字化け
filename _outfile '~/export_sjis.csv' encoding=sjis;
proc export data=work.import
outfile=_outfile
dbms=csv replace;
run;
Shift-JIS エンコード
proc export data=work.import
outfile='~/export.csv'
dbms=csv replace;
run;
UTF-8 エンコード
Copyright © SAS Institute Inc. All rights reserved.
CSVファイルの生成スニペット
22
スニペット
= SASコードのテンプレート
直接ダウンロードされる
文字コード: UTF-8
改行コード: LF
のCSVとして出力
コードを編集
Copyright © SAS Institute Inc. All rights reserved.
LIBNAMEステートメントによる.xlsxへの書き込み
23
libname INDATA xlsx '~/データ.xlsx';
data INDATA.'シート2'n;
set INDATA.'シート1'n;
length '文字列2'n $ 100;
'文字列2'n = cats('文字列'n, '番号'n);
run;
Excelの自動修復機能で復元
Copyright © SAS Institute Inc. All rights reserved.
まとめ
24
xlsx ファイル xlsファイル
csv/txt
(Shift-JIS)
csv/txt
(Unicode/UTF-8)
日本語ファイル 〇
日本語変数名 プリファンレスで「SAS変数名ポリシー」をANYに
インポートタスク 〇 × × 〇
IMPORT プロシジャ 〇 ×
〇 (オプション
ENCODING=SJIS)
〇
LIBNAME ステートメント
〇 (ただし日本語
シート名は要注意)
× - -
エクスポートメニュー 〇 - - 〇
EXPORT プロシジャ 〇 ×
〇 (オプション
ENCODING=SJIS)
〇
LIBNAME ステートメント(書込) △ - - -
※ xlsファイルは .xlsx / .csv / .txt ファイルに保存しなおして読み込む

More Related Content

What's hot

Tokyo r7 sem_20100724
Tokyo r7 sem_20100724Tokyo r7 sem_20100724
Tokyo r7 sem_20100724
osamu morimoto
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類Shintaro Fukushima
 
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
Ken'ichi Matsui
 
【BERT】自然言語処理を用いたレビュー分析
【BERT】自然言語処理を用いたレビュー分析【BERT】自然言語処理を用いたレビュー分析
【BERT】自然言語処理を用いたレビュー分析
KazuyaYagihashi
 
情報検索とゼロショット学習
情報検索とゼロショット学習情報検索とゼロショット学習
情報検索とゼロショット学習
kt.mako
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数
daiki hojo
 
ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-Koichiro Gibo
 
MCMC法
MCMC法MCMC法
MCMC法
MatsuiRyo
 
生存時間分析数理の基礎
生存時間分析数理の基礎生存時間分析数理の基礎
生存時間分析数理の基礎
Koichiro Gibo
 
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!takehikoihayashi
 
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」(一部文字が欠けてます)
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」(一部文字が欠けてます)東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」(一部文字が欠けてます)
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」(一部文字が欠けてます)
Hitomi Yanaka
 
時系列データ分析とPython
時系列データ分析とPython時系列データ分析とPython
時系列データ分析とPython
Hirofumi Tsuruta
 
状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較
Hiroki Itô
 
ベイズモデリングで見る因子分析
ベイズモデリングで見る因子分析ベイズモデリングで見る因子分析
ベイズモデリングで見る因子分析
Shushi Namba
 
Confidence Weightedで ランク学習を実装してみた
Confidence Weightedで ランク学習を実装してみたConfidence Weightedで ランク学習を実装してみた
Confidence Weightedで ランク学習を実装してみたtkng
 
混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をする混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をする
Masaru Tokuoka
 
特徴選択のためのLasso解列挙
特徴選択のためのLasso解列挙特徴選択のためのLasso解列挙
特徴選択のためのLasso解列挙
Satoshi Hara
 
因子分析
因子分析因子分析
因子分析
Mitsuo Shimohata
 
ラベル付けのいろは
ラベル付けのいろはラベル付けのいろは
ラベル付けのいろは
Kensuke Mitsuzawa
 
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
Ken'ichi Matsui
 

What's hot (20)

Tokyo r7 sem_20100724
Tokyo r7 sem_20100724Tokyo r7 sem_20100724
Tokyo r7 sem_20100724
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
 
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
 
【BERT】自然言語処理を用いたレビュー分析
【BERT】自然言語処理を用いたレビュー分析【BERT】自然言語処理を用いたレビュー分析
【BERT】自然言語処理を用いたレビュー分析
 
情報検索とゼロショット学習
情報検索とゼロショット学習情報検索とゼロショット学習
情報検索とゼロショット学習
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数
 
ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-ロジスティック回帰分析の入門 -予測モデル構築-
ロジスティック回帰分析の入門 -予測モデル構築-
 
MCMC法
MCMC法MCMC法
MCMC法
 
生存時間分析数理の基礎
生存時間分析数理の基礎生存時間分析数理の基礎
生存時間分析数理の基礎
 
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
 
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」(一部文字が欠けてます)
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」(一部文字が欠けてます)東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」(一部文字が欠けてます)
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」(一部文字が欠けてます)
 
時系列データ分析とPython
時系列データ分析とPython時系列データ分析とPython
時系列データ分析とPython
 
状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較状態空間モデルの実行方法と実行環境の比較
状態空間モデルの実行方法と実行環境の比較
 
ベイズモデリングで見る因子分析
ベイズモデリングで見る因子分析ベイズモデリングで見る因子分析
ベイズモデリングで見る因子分析
 
Confidence Weightedで ランク学習を実装してみた
Confidence Weightedで ランク学習を実装してみたConfidence Weightedで ランク学習を実装してみた
Confidence Weightedで ランク学習を実装してみた
 
混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をする混合モデルを使って反復測定分散分析をする
混合モデルを使って反復測定分散分析をする
 
特徴選択のためのLasso解列挙
特徴選択のためのLasso解列挙特徴選択のためのLasso解列挙
特徴選択のためのLasso解列挙
 
因子分析
因子分析因子分析
因子分析
 
ラベル付けのいろは
ラベル付けのいろはラベル付けのいろは
ラベル付けのいろは
 
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
 

Similar to SAS University Editionにおける日本語を含むファイルの取り扱い

200718 lt
200718 lt200718 lt
200718 lt
良一 駒板
 
POI4XPagesを使ったword-excelへの簡単エクスポート
POI4XPagesを使ったword-excelへの簡単エクスポートPOI4XPagesを使ったword-excelへの簡単エクスポート
POI4XPagesを使ったword-excelへの簡単エクスポート
賢次 海老原
 
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
Insight Technology, Inc.
 
Hadoop Compatible File Systems 2019 (db tech showcase 2019 Tokyo講演資料、2019/09/25)
Hadoop Compatible File Systems 2019 (db tech showcase 2019 Tokyo講演資料、2019/09/25)Hadoop Compatible File Systems 2019 (db tech showcase 2019 Tokyo講演資料、2019/09/25)
Hadoop Compatible File Systems 2019 (db tech showcase 2019 Tokyo講演資料、2019/09/25)
NTT DATA Technology & Innovation
 
Document translator
Document translatorDocument translator
Document translator
neko baba
 
鈴木:Net commonsでの中国語使用について
鈴木:Net commonsでの中国語使用について鈴木:Net commonsでの中国語使用について
鈴木:Net commonsでの中国語使用について
michiosuzuki
 
鈴木:Net commonsでの中国語使用について
鈴木:Net commonsでの中国語使用について鈴木:Net commonsでの中国語使用について
鈴木:Net commonsでの中国語使用について
michiosuzuki
 
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fallビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
YusukeKuramata
 
SQL Server 入門
SQL Server 入門SQL Server 入門
SQL Server 入門
Tsuyoshi Kitagawa
 
AWS Black Belt Online Seminar 2017 Amazon Athena
AWS Black Belt Online Seminar 2017 Amazon AthenaAWS Black Belt Online Seminar 2017 Amazon Athena
AWS Black Belt Online Seminar 2017 Amazon Athena
Amazon Web Services Japan
 
Java de TFS
Java de TFSJava de TFS
Java de TFS
__Black
 
20180704 AWS Black Belt Online Seminar Amazon Elastic File System (Amazon EFS...
20180704 AWS Black Belt Online Seminar Amazon Elastic File System (Amazon EFS...20180704 AWS Black Belt Online Seminar Amazon Elastic File System (Amazon EFS...
20180704 AWS Black Belt Online Seminar Amazon Elastic File System (Amazon EFS...
Amazon Web Services Japan
 
Team Foundation Server入門
Team Foundation Server入門Team Foundation Server入門
Team Foundation Server入門
Akihiro Nakajima
 
20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...
20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...
20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...
Amazon Web Services Japan
 
NXT開発環境(ETロボコン向けTOPPERS活用セミナー5)
NXT開発環境(ETロボコン向けTOPPERS活用セミナー5)NXT開発環境(ETロボコン向けTOPPERS活用セミナー5)
NXT開発環境(ETロボコン向けTOPPERS活用セミナー5)
Takuya Azumi
 
chapter6
chapter6chapter6
chapter6
ymk0424
 
ITPro Expo 2014: Microsoft + Cisco UCS  (Cisco Unified Computing System)  サーバ
ITPro Expo 2014: Microsoft + Cisco UCS  (Cisco Unified Computing System)  サーバITPro Expo 2014: Microsoft + Cisco UCS  (Cisco Unified Computing System)  サーバ
ITPro Expo 2014: Microsoft + Cisco UCS  (Cisco Unified Computing System)  サーバ
シスコシステムズ合同会社
 
ストレージネットワーク基礎講座
ストレージネットワーク基礎講座ストレージネットワーク基礎講座
ストレージネットワーク基礎講座
Brocade
 
Apache Hive 紹介
Apache Hive 紹介Apache Hive 紹介
Startup JavaScript
Startup JavaScriptStartup JavaScript
Startup JavaScript
Akinari Tsugo
 

Similar to SAS University Editionにおける日本語を含むファイルの取り扱い (20)

200718 lt
200718 lt200718 lt
200718 lt
 
POI4XPagesを使ったword-excelへの簡単エクスポート
POI4XPagesを使ったword-excelへの簡単エクスポートPOI4XPagesを使ったword-excelへの簡単エクスポート
POI4XPagesを使ったword-excelへの簡単エクスポート
 
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
 
Hadoop Compatible File Systems 2019 (db tech showcase 2019 Tokyo講演資料、2019/09/25)
Hadoop Compatible File Systems 2019 (db tech showcase 2019 Tokyo講演資料、2019/09/25)Hadoop Compatible File Systems 2019 (db tech showcase 2019 Tokyo講演資料、2019/09/25)
Hadoop Compatible File Systems 2019 (db tech showcase 2019 Tokyo講演資料、2019/09/25)
 
Document translator
Document translatorDocument translator
Document translator
 
鈴木:Net commonsでの中国語使用について
鈴木:Net commonsでの中国語使用について鈴木:Net commonsでの中国語使用について
鈴木:Net commonsでの中国語使用について
 
鈴木:Net commonsでの中国語使用について
鈴木:Net commonsでの中国語使用について鈴木:Net commonsでの中国語使用について
鈴木:Net commonsでの中国語使用について
 
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fallビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
 
SQL Server 入門
SQL Server 入門SQL Server 入門
SQL Server 入門
 
AWS Black Belt Online Seminar 2017 Amazon Athena
AWS Black Belt Online Seminar 2017 Amazon AthenaAWS Black Belt Online Seminar 2017 Amazon Athena
AWS Black Belt Online Seminar 2017 Amazon Athena
 
Java de TFS
Java de TFSJava de TFS
Java de TFS
 
20180704 AWS Black Belt Online Seminar Amazon Elastic File System (Amazon EFS...
20180704 AWS Black Belt Online Seminar Amazon Elastic File System (Amazon EFS...20180704 AWS Black Belt Online Seminar Amazon Elastic File System (Amazon EFS...
20180704 AWS Black Belt Online Seminar Amazon Elastic File System (Amazon EFS...
 
Team Foundation Server入門
Team Foundation Server入門Team Foundation Server入門
Team Foundation Server入門
 
20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...
20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...
20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...
 
NXT開発環境(ETロボコン向けTOPPERS活用セミナー5)
NXT開発環境(ETロボコン向けTOPPERS活用セミナー5)NXT開発環境(ETロボコン向けTOPPERS活用セミナー5)
NXT開発環境(ETロボコン向けTOPPERS活用セミナー5)
 
chapter6
chapter6chapter6
chapter6
 
ITPro Expo 2014: Microsoft + Cisco UCS  (Cisco Unified Computing System)  サーバ
ITPro Expo 2014: Microsoft + Cisco UCS  (Cisco Unified Computing System)  サーバITPro Expo 2014: Microsoft + Cisco UCS  (Cisco Unified Computing System)  サーバ
ITPro Expo 2014: Microsoft + Cisco UCS  (Cisco Unified Computing System)  サーバ
 
ストレージネットワーク基礎講座
ストレージネットワーク基礎講座ストレージネットワーク基礎講座
ストレージネットワーク基礎講座
 
Apache Hive 紹介
Apache Hive 紹介Apache Hive 紹介
Apache Hive 紹介
 
Startup JavaScript
Startup JavaScriptStartup JavaScript
Startup JavaScript
 

More from SAS Institute Japan

SAS Japan Blog 記事「統計的因果推論コラム(2)」補足資料
SAS Japan Blog 記事「統計的因果推論コラム(2)」補足資料SAS Japan Blog 記事「統計的因果推論コラム(2)」補足資料
SAS Japan Blog 記事「統計的因果推論コラム(2)」補足資料
SAS Institute Japan
 
SAS Japan Blog 記事「統計的因果推論コラム(1)」補足資料
SAS Japan Blog 記事「統計的因果推論コラム(1)」補足資料SAS Japan Blog 記事「統計的因果推論コラム(1)」補足資料
SAS Japan Blog 記事「統計的因果推論コラム(1)」補足資料
SAS Institute Japan
 
SAS Learning Subscription 登録手順
SAS Learning Subscription 登録手順SAS Learning Subscription 登録手順
SAS Learning Subscription 登録手順
SAS Institute Japan
 
ディープラーニングは、時系列予測でも最強なのか?
ディープラーニングは、時系列予測でも最強なのか?ディープラーニングは、時系列予測でも最強なのか?
ディープラーニングは、時系列予測でも最強なのか?
SAS Institute Japan
 
SAS Viyaのディープラーニングを用いた物体検出
SAS Viyaのディープラーニングを用いた物体検出SAS Viyaのディープラーニングを用いた物体検出
SAS Viyaのディープラーニングを用いた物体検出
SAS Institute Japan
 
SAS OnDemand for Academics 登録方法
SAS OnDemand for Academics 登録方法SAS OnDemand for Academics 登録方法
SAS OnDemand for Academics 登録方法
SAS Institute Japan
 
SAS Visual Analytics 8.3 におけるクロス集計表の作成と可視化
SAS Visual Analytics 8.3 におけるクロス集計表の作成と可視化SAS Visual Analytics 8.3 におけるクロス集計表の作成と可視化
SAS Visual Analytics 8.3 におけるクロス集計表の作成と可視化
SAS Institute Japan
 
SAS Viyaによる意識改革からみえたData Scientistの生き方 ~僕たちはどう生きるか~
SAS Viyaによる意識改革からみえたData Scientistの生き方 ~僕たちはどう生きるか~SAS Viyaによる意識改革からみえたData Scientistの生き方 ~僕たちはどう生きるか~
SAS Viyaによる意識改革からみえたData Scientistの生き方 ~僕たちはどう生きるか~
SAS Institute Japan
 
SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~
SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~
SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~
SAS Institute Japan
 
SAS Viya Deep Dive: 予測モデリング
SAS Viya Deep Dive: 予測モデリングSAS Viya Deep Dive: 予測モデリング
SAS Viya Deep Dive: 予測モデリング
SAS Institute Japan
 
SAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AISAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AI
SAS Institute Japan
 
SAS Viya で異常検知してみよう!
SAS Viya で異常検知してみよう!SAS Viya で異常検知してみよう!
SAS Viya で異常検知してみよう!
SAS Institute Japan
 
Pythonで操るSAS Viyaの画像処理技術入門編
Pythonで操るSAS Viyaの画像処理技術入門編Pythonで操るSAS Viyaの画像処理技術入門編
Pythonで操るSAS Viyaの画像処理技術入門編
SAS Institute Japan
 
Python / R で使うSAS Viya
Python / R で使うSAS ViyaPython / R で使うSAS Viya
Python / R で使うSAS Viya
SAS Institute Japan
 
SAS OnDemand for Academics 登録方法
SAS OnDemand for Academics 登録方法SAS OnDemand for Academics 登録方法
SAS OnDemand for Academics 登録方法
SAS Institute Japan
 
無料統計・予測分析ツールを提供:SAS Analytics U
無料統計・予測分析ツールを提供:SAS Analytics U無料統計・予測分析ツールを提供:SAS Analytics U
無料統計・予測分析ツールを提供:SAS Analytics U
SAS Institute Japan
 
SASによるテキスト・アナリティクス入門
SASによるテキスト・アナリティクス入門SASによるテキスト・アナリティクス入門
SASによるテキスト・アナリティクス入門
SAS Institute Japan
 
SAS Enterprise Minerを使用した機械学習
SAS Enterprise Minerを使用した機械学習SAS Enterprise Minerを使用した機械学習
SAS Enterprise Minerを使用した機械学習
SAS Institute Japan
 
SAS High-Performance Analyticsによるビッグデータ解析
SAS High-Performance Analyticsによるビッグデータ解析SAS High-Performance Analyticsによるビッグデータ解析
SAS High-Performance Analyticsによるビッグデータ解析
SAS Institute Japan
 
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
SAS Institute Japan
 

More from SAS Institute Japan (20)

SAS Japan Blog 記事「統計的因果推論コラム(2)」補足資料
SAS Japan Blog 記事「統計的因果推論コラム(2)」補足資料SAS Japan Blog 記事「統計的因果推論コラム(2)」補足資料
SAS Japan Blog 記事「統計的因果推論コラム(2)」補足資料
 
SAS Japan Blog 記事「統計的因果推論コラム(1)」補足資料
SAS Japan Blog 記事「統計的因果推論コラム(1)」補足資料SAS Japan Blog 記事「統計的因果推論コラム(1)」補足資料
SAS Japan Blog 記事「統計的因果推論コラム(1)」補足資料
 
SAS Learning Subscription 登録手順
SAS Learning Subscription 登録手順SAS Learning Subscription 登録手順
SAS Learning Subscription 登録手順
 
ディープラーニングは、時系列予測でも最強なのか?
ディープラーニングは、時系列予測でも最強なのか?ディープラーニングは、時系列予測でも最強なのか?
ディープラーニングは、時系列予測でも最強なのか?
 
SAS Viyaのディープラーニングを用いた物体検出
SAS Viyaのディープラーニングを用いた物体検出SAS Viyaのディープラーニングを用いた物体検出
SAS Viyaのディープラーニングを用いた物体検出
 
SAS OnDemand for Academics 登録方法
SAS OnDemand for Academics 登録方法SAS OnDemand for Academics 登録方法
SAS OnDemand for Academics 登録方法
 
SAS Visual Analytics 8.3 におけるクロス集計表の作成と可視化
SAS Visual Analytics 8.3 におけるクロス集計表の作成と可視化SAS Visual Analytics 8.3 におけるクロス集計表の作成と可視化
SAS Visual Analytics 8.3 におけるクロス集計表の作成と可視化
 
SAS Viyaによる意識改革からみえたData Scientistの生き方 ~僕たちはどう生きるか~
SAS Viyaによる意識改革からみえたData Scientistの生き方 ~僕たちはどう生きるか~SAS Viyaによる意識改革からみえたData Scientistの生き方 ~僕たちはどう生きるか~
SAS Viyaによる意識改革からみえたData Scientistの生き方 ~僕たちはどう生きるか~
 
SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~
SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~
SAS ViyaのCNNを活用したProcess Innovation ~機械は解析図表をどう見ているのか~
 
SAS Viya Deep Dive: 予測モデリング
SAS Viya Deep Dive: 予測モデリングSAS Viya Deep Dive: 予測モデリング
SAS Viya Deep Dive: 予測モデリング
 
SAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AISAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AI
 
SAS Viya で異常検知してみよう!
SAS Viya で異常検知してみよう!SAS Viya で異常検知してみよう!
SAS Viya で異常検知してみよう!
 
Pythonで操るSAS Viyaの画像処理技術入門編
Pythonで操るSAS Viyaの画像処理技術入門編Pythonで操るSAS Viyaの画像処理技術入門編
Pythonで操るSAS Viyaの画像処理技術入門編
 
Python / R で使うSAS Viya
Python / R で使うSAS ViyaPython / R で使うSAS Viya
Python / R で使うSAS Viya
 
SAS OnDemand for Academics 登録方法
SAS OnDemand for Academics 登録方法SAS OnDemand for Academics 登録方法
SAS OnDemand for Academics 登録方法
 
無料統計・予測分析ツールを提供:SAS Analytics U
無料統計・予測分析ツールを提供:SAS Analytics U無料統計・予測分析ツールを提供:SAS Analytics U
無料統計・予測分析ツールを提供:SAS Analytics U
 
SASによるテキスト・アナリティクス入門
SASによるテキスト・アナリティクス入門SASによるテキスト・アナリティクス入門
SASによるテキスト・アナリティクス入門
 
SAS Enterprise Minerを使用した機械学習
SAS Enterprise Minerを使用した機械学習SAS Enterprise Minerを使用した機械学習
SAS Enterprise Minerを使用した機械学習
 
SAS High-Performance Analyticsによるビッグデータ解析
SAS High-Performance Analyticsによるビッグデータ解析SAS High-Performance Analyticsによるビッグデータ解析
SAS High-Performance Analyticsによるビッグデータ解析
 
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
SASによるインメモリ分散並列処理 レコメンドプロシジャ入門
 

SAS University Editionにおける日本語を含むファイルの取り扱い

  • 1. Copyright © SAS Institute Inc. All rights reserved. SAS University Editionにおける 日本語を含むファイルの取り扱い SAS Institute Japan 株式会社 アカデミア推進室 竹村 尚大
  • 2. Copyright © SAS Institute Inc. All rights reserved. Agenda • セッション・エンコーディング • 日本語ファイル名 • Excelファイルのインポート • CSV・Textファイルのインポート • エクスポート ※ この資料でのSAS製品名の省略: SAS University Edition = UE SAS OnDemand for Academics = ODA 2
  • 3. Copyright © SAS Institute Inc. All rights reserved. セッション・エンコーディング 3 セッション・エンコーディングとは: Base SAS がデフォルトで内部的に取り扱うマルチバイトの文字コード 製品名 セッション・エンコーディング Windows版 SAS 9.4 (日本語) Shift-JIS UE および ODA UTF-8 通常、WindowsのファイルはShift-JISエンコーディング ⇒ UE・ODAはインポート時にUTF-8に変換してデータを扱う ※ セッション・エンコーディングはSASのシステムオプションで設定できるが、 UE・ODAでは、システムオプションを変更できない
  • 4. Copyright © SAS Institute Inc. All rights reserved. セッション・エンコーディングの確認方法 4 proc options option = encoding; run;
  • 5. Copyright © SAS Institute Inc. All rights reserved. 日本語ファイル名 5 アップロードボタン 問題なく表示される 日本語ファイル名でインポートも可 UEで直接共有フォルダにファイルを置く方法でも大丈夫
  • 6. Copyright © SAS Institute Inc. All rights reserved. Excelファイルのインポート ファイル内容 6
  • 7. Copyright © SAS Institute Inc. All rights reserved. Excelファイルのインポート 下準備: 変数名ポリシーの変更 7 プリファレンスの設定 「ANY」にする ※ この操作は、日本語変数名 を許可するため
  • 8. Copyright © SAS Institute Inc. All rights reserved. Excelファイルのインポート (IMPORTプロシジャ) 拡張子が .xlsx (Excel 2007以降) の場合 8 ダブルクリック または 右クリック SAS Studioのタスクでインポート 日本語シート名の指定も可 生成されたコード
  • 9. Copyright © SAS Institute Inc. All rights reserved. Excelファイルのインポート (IMPORTプロシジャ結果) 拡張子が .xlsx (Excel 2007以降) の場合 9 ※日本語文字列の長さは予 想できない (UTF-8が可変長のため)
  • 10. Copyright © SAS Institute Inc. All rights reserved. Excelファイルのインポート (LIBNAMEステートメント) 拡張子が .xlsx (Excel 2007以降) の場合 10 LIBNAMEステートメントによる入力も可能 libname INDATA xlsx '~/データ.xlsx'; proc contents data=INDATA.'シート1'n; run; 日本語シート名も取り扱い可 ※ ただし、日本語シート名(データセット名) のタスクでの指定は不可
  • 11. Copyright © SAS Institute Inc. All rights reserved. Excelファイルのインポート (IMPORTプロシジャ) 拡張子が .xls (Excel 2003以前) の場合 11 インポート自体は通るが、文字コードは無効 コードを編集し、ENCODINGオプションをつけてみる 通らない… ※ XLS エンジンはトランスコーディングをサポートしない
  • 12. Copyright © SAS Institute Inc. All rights reserved. Excelファイルのインポート (LIBNAMEステートメント) 拡張子が .xls (Excel 2003以前) の場合 12 libname INDATA xls '~/データ.xls'; libname INDATA excel '~/データ.xls'; libname INDATA xlsx '~/データ.xlsx'; proc contents data=INDATA.'シート1'n; run; LIBNAMEステートメントでも読み込めない ※ EXCEL エンジンはWindowsシステムのみ (UEは仮想Linux上で動作)
  • 13. Copyright © SAS Institute Inc. All rights reserved. Excelファイルのインポート 拡張子が .xls (Excel 2003以前) の場合 13 xlsファイルはどのように読み込めば…? ⇒ Excel側で操作をする 1. Excel 2007以降を利用できる場合 ⇒ .xlsx ファイルとして保存 2. 「Unicodeテキストとして保存」 ⇒ タブ区切りデータのファイルとして読み込む 3. CSVとして保存 ⇒ A) ENCODINGオプションを指定してインポート B) メモ帳などでUTF-8に変換
  • 14. Copyright © SAS Institute Inc. All rights reserved. ExcelファイルをUnicodeテキストとして保存 14 タブ区切りテキストデータ Unicodeテキスト (*.txt)
  • 15. Copyright © SAS Institute Inc. All rights reserved. テキストファイル(Unicode)のインポート 15 ダブルクリック ドラッグ&ドロップ ’09’x チェックを外す 生成されたコード これでインポート可
  • 16. Copyright © SAS Institute Inc. All rights reserved. ExcelファイルをCSVとして保存 16 メモ帳からUTF-8で保存 CSVカンマ区切り (*.csv) UTF-8
  • 17. Copyright © SAS Institute Inc. All rights reserved. CSVファイル (Shift-JIS) のインポート 17 ダブルクリック or 右クリック ⇒データのインポート このままでは文字化け クリック encoding=sjis オプションを追加 これでインポート可
  • 18. Copyright © SAS Institute Inc. All rights reserved. CSVファイル (UTF-8) のインポート 18 ダブルクリック or 右クリック ⇒データのインポート このままでインポート可
  • 19. Copyright © SAS Institute Inc. All rights reserved. CSVエクスポート (メニューから) 19 右クリック 文字コード: UTF-8 改行コード: LF のCSVとして出力 このボタンでローカル にダウンロード可
  • 20. Copyright © SAS Institute Inc. All rights reserved. XLSXエクスポート (メニューから) 20 右クリック 通常のxlsxファイル このボタンでローカル にダウンロード可
  • 21. Copyright © SAS Institute Inc. All rights reserved. EXPORTプロシジャ 21 proc export data=work.import outfile='~/export.xlsx' dbms=xlsx replace; run; proc export data=work.import outfile='~/export.xls' dbms=xls replace; run; OK 文字化け filename _outfile '~/export_sjis.csv' encoding=sjis; proc export data=work.import outfile=_outfile dbms=csv replace; run; Shift-JIS エンコード proc export data=work.import outfile='~/export.csv' dbms=csv replace; run; UTF-8 エンコード
  • 22. Copyright © SAS Institute Inc. All rights reserved. CSVファイルの生成スニペット 22 スニペット = SASコードのテンプレート 直接ダウンロードされる 文字コード: UTF-8 改行コード: LF のCSVとして出力 コードを編集
  • 23. Copyright © SAS Institute Inc. All rights reserved. LIBNAMEステートメントによる.xlsxへの書き込み 23 libname INDATA xlsx '~/データ.xlsx'; data INDATA.'シート2'n; set INDATA.'シート1'n; length '文字列2'n $ 100; '文字列2'n = cats('文字列'n, '番号'n); run; Excelの自動修復機能で復元
  • 24. Copyright © SAS Institute Inc. All rights reserved. まとめ 24 xlsx ファイル xlsファイル csv/txt (Shift-JIS) csv/txt (Unicode/UTF-8) 日本語ファイル 〇 日本語変数名 プリファンレスで「SAS変数名ポリシー」をANYに インポートタスク 〇 × × 〇 IMPORT プロシジャ 〇 × 〇 (オプション ENCODING=SJIS) 〇 LIBNAME ステートメント 〇 (ただし日本語 シート名は要注意) × - - エクスポートメニュー 〇 - - 〇 EXPORT プロシジャ 〇 × 〇 (オプション ENCODING=SJIS) 〇 LIBNAME ステートメント(書込) △ - - - ※ xlsファイルは .xlsx / .csv / .txt ファイルに保存しなおして読み込む