Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

【KSKアナリティクス】 【前編】 オープンデータ 分析 - XML ファイルからデータ抽出・整形 -

3,064 views

Published on

XML形式のデータを分析用に加工する方法

Published in: Data & Analytics
  • Be the first to comment

【KSKアナリティクス】 【前編】 オープンデータ 分析 - XML ファイルからデータ抽出・整形 -

  1. 1. NYSOL Partner KSK Analytics 高速に前処理するNYSOL 株式会社KSKアナリティクス 使い方 【前編】オープンデータ分析 -XMLファイルからデータ抽出・整形- 2016/03/17
  2. 2. NYSOL Partner KSK Analytics 分析の前に NYSOLをインストールされて いないという方はまずは 以下スライドをご覧下さい。 © KSK Analytics Inc. 2 NYSOL インストール (Windows 64 bit 編) http://www.slideshare.net/ksk-ada/ksknysolwindows-64bit
  3. 3. NYSOL Partner KSK Analytics 早速、データを準備します。 以下のオープンデータを 使用させて頂きます。 © KSK Analytics Inc. 3 明石高専オープンデータ「学生食堂メニュー」 http://www.akashi.ac.jp/guide/opendata#cafemenu
  4. 4. NYSOL Partner KSK Analytics © KSK Analytics Inc. 4 ダウンロードはこちらから 明石高専オープンデータ「学生食堂メニュー」 http://www.akashi.ac.jp/guide/opendata#cafemenu
  5. 5. NYSOL Partner KSK Analytics © KSK Analytics Inc. 5 こちらをクリック 明石高専オープンデータ「学生食堂メニュー」 http://www.akashi.ac.jp/guide/opendata#cafemenu
  6. 6. NYSOL Partner KSK Analytics © KSK Analytics Inc. 6 日付 メニュー 今回使用する データはXMLです。 明石高専オープンデータ「学生食堂メニュー」 http://www.akashi.ac.jp/guide/opendata#cafemenu
  7. 7. NYSOL Partner KSK Analytics © KSK Analytics Inc. 7 画面上で右クリックすると以下メニューが 表示されますので、保存をクリック
  8. 8. NYSOL Partner KSK Analytics © KSK Analytics Inc. 8 名前を付けて保存ダイアログが 表示されますので、保存をクリック
  9. 9. NYSOL Partner KSK Analytics © KSK Analytics Inc. 9 仮想環境を起動するためにこちらをクリック
  10. 10. NYSOL Partner KSK Analytics © KSK Analytics Inc. 10 nysolアカウントを選択し、 パスワードはMining2015と入力し、 サインインして下さい。
  11. 11. NYSOL Partner KSK Analytics © KSK Analytics Inc. 11 Windows(ホストOS)から仮想環境(ゲストOS)へ データをドラッグしますので、以下をクリック
  12. 12. NYSOL Partner KSK Analytics © KSK Analytics Inc. 12 cafemenu201405.xmlをドラッグし、 仮想環境上へドロップして下さい。
  13. 13. NYSOL Partner KSK Analytics © KSK Analytics Inc. 13 端末を起動するためにこちらをクリック
  14. 14. NYSOL Partner KSK Analytics © KSK Analytics Inc. 14 cd Desktop/と入力して下さい。 Desktopディレクトリへ移動します。
  15. 15. NYSOL Partner KSK Analytics © KSK Analytics Inc. 15 lsと入力して下さい。 Desktop内のファイルの一覧を表示します。 cafemenu201405.xmlがあることを 確認できます。
  16. 16. NYSOL Partner KSK Analytics © KSK Analytics Inc. 16 mxml2csv k=/Menus/Menu/Meal f=/Menus/Menu@Date:Date,/Menus/Menu/ Meal/Name:Name i=cafemenu201405.xml o=menu1405.csv と入力して下さい。 XMLファイルから「日付」と「メニュー」を抽出し、 CSV(menu1405.csv)ファイルを出力します。
  17. 17. NYSOL Partner KSK Analytics © KSK Analytics Inc. 17 head menu1405.csvと入力して下さい。 以下のようなCSVファイルが出力されていれば OKです。 menu1405.csvの先頭から 10行を確認出来ます。
  18. 18. NYSOL Partner KSK Analytics © KSK Analytics Inc. 18 通常、XML形式のデータ抽出には ひと手間かかりますが、 NYSOLを使えば1行で簡単に処理できます。 更にその後の加工・整形まで 同じプラットドーム上で処理できるので、 データ前処理に掛ける時間を短縮できます。 是非、お試しください!
  19. 19. NYSOL Partner KSK Analytics © KSK Analytics Inc. 19 NYSOL Community http://www.nysol.biz/#!community/csv0 ご不明な点はこちらへお気軽にご質問下さい
  20. 20. NYSOL Partner KSK Analytics © KSK Analytics Inc. 20 NYSOL Blog http://www.nysol.biz/#!blog/c1ysn BlogではNYSOLの使い方を連載中!!

×