Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

2,569 views

Published on

XML形式のデータから頻出パターンを発見し可視化する方法

Published in: Data & Analytics

【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

  1. 1. NYSOL Partner KSK Analytics 高速に前処理するNYSOL 株式会社KSKアナリティクス 使い方 【後編】オープンデータ分析 -頻出パターンの作成・可視化- 2016/03/18
  2. 2. NYSOL Partner KSK Analytics © KSK Analytics Inc. 2 後編では以下のような可視化を行います。 NYSOL Blog http://www.nysol.biz/#!blog/c1ysn
  3. 3. NYSOL Partner KSK Analytics 前編をご覧になっていない方は まずは以下をご覧下さい。 © KSK Analytics Inc. 3 NYSOL 使い方 【前編】オープンデータ分析 - XMLファイルからデータ抽出・整形 - http://www.slideshare.net/ksk-ada/ksk-xml
  4. 4. NYSOL Partner KSK Analytics © KSK Analytics Inc. 4 前回はXMLデータをCSVに変換し、 head menu1405.csvと入力して データの中身を確認しました。 menu1405.csvの先頭から 10行を確認出来ます。 明石高専オープンデータ「学生食堂メニュー」 http://www.akashi.ac.jp/guide/opendata#cafemenu
  5. 5. NYSOL Partner KSK Analytics © KSK Analytics Inc. 5 よく出現する食堂メニューの組合せを探ります。 mtra2g.rb s=0.025 tid=Date item=Name i=menu1405.csv eo=pattern.csv と入力して下さい。
  6. 6. NYSOL Partner KSK Analytics © KSK Analytics Inc. 6 mtra2g.rb (アイテム類似度グラフの構築コマンド) s=0.025 : 最小支持度 (全トランザクション数に対する割合) sで指定する値以上の組合せを出力 tid=Date : 日付単位で、 item=Name : メニューの組合せを探る。 i=menu1405.csv : 入力ファイル eo=pattern.csv :出力ファイル
  7. 7. NYSOL Partner KSK Analytics © KSK Analytics Inc. 7 head pattern.csvと入力して下さい。 以下のようなCSVファイルが出力されていれば OKです。 先頭から 10行分
  8. 8. NYSOL Partner KSK Analytics © KSK Analytics Inc. 8 「node1」、「node2」、「support」の項目列だけ 抽出します。 mcut f=node1,node2,support i=pattern.csv o=edgelist.csv と入力して下さい。
  9. 9. NYSOL Partner KSK Analytics © KSK Analytics Inc. 9 head edgelist.csvと入力して下さい。 以下のようなCSVファイルが出力されていれば OKです。 先頭から 10行分
  10. 10. NYSOL Partner KSK Analytics © KSK Analytics Inc. 10 メニュー全体のつながりを可視化します。 mgv.rb ei=edgelist.csv ef=node1,node2 ev=support o=graph.dot と入力して下さい。
  11. 11. NYSOL Partner KSK Analytics © KSK Analytics Inc. 11 環状レイアウトで、メニューのつながりを可視化しま す。 circo -Tpng graph.dot > graph.png と入力して下さい。 ダブルクリックして下さい。
  12. 12. NYSOL Partner KSK Analytics © KSK Analytics Inc. 12 以下のようなものが表示されるか確認して下 さい。 NYSOL Blog http://www.nysol.biz/#!blog/c1ysn
  13. 13. NYSOL Partner KSK Analytics © KSK Analytics Inc. 13 NYSOL Community http://www.nysol.biz/#!community/csv0 ご不明な点はこちらへお気軽にご質問下さい
  14. 14. NYSOL Partner KSK Analytics © KSK Analytics Inc. 14 NYSOL Blog http://www.nysol.biz/#!blog/c1ysn BlogではNYSOLの使い方を連載中!!

×