SlideShare a Scribd company logo
おしゃべりなロングテールの
後ろ側のツール群
伊藤貴一
Rawler


概要


テキスト処理とWebから
データ取得フレームワーク








これ単独で大半のページの
取得ができます。

XAML(XML)でメタプロ
グラミング
一応、GitHubで公開してい
る。(誰も見ていない)
慣れると、30分位でWebの
データを取得できる

使われているプロジェク
ト


Mixi、Pixiv分析でのデー
タ取得

Rawlerクライアント
Rawler


コンセプト


パラメータの入力だけするやり方があると便利
Webからのデータ取得は、パラメータの組み合わせでしかない。
しかし、組み合わせは多数存在するので、プログラミングという形が一番いい
表現方法。簡単に使えるツール化は断念







記述量がすくなく、見通しがいいものがほしい
メソッドチェーンみたいなのがやりたい。
すべての命令は、テキストを変数としてテキストを返す仕組みになっている。
変数の受け渡し排除、ループの排除。






機能のパーツを作るだけで、再利用可能な形にしたい。





これだけで、Webのデータ取得とテキスト処理を完結させたい。




パーツの組み合わせでやりたいことを実現。
実装は、基底クラスの継承で実現。C#のXAMLという機構を利用している。
ライブラリのはずが、フレームワークになっていた。

LL言語みたいに、コンパイルなしで気軽に使いたい



クライアントで気軽に起動。
でも、強い型制約も大好き。IntelliSense大好き。


作成は、Visual Studioで使うと、IntelliSenseが働く。
Rawler
これだけの記述で、Webペー
ジのアクセス、タグの抽出、
リンクの抽出、データの格納
を行う。
Visual Studioで使うと入力補助が機能す
るので、比較的簡単に作れる。(XAML
という仕組みを利用している。)

すべての命令は、テキストを変数としてテキ
ストを返す。
そのため、Page→Links→Pageとリンクをた
どっていくようなことが表現可能。
複雑なことは、ツリーを深くしていけば可能。
命令は、クラスの継承を使い簡単に作れて、
今では、ツイッターからのデータ取得や、形
態素解析(YahooAPI使用)などもできる。

http://web.sfc.keio.ac.jp/~kiichi/soft/rawler
/publish.htm

ここからクライアントツールが起
動できて、そのツールのテキスト
エリアに、プログラムを書き込み、
実行できる。
ソースコードは、一応Githubに公
開している。
ソースコードがヘルプみたいなも
のなので(震え声)
ClusterTable


概要








表の形でクラスタリング
の結果を見せるツール。
アイテム間の関係や属性
との関係も可視化
アイテムの移動もできる。
クラスタリングもできる
ようにした。
SilverLight製なので、ブ
ラウザ上で、Macな人も
使える

使われているプロジェ
クト


Mixi分析、ツイッター分

ツール画面
ClusterTable


コンセプト


大量のアイテムの表示に系統とレイヤーを用いて表形式
で表示するツール


レイヤー:頻度階層。頻度が高いものが上の階層になる。









クラスタリングするにも、頻度が同じくらいのものでするのが理想
的。

相関ルールの可視化
ある程度結果に人間が介入できて、機械の結果を絶対視
せず、解釈の結果を反映させるようなツール
初心者にも扱えるぐらいの、なるべく少ないデータ入力
種類で済ませる。データベースは使わない。
ブラウザで、WinでもMacでも使えるツール


いまどき、SilverLight製 コンシューマ向けじゃないから問題
なし。
ClusterTable
頻度高い

•色が付くのは、相関が強いもの
•相関が強いものが縦の列でなる
べく並ぶようにクラスタリング
している。
アイテム間の関係を表示

頻度低い
ClusterTable

性別、年齢などの属性と
の関係を表示
赤が特化している。
ClusterTable

クラスタ間の関係をグラフ表示
CrossTable


概要


アンケートデータ分析ツール












単純集計、クロス表、グールプ
化集計

簡単に変数の統合、絞込、削除
の指定が可能
変数のクラスタリングと、その
クラスタリング結果を新たな変
数に追加することが可能
SilverLight製なので、Macな人
も使える
ローカルファイルを読み込んで
処理をするので、機密性が高い。
GoocaBoocaとの連携もしてい
る。
簡単なフリーアンサー分析もで
きる。

使われているプロジェクト


GoocaBoocaの結果分析
CrossTable


コンセプト





アンケート分析ツールがほしい。
データの絞り込み指定が簡単にやれて、詳細な分析が可
能にする。
クラスタリングによって変数の統合と、クラスタリング
結果からさらにクロス表、グループ化集計が可能にする。
Webブラウザから簡単にやれる。でも、ローカルファイ
ルを扱えるようにして、Webに上げたくないデータも分
析できるようにする。
CrossTable:単純集計
CrossTable:クロス集計
CrossTable:クラスタリング

クラスタリングのアルゴリズム
は
K-means法。
クラスタリングの結果を元に、
単純集計、クロス集計が行える。
CrossTable:絞り込み

絞り込んだデータで、単純集計、
クロス集計、クラスタリングが行
える。
GoocaBooca


概要




スーマートフォンを使った、画像について、
Yes、Noを答えるだけのアンケートシステム
最後に質問をすし、結果を見せることができる。
XMLの設定ファイルを作成するだけで、すぐに
アンケートができる。






CrossTableで、そのデータの分析ができる。

使われているプロジェクト




画像について属性を付与してその分析も可能にしてい
る。

GoocaBooca

コンセプト




スーマートフォンを使って、イメージについて
のアンケートをしたい。
さくさく回答できる。
共通化して、様々なアンケートをできるように
する。
GoocaBooca

YesNo回答

一覧ページ

質問ページ

CrossTableでデータ分析
ツール群


Rawler


テキスト処理とWebからデータ取得フレームワーク




ClusterTable


クラスタリングと構造化、データの表示ツール




ローカルファイル読み込み SilverLight製

CrossTable


単純集計、クロス表、クラスタリング、データの絞込、
ツール




XAML(XML)でプログラミング メソッドチェーン的なプロ
グラミング

ローカルファイル読み込み GoocaBoocaと連携 SilverLight
製

GoocaBooca


簡単Webアンケートサービス。


XML入力ファイルを作れば、すぐできる。

More Related Content

Viewers also liked

Rawlerフレームワーク(全体)
Rawlerフレームワーク(全体)Rawlerフレームワーク(全体)
Rawlerフレームワーク(全体)
Takaichi Ito
 
Literacy breaking the cycle
Literacy breaking the cycleLiteracy breaking the cycle
Literacy breaking the cycle
Zifan Wang
 
Jha
JhaJha
ยินดีต้อนรับ ผู้อำนวยการชาญชัย ชนิสะ
ยินดีต้อนรับ ผู้อำนวยการชาญชัย   ชนิสะยินดีต้อนรับ ผู้อำนวยการชาญชัย   ชนิสะ
ยินดีต้อนรับ ผู้อำนวยการชาญชัย ชนิสะสังสรรค์ แต่งสกุล
 
Webスクレイピング用の言語っぽいものを作ったよ
Webスクレイピング用の言語っぽいものを作ったよWebスクレイピング用の言語っぽいものを作ったよ
Webスクレイピング用の言語っぽいものを作ったよ
Takaichi Ito
 
ประชุมเครือข่ายผู้ปกครองครั้งที่ 1 2556
ประชุมเครือข่ายผู้ปกครองครั้งที่ 1 2556ประชุมเครือข่ายผู้ปกครองครั้งที่ 1 2556
ประชุมเครือข่ายผู้ปกครองครั้งที่ 1 2556สังสรรค์ แต่งสกุล
 
ประชุมผู้ปกครองนักเรียน ปีการศึกษา 2557
ประชุมผู้ปกครองนักเรียน ปีการศึกษา 2557ประชุมผู้ปกครองนักเรียน ปีการศึกษา 2557
ประชุมผู้ปกครองนักเรียน ปีการศึกษา 2557สังสรรค์ แต่งสกุล
 
วันภาษาไทย 2557
วันภาษาไทย 2557วันภาษาไทย 2557
วันภาษาไทย 2557
สังสรรค์ แต่งสกุล
 
งานทอดผ้าป่า 40 ปี คืนสู่เหย้าชาวชมพูดำ ภาคเช้า
งานทอดผ้าป่า 40 ปี คืนสู่เหย้าชาวชมพูดำ ภาคเช้างานทอดผ้าป่า 40 ปี คืนสู่เหย้าชาวชมพูดำ ภาคเช้า
งานทอดผ้าป่า 40 ปี คืนสู่เหย้าชาวชมพูดำ ภาคเช้า
สังสรรค์ แต่งสกุล
 

Viewers also liked (20)

Rawlerフレームワーク(全体)
Rawlerフレームワーク(全体)Rawlerフレームワーク(全体)
Rawlerフレームワーク(全体)
 
Catedra Fotos Carnaval 2011
Catedra Fotos Carnaval 2011Catedra Fotos Carnaval 2011
Catedra Fotos Carnaval 2011
 
Literacy breaking the cycle
Literacy breaking the cycleLiteracy breaking the cycle
Literacy breaking the cycle
 
Jha
JhaJha
Jha
 
กลุ่มสาระภาษาอังกฤษ
กลุ่มสาระภาษาอังกฤษกลุ่มสาระภาษาอังกฤษ
กลุ่มสาระภาษาอังกฤษ
 
กิจกรรมแนะแนว แก้ไขแล้ว
กิจกรรมแนะแนว แก้ไขแล้วกิจกรรมแนะแนว แก้ไขแล้ว
กิจกรรมแนะแนว แก้ไขแล้ว
 
งานนำเสนอ กิจกรรมแนะแนว
งานนำเสนอ กิจกรรมแนะแนวงานนำเสนอ กิจกรรมแนะแนว
งานนำเสนอ กิจกรรมแนะแนว
 
ยินดีต้อนรับ ผู้อำนวยการชาญชัย ชนิสะ
ยินดีต้อนรับ ผู้อำนวยการชาญชัย   ชนิสะยินดีต้อนรับ ผู้อำนวยการชาญชัย   ชนิสะ
ยินดีต้อนรับ ผู้อำนวยการชาญชัย ชนิสะ
 
ตอดำเก้าที่ยว
ตอดำเก้าที่ยวตอดำเก้าที่ยว
ตอดำเก้าที่ยว
 
ไก่ชนและฟาร์ม
ไก่ชนและฟาร์มไก่ชนและฟาร์ม
ไก่ชนและฟาร์ม
 
สุดสาคร
สุดสาครสุดสาคร
สุดสาคร
 
ประชุมผู้ปกครองครั้งที่ 1 2556
ประชุมผู้ปกครองครั้งที่ 1 2556ประชุมผู้ปกครองครั้งที่ 1 2556
ประชุมผู้ปกครองครั้งที่ 1 2556
 
Webスクレイピング用の言語っぽいものを作ったよ
Webスクレイピング用の言語っぽいものを作ったよWebスクレイピング用の言語っぽいものを作ったよ
Webスクレイピング用の言語っぽいものを作ったよ
 
ทัศนศึกษา ม ปลาย
ทัศนศึกษา ม ปลายทัศนศึกษา ม ปลาย
ทัศนศึกษา ม ปลาย
 
เข้าค่ายลูกเสือ 2556
เข้าค่ายลูกเสือ 2556เข้าค่ายลูกเสือ 2556
เข้าค่ายลูกเสือ 2556
 
ประชุมเครือข่ายผู้ปกครองครั้งที่ 1 2556
ประชุมเครือข่ายผู้ปกครองครั้งที่ 1 2556ประชุมเครือข่ายผู้ปกครองครั้งที่ 1 2556
ประชุมเครือข่ายผู้ปกครองครั้งที่ 1 2556
 
ประชุมผู้ปกครองนักเรียน ปีการศึกษา 2557
ประชุมผู้ปกครองนักเรียน ปีการศึกษา 2557ประชุมผู้ปกครองนักเรียน ปีการศึกษา 2557
ประชุมผู้ปกครองนักเรียน ปีการศึกษา 2557
 
วันภาษาไทย 2557
วันภาษาไทย 2557วันภาษาไทย 2557
วันภาษาไทย 2557
 
วันเอดส์โลก
วันเอดส์โลกวันเอดส์โลก
วันเอดส์โลก
 
งานทอดผ้าป่า 40 ปี คืนสู่เหย้าชาวชมพูดำ ภาคเช้า
งานทอดผ้าป่า 40 ปี คืนสู่เหย้าชาวชมพูดำ ภาคเช้างานทอดผ้าป่า 40 ปี คืนสู่เหย้าชาวชมพูดำ ภาคเช้า
งานทอดผ้าป่า 40 ปี คืนสู่เหย้าชาวชมพูดำ ภาคเช้า
 

Similar to Orf2013バックツール

TreeFrog Frameworkの紹介
TreeFrog Frameworkの紹介TreeFrog Frameworkの紹介
TreeFrog Frameworkの紹介
ao27
 
Djangoフレームワークの紹介 OSC2015北海道
Djangoフレームワークの紹介 OSC2015北海道Djangoフレームワークの紹介 OSC2015北海道
Djangoフレームワークの紹介 OSC2015北海道
Shinya Okano
 
モノとモノとをつなぐ 3つの「れんけい」
モノとモノとをつなぐ 3つの「れんけい」モノとモノとをつなぐ 3つの「れんけい」
モノとモノとをつなぐ 3つの「れんけい」
kamiyam .
 
ドメインロジックの実装方法とドメイン駆動設計
ドメインロジックの実装方法とドメイン駆動設計ドメインロジックの実装方法とドメイン駆動設計
ドメインロジックの実装方法とドメイン駆動設計Tadayoshi Sato
 
WebDAV, ATOM, and REST
WebDAV, ATOM, and RESTWebDAV, ATOM, and REST
WebDAV, ATOM, and REST
Taisuke Yamada
 
3分でサーバオペレーションコマンドを作る技術
3分でサーバオペレーションコマンドを作る技術3分でサーバオペレーションコマンドを作る技術
3分でサーバオペレーションコマンドを作る技術
Kei IWASAKI
 
Rubyで作るtwitter風webアプリケーション
Rubyで作るtwitter風webアプリケーションRubyで作るtwitter風webアプリケーション
Rubyで作るtwitter風webアプリケーションNaoto Hori
 
Yet anothor プロジェクト管理ツール ~Backlog~
Yet anothor プロジェクト管理ツール ~Backlog~Yet anothor プロジェクト管理ツール ~Backlog~
Yet anothor プロジェクト管理ツール ~Backlog~
ikikko
 
Azure Functions 入門
Azure Functions 入門Azure Functions 入門
Azure Functions 入門
jz5 MATSUE
 
【18-C-4】Google App Engine - 無限の彼方へ
【18-C-4】Google App Engine - 無限の彼方へ【18-C-4】Google App Engine - 無限の彼方へ
【18-C-4】Google App Engine - 無限の彼方へDevelopers Summit
 
SilverlightとSharePoint2010の紹介
SilverlightとSharePoint2010の紹介SilverlightとSharePoint2010の紹介
SilverlightとSharePoint2010の紹介
Tadahiro Higuchi
 
公開型CMSとしてのTrac
公開型CMSとしてのTrac公開型CMSとしてのTrac
公開型CMSとしてのTrac
Kazuya Hirobe
 
05 はじめてのmy sql
05 はじめてのmy sql05 はじめてのmy sql
05 はじめてのmy sql
文樹 高橋
 
20061007.saas
20061007.saas20061007.saas
20061007.saas
Ken SASAKI
 
Concentrated HTML5 & Attractive HTML5
Concentrated HTML5 & Attractive HTML5Concentrated HTML5 & Attractive HTML5
Concentrated HTML5 & Attractive HTML5
Sho Ito
 
メタプログラミングって何だろう
メタプログラミングって何だろうメタプログラミングって何だろう
メタプログラミングって何だろうKota Mizushima
 
関西オープンソース 2008 30days Albumの裏側
関西オープンソース 2008 30days Albumの裏側関西オープンソース 2008 30days Albumの裏側
関西オープンソース 2008 30days Albumの裏側Gosuke Miyashita
 
クラウドを活用した システム開発は適材適所
クラウドを活用したシステム開発は適材適所クラウドを活用したシステム開発は適材適所
クラウドを活用した システム開発は適材適所
Kimihiko Kitase
 

Similar to Orf2013バックツール (20)

TreeFrog Frameworkの紹介
TreeFrog Frameworkの紹介TreeFrog Frameworkの紹介
TreeFrog Frameworkの紹介
 
Djangoフレームワークの紹介 OSC2015北海道
Djangoフレームワークの紹介 OSC2015北海道Djangoフレームワークの紹介 OSC2015北海道
Djangoフレームワークの紹介 OSC2015北海道
 
勉強会資料①
勉強会資料①勉強会資料①
勉強会資料①
 
モノとモノとをつなぐ 3つの「れんけい」
モノとモノとをつなぐ 3つの「れんけい」モノとモノとをつなぐ 3つの「れんけい」
モノとモノとをつなぐ 3つの「れんけい」
 
ドメインロジックの実装方法とドメイン駆動設計
ドメインロジックの実装方法とドメイン駆動設計ドメインロジックの実装方法とドメイン駆動設計
ドメインロジックの実装方法とドメイン駆動設計
 
WebDAV, ATOM, and REST
WebDAV, ATOM, and RESTWebDAV, ATOM, and REST
WebDAV, ATOM, and REST
 
3分でサーバオペレーションコマンドを作る技術
3分でサーバオペレーションコマンドを作る技術3分でサーバオペレーションコマンドを作る技術
3分でサーバオペレーションコマンドを作る技術
 
Rubyで作るtwitter風webアプリケーション
Rubyで作るtwitter風webアプリケーションRubyで作るtwitter風webアプリケーション
Rubyで作るtwitter風webアプリケーション
 
Yet anothor プロジェクト管理ツール ~Backlog~
Yet anothor プロジェクト管理ツール ~Backlog~Yet anothor プロジェクト管理ツール ~Backlog~
Yet anothor プロジェクト管理ツール ~Backlog~
 
Azure Functions 入門
Azure Functions 入門Azure Functions 入門
Azure Functions 入門
 
【18-C-4】Google App Engine - 無限の彼方へ
【18-C-4】Google App Engine - 無限の彼方へ【18-C-4】Google App Engine - 無限の彼方へ
【18-C-4】Google App Engine - 無限の彼方へ
 
SilverlightとSharePoint2010の紹介
SilverlightとSharePoint2010の紹介SilverlightとSharePoint2010の紹介
SilverlightとSharePoint2010の紹介
 
公開型CMSとしてのTrac
公開型CMSとしてのTrac公開型CMSとしてのTrac
公開型CMSとしてのTrac
 
05 はじめてのmy sql
05 はじめてのmy sql05 はじめてのmy sql
05 はじめてのmy sql
 
20061007.saas
20061007.saas20061007.saas
20061007.saas
 
My sqlとplugin
My sqlとpluginMy sqlとplugin
My sqlとplugin
 
Concentrated HTML5 & Attractive HTML5
Concentrated HTML5 & Attractive HTML5Concentrated HTML5 & Attractive HTML5
Concentrated HTML5 & Attractive HTML5
 
メタプログラミングって何だろう
メタプログラミングって何だろうメタプログラミングって何だろう
メタプログラミングって何だろう
 
関西オープンソース 2008 30days Albumの裏側
関西オープンソース 2008 30days Albumの裏側関西オープンソース 2008 30days Albumの裏側
関西オープンソース 2008 30days Albumの裏側
 
クラウドを活用した システム開発は適材適所
クラウドを活用したシステム開発は適材適所クラウドを活用したシステム開発は適材適所
クラウドを活用した システム開発は適材適所
 

Orf2013バックツール