UEC.R(R 勉強会 in 電通大 )    R でテキストマイニング--YjdnJlp パッケージを使って --
自己紹介   名前:早川 敦士   電気通信大学システム工学科三年   サークルは MMA と ICES に所属   ツイッターは、 @gepuro   ブログは、 http://d.hatena.ne.jp/gepuro/   資...
R って何?   正しくは R 言語と言います   統計解析を得意とするプログラミング言語   プログラミングをするのに難しい知識は不要   プログラムを書くことを専門としていない人も使って    います。
誰が使ってるの?   金融業界   マーケティング   経営工学   医療業界   生物学   統計学   Web 業界   などなど・・・
なんで R を使うの?   最新の手法を使うため   多くのソフトでは、古典的な手法しか使えない   無料   同じ計算を繰り返すのが楽   早い( Excel と比べて)   たくさんのデータを扱える( Excel と比べて) ...
テキストマイニングって何ぞや   マイニングとは、「発掘」を意味する英単語   テキストデータから、価値ある情報を発掘すること
何が嬉しいの?   数値データに比べて、量が多い。   世の中にあるすべての文章が分析対象になる。   新聞、雑誌、 web サイト、ブログ、ツイッターなど                つまり、   web からデータをとれば、無限の...
実際にやってみた   分析するテキストデータを手に入れる。   日経経済新聞の記事を対象にしました。   http://www.nikkei.com/   NY円、続伸 1ドル= 80 円 70 ~ 80 銭で終了     対ユーロは大...
   これくらいの文章なら読めるけど・・・   できる事なら、読みたくない   新聞の記事全部を読めますか?   ツイッターのつぶやきを全部読めますか?                ↓    たくさんのデータから、価値ある情報を発掘す...
発掘結果           keyphrase score   1        ユーロ     100   2        低金利      97   3        円買い      96   4        値動き    ...
   score が高いほど、重要そうな情報   3 番目に「円買い」とある。   円買いというのが重要らしい。   記事を読むことなく、それが分かった。
   YahooJapan のデベロッパーネットワークの登録が    必要です。   http://developer.yahoo.co.jp/sitemap/   アプリケーション ID の登録   無料です。
テキストマイニングの可能性の一つ   刻々と変化する為替や株式   秒単位で動くツイッター   ツイッターのつぶやきを分析すれば、    株価や為替の変動が予測できるのでは?    変動の直前にそれが分かれば・・・・    実現すれば、あ...
終わりに   テキストマイニングをしてみませんか?       R 言語で世の中を分析してみよう           情報を持つものが勝つ時代        ご清聴ありがとうございました。
参考   Tokyor13 - YjdnJlp パッケージと Tokyo.R 翻訳プ    ロジェクトの紹介   http://www.slideshare.net/yokkuns/tokyor13-    yjdnjlptokyor
Upcoming SlideShare
Loading in …5
×

Uec.R#3 YjdnJlpを使ってみた

1,480 views

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,480
On SlideShare
0
From Embeds
0
Number of Embeds
7
Actions
Shares
0
Downloads
3
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Uec.R#3 YjdnJlpを使ってみた

  1. 1. UEC.R(R 勉強会 in 電通大 ) R でテキストマイニング--YjdnJlp パッケージを使って --
  2. 2. 自己紹介 名前:早川 敦士 電気通信大学システム工学科三年 サークルは MMA と ICES に所属 ツイッターは、 @gepuro ブログは、 http://d.hatena.ne.jp/gepuro/ 資料は、 http://www.slideshare.net/gepuro/ 学外で社会人の方も参加される勉強会でプレゼン テーションをやらせてもらっています。
  3. 3. R って何? 正しくは R 言語と言います 統計解析を得意とするプログラミング言語 プログラミングをするのに難しい知識は不要 プログラムを書くことを専門としていない人も使って います。
  4. 4. 誰が使ってるの? 金融業界 マーケティング 経営工学 医療業界 生物学 統計学 Web 業界 などなど・・・
  5. 5. なんで R を使うの? 最新の手法を使うため 多くのソフトでは、古典的な手法しか使えない 無料 同じ計算を繰り返すのが楽 早い( Excel と比べて) たくさんのデータを扱える( Excel と比べて) Excel から R 言語を使う事もできます。
  6. 6. テキストマイニングって何ぞや マイニングとは、「発掘」を意味する英単語 テキストデータから、価値ある情報を発掘すること
  7. 7. 何が嬉しいの? 数値データに比べて、量が多い。 世の中にあるすべての文章が分析対象になる。 新聞、雑誌、 web サイト、ブログ、ツイッターなど つまり、 web からデータをとれば、無限のように情報がある
  8. 8. 実際にやってみた 分析するテキストデータを手に入れる。 日経経済新聞の記事を対象にしました。 http://www.nikkei.com/ NY円、続伸 1ドル= 80 円 70 ~ 80 銭で終了  対ユーロは大幅高( 2011/5/14 6:39 ) http://www.nikkei.com/markets/kawase/summar y.aspx? g=DGXNASM7IAA05_14052011000000
  9. 9.  これくらいの文章なら読めるけど・・・ できる事なら、読みたくない 新聞の記事全部を読めますか? ツイッターのつぶやきを全部読めますか? ↓ たくさんのデータから、価値ある情報を発掘する。 テキストマイニング
  10. 10. 発掘結果 keyphrase score 1 ユーロ 100 2 低金利 97 3 円買い 96 4 値動き 88 5 リスク資産 85 ・・・・
  11. 11.  score が高いほど、重要そうな情報 3 番目に「円買い」とある。 円買いというのが重要らしい。 記事を読むことなく、それが分かった。
  12. 12.  YahooJapan のデベロッパーネットワークの登録が 必要です。 http://developer.yahoo.co.jp/sitemap/ アプリケーション ID の登録 無料です。
  13. 13. テキストマイニングの可能性の一つ 刻々と変化する為替や株式 秒単位で動くツイッター ツイッターのつぶやきを分析すれば、 株価や為替の変動が予測できるのでは? 変動の直前にそれが分かれば・・・・ 実現すれば、あなたは第一人者になれるはず
  14. 14. 終わりに テキストマイニングをしてみませんか?  R 言語で世の中を分析してみよう  情報を持つものが勝つ時代 ご清聴ありがとうございました。
  15. 15. 参考 Tokyor13 - YjdnJlp パッケージと Tokyo.R 翻訳プ ロジェクトの紹介 http://www.slideshare.net/yokkuns/tokyor13- yjdnjlptokyor

×