Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Atsushi Hayakawa
1,987 views
第1008回 ドキッ!分析屋だらけの、大ザーユー会 - ブログの類似記事を表示させてみる
Read more
0
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 13
2
/ 13
3
/ 13
4
/ 13
5
/ 13
6
/ 13
7
/ 13
8
/ 13
9
/ 13
10
/ 13
11
/ 13
12
/ 13
13
/ 13
More Related Content
PDF
Google's r style guideのすゝめ
by
Takashi Kitano
PDF
はじめてのパターン認識読書会 第四回 前半
by
Atsushi Hayakawa
PDF
Intoroduction of Bad Data Handbook
by
Atsushi Hayakawa
PDF
アクションマイニングを用いた最適なアクションの導出
by
Shintaro Fukushima
PDF
tidyverse.orgの翻訳
by
Atsushi Hayakawa
PDF
10分で分かるr言語入門ver2.4
by
Nobuaki Oshiro
PDF
Decision tree
by
Atsushi Hayakawa
PDF
StanTutorial
by
Teito Nakagawa
Google's r style guideのすゝめ
by
Takashi Kitano
はじめてのパターン認識読書会 第四回 前半
by
Atsushi Hayakawa
Intoroduction of Bad Data Handbook
by
Atsushi Hayakawa
アクションマイニングを用いた最適なアクションの導出
by
Shintaro Fukushima
tidyverse.orgの翻訳
by
Atsushi Hayakawa
10分で分かるr言語入門ver2.4
by
Nobuaki Oshiro
Decision tree
by
Atsushi Hayakawa
StanTutorial
by
Teito Nakagawa
More from Atsushi Hayakawa
PDF
統計的学習の基礎 4.4~
by
Atsushi Hayakawa
PDF
Zepp play soccerで測ってみた
by
Atsushi Hayakawa
PDF
simputatoinで欠損値補完 - Tokyo.R #65
by
Atsushi Hayakawa
PDF
dataclassとtypehintを使ってますか?
by
Atsushi Hayakawa
PDF
implyを用いたアクセスログの可視化
by
Atsushi Hayakawa
PPTX
バンクーバー旅行記
by
Atsushi Hayakawa
PPTX
Visual Studio CodeでRを使う
by
Atsushi Hayakawa
PPTX
Analyze The Community Of Tokyo.R
by
Atsushi Hayakawa
PDF
イケてる分析基盤をつくる
by
Atsushi Hayakawa
PDF
nginxのログを非スケーラブルに省メモリな方法で蓄積する
by
Atsushi Hayakawa
PDF
Splatoon界での壮絶な戦い&Japan.Rの宣伝
by
Atsushi Hayakawa
PDF
トライアスロンとgepuro task views V2.0 Japan.R 2018
by
Atsushi Hayakawa
PPTX
Japan.R 2016の運営
by
Atsushi Hayakawa
PDF
らずぱいラジコン
by
Atsushi Hayakawa
PDF
最近のクラウドストレージの事情と私情
by
Atsushi Hayakawa
PDF
useR!2017 in Brussels
by
Atsushi Hayakawa
PDF
gepuro task views
by
Atsushi Hayakawa
PDF
らずぱいカー
by
Atsushi Hayakawa
PPTX
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
by
Atsushi Hayakawa
PDF
トライアスロンと僕 - Japan.R 2017
by
Atsushi Hayakawa
統計的学習の基礎 4.4~
by
Atsushi Hayakawa
Zepp play soccerで測ってみた
by
Atsushi Hayakawa
simputatoinで欠損値補完 - Tokyo.R #65
by
Atsushi Hayakawa
dataclassとtypehintを使ってますか?
by
Atsushi Hayakawa
implyを用いたアクセスログの可視化
by
Atsushi Hayakawa
バンクーバー旅行記
by
Atsushi Hayakawa
Visual Studio CodeでRを使う
by
Atsushi Hayakawa
Analyze The Community Of Tokyo.R
by
Atsushi Hayakawa
イケてる分析基盤をつくる
by
Atsushi Hayakawa
nginxのログを非スケーラブルに省メモリな方法で蓄積する
by
Atsushi Hayakawa
Splatoon界での壮絶な戦い&Japan.Rの宣伝
by
Atsushi Hayakawa
トライアスロンとgepuro task views V2.0 Japan.R 2018
by
Atsushi Hayakawa
Japan.R 2016の運営
by
Atsushi Hayakawa
らずぱいラジコン
by
Atsushi Hayakawa
最近のクラウドストレージの事情と私情
by
Atsushi Hayakawa
useR!2017 in Brussels
by
Atsushi Hayakawa
gepuro task views
by
Atsushi Hayakawa
らずぱいカー
by
Atsushi Hayakawa
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
by
Atsushi Hayakawa
トライアスロンと僕 - Japan.R 2017
by
Atsushi Hayakawa
第1008回 ドキッ!分析屋だらけの、大ザーユー会 - ブログの類似記事を表示させてみる
1.
第1008回 ドキッ!分析屋 だらけの、大ザーユー会 ブログの類似記事を表示させてみる (LTのネタが無かったので、今日作った)
2.
自己紹介 ● 電気通信大学大学院修士一年 ● 早川 敦士(@gepuro) ●
専攻:信頼性工学、品質管理 ● 研究テーマ:オンライン状態監視システムを用 いた保全活動の改善 ● 興味:(データ|テキスト)マイニング、マーケティン グなど
3.
活動 執筆に関わったり iAnalysis合同会社で、仕事を手伝ったり、 gepulog(http://blog.gepuro.net)でブログを更新し たり。
4.
こんなブログです。
5.
勉強がてら、 Flask(Pythonのマイクロフレームワーク)で作成 さくらVPS 1Gプランでサービスを動かしてる。 ● きっかけは ○
ノリで独自ドメインを買った ○ wordpressのインストールでコケたので、自分で作った。 データベースは、sqlite3とmemcachedを使ってる。 レスポンスは問題ない。
6.
完成品は、
7.
似ているかもしれない記事を表示するが →あまり似てない 何故だ?
8.
中身は、 1. mecabで単語を切り出す 2. コサイン類似度 以上。 これだけでは、上手くいかないですね。 ●
名詞も形容詞も副詞など全部使ってる。 ● 辞書は追加していない ● ソースコードが書かれている記事に対して、特 殊な処理を行なってない。 ● タグを利用していない。 ● コサイン類似度以外は試していない
9.
実装方法 裏で、バッチを回してます。 サーバのメモリを節約するために、シェルスクリプト を多用してます。必要な時に、必要なだけリソース を消費する。
10.
実装方法
12.
結果は散々だけど、 関連記事を表示させることによって、内部リンクが 増えるので、サイトの滞在時間が伸びると嬉しい。 今後、調査したい。 ● 調査に十分なアクセスがない。 コンテンツを充実させるのが先なのでは?
13.
データだけじゃなくて、 データを分析してアレコレやるだけじゃなくて、 提供するコンテンツの量や質も大事だと気付かさ れました。 今後も、学んだり・感じた事をブログに残していこ う。
Download