Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
AyakaHonda1
124 views
Generating word clouds in python
食べログレビューの形態素解析とWordcloudによる可視化
Data & Analytics
◦
Read more
0
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 13
2
/ 13
3
/ 13
4
/ 13
5
/ 13
6
/ 13
7
/ 13
8
/ 13
9
/ 13
10
/ 13
11
/ 13
12
/ 13
13
/ 13
More Related Content
PDF
サポーターズ勉強会スライド 2018/2/27
by
Kensuke Mitsuzawa
PDF
形態素解析器 MeCab の新語・固有表現辞書 mecab-ipadic-NEologd のご紹介
by
Toshinori Sato
PDF
mecab-ipadic-NEologd の効果的な使い方
by
Toshinori Sato
PPTX
fastTextの実装を見てみた
by
Yoshihiko Shiraki
PDF
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by ホットリンク 公開用
by
Takeshi Sakaki
PDF
A Report on process Assessment for open source projects
by
Kiyoshi Ogawa
PDF
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
by
Toshinori Sato
PPTX
形態素解析器の比較できるPythonパッケージつくった話
by
Kensuke Mitsuzawa
サポーターズ勉強会スライド 2018/2/27
by
Kensuke Mitsuzawa
形態素解析器 MeCab の新語・固有表現辞書 mecab-ipadic-NEologd のご紹介
by
Toshinori Sato
mecab-ipadic-NEologd の効果的な使い方
by
Toshinori Sato
fastTextの実装を見てみた
by
Yoshihiko Shiraki
2016.03.11 「論文に書(け|か)ない自然言語処理」 ソーシャルメディア分析サービスにおけるNLPに関する諸問題について by ホットリンク 公開用
by
Takeshi Sakaki
A Report on process Assessment for open source projects
by
Kiyoshi Ogawa
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
by
Toshinori Sato
形態素解析器の比較できるPythonパッケージつくった話
by
Kensuke Mitsuzawa
Featured
PDF
2024 Trend Updates: What Really Works In SEO & Content Marketing
by
Search Engine Journal
PDF
Everything You Need To Know About ChatGPT
by
Expeed Software
PDF
Storytelling For The Web: Integrate Storytelling in your Design Process
by
Chiara Aliotta
PDF
Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...
by
OECD Directorate for Financial and Enterprise Affairs
PDF
Getting into the tech field. what next
by
Tessa Mero
PDF
ChatGPT and the Future of Work - Clark Boyd
by
Clark Boyd
PDF
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
by
SocialHRCamp
PDF
Google's Just Not That Into You: Understanding Core Updates & Search Intent
by
Lily Ray
PDF
2024 State of Marketing Report – by Hubspot
by
Marius Sescu
PDF
Social Media Marketing Trends 2024 // The Global Indie Insights
by
Kurio // The Social Media Age(ncy)
PDF
Trends In Paid Search: Navigating The Digital Landscape In 2024
by
Search Engine Journal
PDF
How to have difficult conversations
by
Rajiv Jayarajah, MAppComm, ACC
PDF
Skeleton Culture Code
by
Skeleton Technologies
PDF
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
by
marketingartwork
PDF
Product Design Trends in 2024 | Teenage Engineerings
by
Pixeldarts
PDF
How Race, Age and Gender Shape Attitudes Towards Mental Health
by
ThinkNow
PPTX
How to Prepare For a Successful Job Search for 2024
by
Albert Qian
PDF
PEPSICO Presentation to CAGNY Conference Feb 2024
by
Neil Kimberley
PDF
5 Public speaking tips from TED - Visualized summary
by
SpeakerHub
PDF
Content Methodology: A Best Practices Report (Webinar)
by
contently
2024 Trend Updates: What Really Works In SEO & Content Marketing
by
Search Engine Journal
Everything You Need To Know About ChatGPT
by
Expeed Software
Storytelling For The Web: Integrate Storytelling in your Design Process
by
Chiara Aliotta
Artificial Intelligence, Data and Competition – SCHREPEL – June 2024 OECD dis...
by
OECD Directorate for Financial and Enterprise Affairs
Getting into the tech field. what next
by
Tessa Mero
ChatGPT and the Future of Work - Clark Boyd
by
Clark Boyd
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
by
SocialHRCamp
Google's Just Not That Into You: Understanding Core Updates & Search Intent
by
Lily Ray
2024 State of Marketing Report – by Hubspot
by
Marius Sescu
Social Media Marketing Trends 2024 // The Global Indie Insights
by
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
by
Search Engine Journal
How to have difficult conversations
by
Rajiv Jayarajah, MAppComm, ACC
Skeleton Culture Code
by
Skeleton Technologies
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
by
marketingartwork
Product Design Trends in 2024 | Teenage Engineerings
by
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
by
ThinkNow
How to Prepare For a Successful Job Search for 2024
by
Albert Qian
PEPSICO Presentation to CAGNY Conference Feb 2024
by
Neil Kimberley
5 Public speaking tips from TED - Visualized summary
by
SpeakerHub
Content Methodology: A Best Practices Report (Webinar)
by
contently
Generating word clouds in python
1.
Generating WordCloud in
Python 食べログレビュー形態素解析と WordCloudによる可視化 2020.03.02 Ayaka Honda
2.
Agenda ● はじめに ● データ分析の目的 ●
分析工程解説 ● 考察と今後の展開 ● 質疑応答
3.
はじめに ● 形態素解析とは? 「自然言語」を形態素(意味を持つ表現要素の最小単位) にまで分割する技術のこと 例) 『私はコーヒーを飲みます』 私/は/コーヒー/を/飲み/ます 代名詞 副助詞 名詞
助詞 動詞 助動詞 今回使用したjanomeは標準ライブラリではないので予めイントールしておく !pip install janome 参考: Welcome to janome's documentation! https://mocobeta.github.io/janome/
4.
はじめに ● WordCloudとは? 単語の出現頻度を可視化出来るアプリケーション。 Pythonではmatplotlibを使用して可視化出来るので 以下のライブラリをインポートしておく from wordcloud
import WordCloud import matplotlib.pyplot as plt 参考: WordCloud for Python documentation http://amueller.github.io/word_cloud/index.html
5.
データ分析の目的 ・What コーヒー専門店の口コミ頻出単語の可視化 ・Why 自店の口コミチェックの効率化 ・How 1.食べログサイト内の口コミをスクレイピング 2.口コミの形態素解析と単語帳の作成 3.WordCloudで可視化
6.
分析工程解説 1. 食べログサイトから口コミを取得 <取得条件> ・東京都内 ・業種ジャンルの1番目が「コーヒー専門店」 ・評価点数 3.0以上 ・口コミ取得件数は各店1ページ分(最大20件) ソースコードはGitHubで公開中 参考:食べログ/COFFEE
VALLEY (池袋) https://tabelog.com/tokyo/A1305/A130501/13175074/ 【Python】ラーメンガチ勢によるガチ勢のための食べログスクレイピング https://qiita.com/toshiyuki_tsutsui/items/f143946944a428ed105b
7.
分析工程解説 <取得結果>
8.
分析工程解説 2. 口コミの正規化と形態素解析、単語帳の作成 <正規化条件> ・UnicodeをNFKC(デフォルト)で正規化 ・( )を削除 ・英字は小文字にする <単語帳格納条件> ・名詞が連続する場合は複合名詞にする ・名詞・形容詞・副詞のみを取得する ・一文字しか無いひらがなとカタカナと英数字は削除 参考:
【Python】自然言語処理でラーメン屋を分類してみる https://qiita.com/naotaka1128/items/87d717961bd0c34e7a64
9.
分析工程解説 <結果> ソースコードはGitHubで公開中
10.
分析工程解説 3. 作成した単語リストを出現頻度に応じて可視化
11.
分析工程解説
12.
考察と今後の展開 1.個人店の口コミはほぼ予想通りの内容 ・Why? →1ページ目に表示される口コミ常連者は前情報を念入りに調べている為、頻出単 語が同じものに偏りやすい 〈TRY〉 ・1ページ分だけでなく、全ての口コミを取得する ・口コミ常連者を除外する ・地名や店名などすでに分かっている情報は除外する ・単語をポジティブ、ネガティブで分ける 2. チェーン店は立地によって口コミが変わる →
店舗ごとのプロモーションやメニュー変更のアイデアに活用
13.
Thank you ! 今後の勉強過程はこちらでチェック
:) http://stillakeenbean.com/sliceofthepy/
Download