Submit Search
Upload
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
•
4 likes
•
1,307 views
T
tokyorgirls
Follow
2014/07/12 Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」by @a_macbee
Read less
Read more
Report
Share
Report
Share
1 of 39
Download now
Download to read offline
Recommended
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
Tatsuya Tojima
データ解析入門〜グラフ分析処理・スクレイピング〜【found IT projectセミナー#6】 https://foundit-project.connpass.com/event/51809/
本気でPythonで宛名書きした話
本気でPythonで宛名書きした話
Satoshi Yamada
PythonでCSVから宛名書きを行った話です。Pillowを使っています。 http://startpython.connpass.com/event/25269/ のLTです。
言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo
Shuyo Nakatani
S01 t1 tsuji_pylearn_ut_01
S01 t1 tsuji_pylearn_ut_01
Takeshi Akutsu
Python Learning Workshop: Session 1, Talk 1, "Let's code with Python!"
Rの導入とRStudio事始め(改訂版)
Rの導入とRStudio事始め(改訂版)
Takashi Yamane
Hijiyama.R#3での発表資料です。
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Hisao Soyama
Pythonで業務改善をしたときにあった問題(ライト版)
Pythonで業務改善をしたときにあった問題(ライト版)
Satoshi Yamada
20170607のstart python clubでのLT資料です。
stapy#23 LT
stapy#23 LT
NaoY-2501
Lightning Talk at Start Python Club #23
Recommended
Python による 「スクレイピング & 自然言語処理」入門
Python による 「スクレイピング & 自然言語処理」入門
Tatsuya Tojima
データ解析入門〜グラフ分析処理・スクレイピング〜【found IT projectセミナー#6】 https://foundit-project.connpass.com/event/51809/
本気でPythonで宛名書きした話
本気でPythonで宛名書きした話
Satoshi Yamada
PythonでCSVから宛名書きを行った話です。Pillowを使っています。 http://startpython.connpass.com/event/25269/ のLTです。
言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo
Shuyo Nakatani
S01 t1 tsuji_pylearn_ut_01
S01 t1 tsuji_pylearn_ut_01
Takeshi Akutsu
Python Learning Workshop: Session 1, Talk 1, "Let's code with Python!"
Rの導入とRStudio事始め(改訂版)
Rの導入とRStudio事始め(改訂版)
Takashi Yamane
Hijiyama.R#3での発表資料です。
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Hisao Soyama
Pythonで業務改善をしたときにあった問題(ライト版)
Pythonで業務改善をしたときにあった問題(ライト版)
Satoshi Yamada
20170607のstart python clubでのLT資料です。
stapy#23 LT
stapy#23 LT
NaoY-2501
Lightning Talk at Start Python Club #23
Pythonでターミナルに画像表示
Pythonでターミナルに画像表示
Masato Fujitake
みんなのPython勉強会#17でのLT資料です。 エスケープシーケンス制御文字を使って画像をターミナルに出力するコードについて解説しています。 Githubは整理してからこちらに追加したいと思います。
OSS Study#19_LT
OSS Study#19_LT
NaoY-2501
LT at OSS X Users Meeting #19 Python
WindowsでPython
WindowsでPython
drillan
みんなのPython勉強会#22 2017/03/08 driller@patraqushe
S03 t1 python_learningdiary#3
S03 t1 python_learningdiary#3
Takeshi Akutsu
業務のためのPython勉強会#3:Talk 1 「私のPython学習奮闘記#3〜トラブルシューティング編〜」
S20 t1 stapyのこれまでとこれから
S20 t1 stapyのこれまでとこれから
Takeshi Akutsu
Talk 1:「Stapyのこれまでとこれから」 阿久津剛史(Start Python Club)
S10 t1 spc_by_nowfromnow
S10 t1 spc_by_nowfromnow
Takeshi Akutsu
Talk 1: 阿久津剛史(Start Python Club勉強会) 「Start Python Club〜これまでとこれから〜」
pythonでemlファイルを扱う話
pythonでemlファイルを扱う話
Satoshi Yamada
Pythonで.emlファイルを扱うためのemailパッケージの 使用例です。
コボラーがPython始めてみた話
コボラーがPython始めてみた話
Yuuki Nakajima
みんなのpython勉強会のネタ
DBエンジニアに必要だったPythonのスキル
DBエンジニアに必要だったPythonのスキル
Satoshi Yamada
DBエンジニアがシェルスクリプトでよくやることをpythonで置き換えようとした話ですhttp://startpython.connpass.com/event/28359/ のLTです。
Requestsで始める5分前帰社
Requestsで始める5分前帰社
Satoshi Yamada
PythonのHTTPライブラリ、Requestsをつかって社内イントラの作業を自動化し、楽をしようという話です。 http://startpython.connpass.com/event/28360/ のLTです。 のLTです。
RFinanceJはじめました
RFinanceJはじめました
Nagi Teramo
RFinanceJパッケージの紹介です
S09 t4 wrapup
S09 t4 wrapup
Takeshi Akutsu
Wrapup
オレオレ言語実装に役立つプル型ASTウォーカーAPI
オレオレ言語実装に役立つプル型ASTウォーカーAPI
隆行 神戸
第14回福岡市西区プログラム勉強会資料(2016/07/03) Lore言語実装の副産物として汎用ASTライブラリを作成したので紹介した。 (1) シンプルな単一種類ノードのASTに型チェック付きで様々な型のアトリビュートを格納するAST実装 (2) ASTを辿る過程をイベント・ストリームに変換してアクセスすることでイベント駆動でないプル型のアクセスを可能にするASTウォーカーの実装 (先行事例はちゃんと調べてないので「あるある」実装かも。)
ゲームマップのためのグラフAPIの設計
ゲームマップのためのグラフAPIの設計
隆行 神戸
2016年10月9日 第15回福岡市西区プログラム勉強会資料。 TRPGルール・シナリオ記述言語でマップを記録するためのグラフ・データ構造の設計の話題。
Python学習奮闘記#07 webapp
Python学習奮闘記#07 webapp
Takeshi Akutsu
「私のPython学習奮闘記#7 〜Webアプリケーション編〜」
S09 t0 orientation
S09 t0 orientation
Takeshi Akutsu
Orientation
S08 t0 orientation
S08 t0 orientation
Takeshi Akutsu
オリエンテーション
RubyエンジニアがPythonをdisるためにPythonを勉強してみた
RubyエンジニアがPythonをdisるためにPythonを勉強してみた
Yusuke Kon
Pyladies Tokyo 一周年記念 LT
S18 t0 introduction
S18 t0 introduction
Takeshi Akutsu
みんなのPython勉強会#18 Introduction
Orientation
Orientation
Takeshi Akutsu
みんなのPython勉強会 in 長野 #2 オリエンテーション:ビギナー
Debug Hacks - 第4回つくらぐ勉強会
Debug Hacks - 第4回つくらぐ勉強会
University of Tsukuba Linux User Group
筑波大学 Linux User Group (つくらぐ) http://www.tsukuba-linux.org/
211120 他人の書いたPythonスクリプトをステップ実行で理解する
211120 他人の書いたPythonスクリプトをステップ実行で理解する
Takuya Nishimoto
他人の書いたPythonスクリプトをステップ実行で理解する Visual Studio Code + Python デバッガ 2021-11-20 PyCon mini Shizuoka 2021 西本卓也 @24motz @nishimotz
More Related Content
What's hot
Pythonでターミナルに画像表示
Pythonでターミナルに画像表示
Masato Fujitake
みんなのPython勉強会#17でのLT資料です。 エスケープシーケンス制御文字を使って画像をターミナルに出力するコードについて解説しています。 Githubは整理してからこちらに追加したいと思います。
OSS Study#19_LT
OSS Study#19_LT
NaoY-2501
LT at OSS X Users Meeting #19 Python
WindowsでPython
WindowsでPython
drillan
みんなのPython勉強会#22 2017/03/08 driller@patraqushe
S03 t1 python_learningdiary#3
S03 t1 python_learningdiary#3
Takeshi Akutsu
業務のためのPython勉強会#3:Talk 1 「私のPython学習奮闘記#3〜トラブルシューティング編〜」
S20 t1 stapyのこれまでとこれから
S20 t1 stapyのこれまでとこれから
Takeshi Akutsu
Talk 1:「Stapyのこれまでとこれから」 阿久津剛史(Start Python Club)
S10 t1 spc_by_nowfromnow
S10 t1 spc_by_nowfromnow
Takeshi Akutsu
Talk 1: 阿久津剛史(Start Python Club勉強会) 「Start Python Club〜これまでとこれから〜」
pythonでemlファイルを扱う話
pythonでemlファイルを扱う話
Satoshi Yamada
Pythonで.emlファイルを扱うためのemailパッケージの 使用例です。
コボラーがPython始めてみた話
コボラーがPython始めてみた話
Yuuki Nakajima
みんなのpython勉強会のネタ
DBエンジニアに必要だったPythonのスキル
DBエンジニアに必要だったPythonのスキル
Satoshi Yamada
DBエンジニアがシェルスクリプトでよくやることをpythonで置き換えようとした話ですhttp://startpython.connpass.com/event/28359/ のLTです。
Requestsで始める5分前帰社
Requestsで始める5分前帰社
Satoshi Yamada
PythonのHTTPライブラリ、Requestsをつかって社内イントラの作業を自動化し、楽をしようという話です。 http://startpython.connpass.com/event/28360/ のLTです。 のLTです。
RFinanceJはじめました
RFinanceJはじめました
Nagi Teramo
RFinanceJパッケージの紹介です
S09 t4 wrapup
S09 t4 wrapup
Takeshi Akutsu
Wrapup
オレオレ言語実装に役立つプル型ASTウォーカーAPI
オレオレ言語実装に役立つプル型ASTウォーカーAPI
隆行 神戸
第14回福岡市西区プログラム勉強会資料(2016/07/03) Lore言語実装の副産物として汎用ASTライブラリを作成したので紹介した。 (1) シンプルな単一種類ノードのASTに型チェック付きで様々な型のアトリビュートを格納するAST実装 (2) ASTを辿る過程をイベント・ストリームに変換してアクセスすることでイベント駆動でないプル型のアクセスを可能にするASTウォーカーの実装 (先行事例はちゃんと調べてないので「あるある」実装かも。)
ゲームマップのためのグラフAPIの設計
ゲームマップのためのグラフAPIの設計
隆行 神戸
2016年10月9日 第15回福岡市西区プログラム勉強会資料。 TRPGルール・シナリオ記述言語でマップを記録するためのグラフ・データ構造の設計の話題。
Python学習奮闘記#07 webapp
Python学習奮闘記#07 webapp
Takeshi Akutsu
「私のPython学習奮闘記#7 〜Webアプリケーション編〜」
S09 t0 orientation
S09 t0 orientation
Takeshi Akutsu
Orientation
S08 t0 orientation
S08 t0 orientation
Takeshi Akutsu
オリエンテーション
RubyエンジニアがPythonをdisるためにPythonを勉強してみた
RubyエンジニアがPythonをdisるためにPythonを勉強してみた
Yusuke Kon
Pyladies Tokyo 一周年記念 LT
S18 t0 introduction
S18 t0 introduction
Takeshi Akutsu
みんなのPython勉強会#18 Introduction
Orientation
Orientation
Takeshi Akutsu
みんなのPython勉強会 in 長野 #2 オリエンテーション:ビギナー
What's hot
(20)
Pythonでターミナルに画像表示
Pythonでターミナルに画像表示
OSS Study#19_LT
OSS Study#19_LT
WindowsでPython
WindowsでPython
S03 t1 python_learningdiary#3
S03 t1 python_learningdiary#3
S20 t1 stapyのこれまでとこれから
S20 t1 stapyのこれまでとこれから
S10 t1 spc_by_nowfromnow
S10 t1 spc_by_nowfromnow
pythonでemlファイルを扱う話
pythonでemlファイルを扱う話
コボラーがPython始めてみた話
コボラーがPython始めてみた話
DBエンジニアに必要だったPythonのスキル
DBエンジニアに必要だったPythonのスキル
Requestsで始める5分前帰社
Requestsで始める5分前帰社
RFinanceJはじめました
RFinanceJはじめました
S09 t4 wrapup
S09 t4 wrapup
オレオレ言語実装に役立つプル型ASTウォーカーAPI
オレオレ言語実装に役立つプル型ASTウォーカーAPI
ゲームマップのためのグラフAPIの設計
ゲームマップのためのグラフAPIの設計
Python学習奮闘記#07 webapp
Python学習奮闘記#07 webapp
S09 t0 orientation
S09 t0 orientation
S08 t0 orientation
S08 t0 orientation
RubyエンジニアがPythonをdisるためにPythonを勉強してみた
RubyエンジニアがPythonをdisるためにPythonを勉強してみた
S18 t0 introduction
S18 t0 introduction
Orientation
Orientation
Similar to Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
Debug Hacks - 第4回つくらぐ勉強会
Debug Hacks - 第4回つくらぐ勉強会
University of Tsukuba Linux User Group
筑波大学 Linux User Group (つくらぐ) http://www.tsukuba-linux.org/
211120 他人の書いたPythonスクリプトをステップ実行で理解する
211120 他人の書いたPythonスクリプトをステップ実行で理解する
Takuya Nishimoto
他人の書いたPythonスクリプトをステップ実行で理解する Visual Studio Code + Python デバッガ 2021-11-20 PyCon mini Shizuoka 2021 西本卓也 @24motz @nishimotz
システム開発素人が深層学習を用いた画像認識で麻雀点数計算するLINEbotを作ったハナシ
システム開発素人が深層学習を用いた画像認識で麻雀点数計算するLINEbotを作ったハナシ
BrainPad Inc.
Python JP 2018用資料 システム開発素人が深層学習を用いた画像認識で麻雀点数計算するLINEbotを作ったハナシ
PyConJP2018_LT_mahjong_180918
PyConJP2018_LT_mahjong_180918
Rio Kurihara
PyConJP2018 LTでの発表資料(20180918)
プログラミング初心者の壁の越え方
プログラミング初心者の壁の越え方
Yuichi Kato
Shibuya Swift #2 (2015年 12月15日) でLTした資料
Why python
Why python
Mikio Kubo
MTプラグイン入門以前
MTプラグイン入門以前
Hiroshi Yamato
2014/9/26にMT東京さんでお話したプレゼンです。
Clojureの世界と実際のWeb開発
Clojureの世界と実際のWeb開発
Tsutomu Yano
Clojureの特徴と、実際のウェブ開発時に使ってる機能や手法などなど。
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
Akira Shibata
この資料は、東京工業大学横田研究室の藤井一喜さんがW&Bマンスリーミートアップのために準備してくれた資料です。 「大規模言語モデル開発を支える分散学習技術」 大規模言語モデル(LLM)を学習する過程において、分散学習は避けて通れない重要な技術の一つです。本講演では、分散学習の基本的な概念とそのメカニズムをわかりやすく解説します。さらに、実例やノウハウについてもご紹介します。
Rでを作る
Rでを作る
Nagi Teramo
tokyor 61
goパッケージで型情報を用いたソースコード検索を実現する
goパッケージで型情報を用いたソースコード検索を実現する
Takuya Ueda
Shinjuku.go#1で発表した資料です。 https://shinjukugo.connpass.com/event/52929/
Python for Beginners ( #PyLadiesKyoto Meetup )
Python for Beginners ( #PyLadiesKyoto Meetup )
Ai Makabi
PyLadies Kyoto Meetup #1 用の発表資料
グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入
Hisao Soyama
TRPGオンラインセッション環境とルール&シナリオ記述言語
TRPGオンラインセッション環境とルール&シナリオ記述言語
隆行 神戸
2014/12/21(第10.5回福岡市西区プログラム勉強会資料)
TOPPERS as an IoT OS(kernel)
TOPPERS as an IoT OS(kernel)
Kiyoshi Ogawa
TOPPERS provide Real Time Operating kernel such as ASP(standard), ATK(for Automotive), HRP(for Space), FMP(multi core), SSP(smallest set profile) kernel and other tools. Real Time kernel for Raspberry Pi are released, as FMP and SSP.
【Ltech#11】ディープラーニングで間取り図を3Dにする
【Ltech#11】ディープラーニングで間取り図を3Dにする
LIFULL Co., Ltd.
2020/10/29 Ltech#11 不動産領域のAI活用最前線 〜初完全リモート開催〜 AI戦略室データサイエンスグループ 椎橋 怜史
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
Toshinori Sato
PyData Tokyo 05 でのLTのプレゼン資料です。 絵文字に対応した mecab-ipadic-NEologd は以下からダウンロードできます。 https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md 以下は資料のまとめです。 - mecab-ipadic-NEologdで絵文字に読みを付与するためのエントリを”試験的”に追加したという話 -mecab-ipadicと併用すれることで、絵文字の読み・原型の文字列で検索が可能になりました - 応用 => 言語処理・音声処理・コンテンツ監視等が考えられます - 今後アノテーションは徐々に改善していきます
PyPy 紹介
PyPy 紹介
shoma h
社内勉強会で PyPy の紹介をしたスライド
Rubyの会社でPythonistaが三ヶ月生き延びた話
Rubyの会社でPythonistaが三ヶ月生き延びた話
Drecom Co., Ltd.
@tokorotenによるRails勉強会でPythonの話をするテロ。データマイニングについてのゆるいお話。 以下のプレゼンと同様の内容になります。 http://www.slideshare.net/TokorotenNakayama/rubypythonista3
Rubyの会社でPythonistaが3ヶ月生き延びた話
Rubyの会社でPythonistaが3ヶ月生き延びた話
Tokoroten Nakayama
Rails勉強会でRailsにまったく関係ない話をするテロ。
Similar to Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
(20)
Debug Hacks - 第4回つくらぐ勉強会
Debug Hacks - 第4回つくらぐ勉強会
211120 他人の書いたPythonスクリプトをステップ実行で理解する
211120 他人の書いたPythonスクリプトをステップ実行で理解する
システム開発素人が深層学習を用いた画像認識で麻雀点数計算するLINEbotを作ったハナシ
システム開発素人が深層学習を用いた画像認識で麻雀点数計算するLINEbotを作ったハナシ
PyConJP2018_LT_mahjong_180918
PyConJP2018_LT_mahjong_180918
プログラミング初心者の壁の越え方
プログラミング初心者の壁の越え方
Why python
Why python
MTプラグイン入門以前
MTプラグイン入門以前
Clojureの世界と実際のWeb開発
Clojureの世界と実際のWeb開発
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
大規模言語モデル開発を支える分散学習技術 - 東京工業大学横田理央研究室の藤井一喜さん
Rでを作る
Rでを作る
goパッケージで型情報を用いたソースコード検索を実現する
goパッケージで型情報を用いたソースコード検索を実現する
Python for Beginners ( #PyLadiesKyoto Meetup )
Python for Beginners ( #PyLadiesKyoto Meetup )
グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入
TRPGオンラインセッション環境とルール&シナリオ記述言語
TRPGオンラインセッション環境とルール&シナリオ記述言語
TOPPERS as an IoT OS(kernel)
TOPPERS as an IoT OS(kernel)
【Ltech#11】ディープラーニングで間取り図を3Dにする
【Ltech#11】ディープラーニングで間取り図を3Dにする
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
🍻(Beer Mug)の読み方を考える(mecab-ipadic-NEologdのUnicode 絵文字対応)
PyPy 紹介
PyPy 紹介
Rubyの会社でPythonistaが三ヶ月生き延びた話
Rubyの会社でPythonistaが三ヶ月生き延びた話
Rubyの会社でPythonistaが3ヶ月生き延びた話
Rubyの会社でPythonistaが3ヶ月生き延びた話
Tokyo.R女子部発表スライド「Rではじめるデータ解析の超基礎」
1.
で始める データ解析の超基礎 Tokyo.R 女子部
#4 @a_macbee
2.
@a_macbee is 誰
3.
@a_macbee ! 渋谷で働く新米データサイ エンティスト ・広告ログ解析の仕事 ・普段仕事で利用してる 言語はPython ・Tokyo.R 女子部 #3 初参加 ! ・
初心者
4.
の便利機能 の紹介 等はしません (出来ません(汗) の標準機能 +ggplot2 のみを 利用します ※詰まったらどなたか助けて下さい
5.
本日目指すこと Rを使って データの雰囲気を つかむ術を学ぶ
6.
本日の資料 https://github.com/amacbee/tokyorgirls Download → 解凍 20140712/
以下に あります
7.
ヒストグラム について学びます
8.
データの全体像 がつかめる! ←日本の人口分布 ↓テストの点数分布
9.
何はともあれやってみる ! ! # ggplot2の読み込み library(ggplot2) ! ! ! ! ! ! ヒストグラムを 描画するために 必要です!
10.
何はともあれやってみる ! # データの読み込み data.path =
/path/to/file/ramen_prices.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # データの中身の確認 head(data.frame) ! # ラーメンの値段の平均 mean(data.frame$Price)
11.
何はともあれやってみる ! # データの読み込み data.path =
/path/to/file/ramen_prices.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # データの中身の確認 head(data.frame) ! # ラーメンの値段の平均 mean(data.frame$Price) データを読み込んで data.frameに入れる
12.
何はともあれやってみる ! # データの読み込み data.path =
/path/to/file/ramen_prices.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # データの中身の確認 head(data.frame) ! # ラーメンの値段の平均 mean(data.frame$Price) head()で囲むと データの上から 6行くらいを表示
13.
何はともあれやってみる ! # データの読み込み data.path =
/path/to/file/ramen_prices.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # データの中身の確認 head(data.frame) ! # ラーメンの値段の平均 mean(data.frame$Price) mean()で囲むと データの 平均値を表示
14.
何はともあれやってみる ! # ラーメンの値段のヒストグラム ggplot(data.frame, aes(x=data.frame$Price))
+ geom_histogram(binwidth=100) ! ! ! ! ! !
15.
こんなのが 出るはず
16.
750 650 850 950 550 ラーメンの 平均的な値段は 750円くらい
17.
何はともあれやってみる ! # ラーメンの値段のヒストグラム ggplot(data.frame, aes(x=data.frame$Price))
+ geom_histogram(binwidth=100) ! ! ! ! ! ! 範囲の指定 この場合,100円の範囲で 値をまとめてくれる x軸の指定
18.
ヒストグラムの 良いところ
19.
2つのヒストグラムの比較 ! # データの読み込み data.path =
/path/to/file/test_scores_1.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # 1組のテストの平均点 mean(data.frame$Score) ! # 1組のテストの点数のヒストグラム ggplot(data.frame, aes(x=data.frame$Score)) + geom_histogram(binwidth=5)
20.
2つのヒストグラムの比較 ! # データの読み込み data.path =
/path/to/file/test_scores_2.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # 2組のテストの平均点 mean(data.frame$Score) ! # 2組のテストの点数のヒストグラム ggplot(data.frame, aes(x=data.frame$Score)) + geom_histogram(binwidth=5)
21.
平均点は? どちらも同じくらい A組: 約51点 B組: 約50点
22.
ヒストグラムは?
23.
A 組
24.
B 組
25.
平均点は同じでも ヒストグラムはかなり違う ↓ データの性質が全然違う
26.
大事なこと ヒストグラムを書くことで データの全体像がつかめる
27.
binwidth に注意
28.
元のデータは こちらからお借りしています ! https://github.com/johnmyleswhite/ ML_for_Hackers
29.
! # データの読み込み data.path =
/path/to/file/body_data.txt data.frame <- read.table(data.path, header=TRUE, sep= ,') ! # 平均身長 mean(data.frame$Height) ! # 身長のヒストグラム(binwidth=5, 0.001, 1) ggplot(data.frame, aes(x=data.frame$Height)) + geom_histogram(binwidth=5) ggplot(data.frame, aes(x=data.frame$Height)) + geom_histogram(binwidth=0.001) ggplot(data.frame, aes(x=data.frame$Height)) + geom_histogram(binwidth=1)
30.
binの幅が 広すぎる =過剰な平滑化 binwidth=5
31.
binの幅が 小さすぎる =平滑化の不足 binwidth=0.001
32.
binwidth=1
33.
滑らか binwidth=1
34.
大事なこと binwidthの値を変えて ヒストグラムを確認すること
35.
おまけ1(Rの高度な機能) もとの形状に 近い形で 描画できる
36.
おまけ2(Rの高度な機能) 男女で 分けてみたり
37.
! 参考図書.1 マンガでわかる 統計学 / 高橋
信 ! http://goo.gl/mzuQ ! ※オススメ!
38.
! 参考図書.2 入門 機械学習 / D.,
Conway ! http://goo.gl/0zNev ! ※かなり難しい!
39.
Thank you!
Download now