Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
HK
Uploaded by
Hiroyuki Kuromiya
14,131 views
べき乗則・パレート分布・ジップの法則
数式手書きですみません。
Data & Analytics
◦
Read more
15
Save
Share
Embed
Embed presentation
Download
Downloaded 68 times
1
/ 59
2
/ 59
3
/ 59
4
/ 59
5
/ 59
6
/ 59
7
/ 59
8
/ 59
9
/ 59
10
/ 59
11
/ 59
12
/ 59
13
/ 59
14
/ 59
15
/ 59
16
/ 59
17
/ 59
Most read
18
/ 59
19
/ 59
20
/ 59
21
/ 59
22
/ 59
Most read
23
/ 59
24
/ 59
25
/ 59
26
/ 59
27
/ 59
28
/ 59
29
/ 59
30
/ 59
31
/ 59
32
/ 59
33
/ 59
34
/ 59
35
/ 59
36
/ 59
37
/ 59
38
/ 59
39
/ 59
40
/ 59
41
/ 59
42
/ 59
43
/ 59
44
/ 59
45
/ 59
46
/ 59
47
/ 59
48
/ 59
49
/ 59
50
/ 59
51
/ 59
Most read
52
/ 59
53
/ 59
54
/ 59
55
/ 59
56
/ 59
57
/ 59
58
/ 59
59
/ 59
More Related Content
PDF
Optimizer入門&最新動向
by
Motokawa Tetsuya
PDF
方策勾配型強化学習の基礎と応用
by
Ryo Iwaki
PDF
GAN(と強化学習との関係)
by
Masahiro Suzuki
PDF
強化学習その3
by
nishio
PDF
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
by
NTT DATA Technology & Innovation
PDF
[DL輪読会]Deep Learning 第15章 表現学習
by
Deep Learning JP
PDF
[DL輪読会]ICLR2020の分布外検知速報
by
Deep Learning JP
PPTX
劣モジュラ最適化と機械学習1章
by
Hakky St
Optimizer入門&最新動向
by
Motokawa Tetsuya
方策勾配型強化学習の基礎と応用
by
Ryo Iwaki
GAN(と強化学習との関係)
by
Masahiro Suzuki
強化学習その3
by
nishio
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
by
NTT DATA Technology & Innovation
[DL輪読会]Deep Learning 第15章 表現学習
by
Deep Learning JP
[DL輪読会]ICLR2020の分布外検知速報
by
Deep Learning JP
劣モジュラ最適化と機械学習1章
by
Hakky St
What's hot
PDF
AHC-Lab M1勉強会 論文の読み方・書き方
by
Shinagawa Seitaro
PDF
Cosine Based Softmax による Metric Learning が上手くいく理由
by
tancoro
PDF
Teslaにおけるコンピュータビジョン技術の調査
by
Kazuyuki Miyazawa
PPTX
ベイズ統計学の概論的紹介
by
Naoki Hayashi
PDF
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning
by
Preferred Networks
PPTX
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
by
Deep Learning JP
PDF
12. Diffusion Model の数学的基礎.pdf
by
幸太朗 岩澤
PPTX
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
by
Deep Learning JP
PDF
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
by
mlm_kansai
PPTX
強化学習 DQNからPPOまで
by
harmonylab
PPTX
[DL輪読会]相互情報量最大化による表現学習
by
Deep Learning JP
PDF
Deeplearning輪読会
by
正志 坪坂
PPTX
論文紹介 wav2vec: Unsupervised Pre-training for Speech Recognition
by
YosukeKashiwagi1
PPTX
【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH
by
Deep Learning JP
PPTX
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
by
Deep Learning JP
PDF
2018年01月27日 TensorBoardによる学習の可視化
by
aitc_jp
PDF
バンディットアルゴリズム入門と実践
by
智之 村上
PPTX
強化学習 と ゲーム理論 (MARL)
by
HarukaKiyohara
PDF
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
by
Takuma Yagi
PDF
全力解説!Transformer
by
Arithmer Inc.
AHC-Lab M1勉強会 論文の読み方・書き方
by
Shinagawa Seitaro
Cosine Based Softmax による Metric Learning が上手くいく理由
by
tancoro
Teslaにおけるコンピュータビジョン技術の調査
by
Kazuyuki Miyazawa
ベイズ統計学の概論的紹介
by
Naoki Hayashi
ゼロから始める深層強化学習(NLP2018講演資料)/ Introduction of Deep Reinforcement Learning
by
Preferred Networks
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
by
Deep Learning JP
12. Diffusion Model の数学的基礎.pdf
by
幸太朗 岩澤
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
by
Deep Learning JP
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
by
mlm_kansai
強化学習 DQNからPPOまで
by
harmonylab
[DL輪読会]相互情報量最大化による表現学習
by
Deep Learning JP
Deeplearning輪読会
by
正志 坪坂
論文紹介 wav2vec: Unsupervised Pre-training for Speech Recognition
by
YosukeKashiwagi1
【DL輪読会】AUTOGT: AUTOMATED GRAPH TRANSFORMER ARCHITECTURE SEARCH
by
Deep Learning JP
【DL輪読会】High-Resolution Image Synthesis with Latent Diffusion Models
by
Deep Learning JP
2018年01月27日 TensorBoardによる学習の可視化
by
aitc_jp
バンディットアルゴリズム入門と実践
by
智之 村上
強化学習 と ゲーム理論 (MARL)
by
HarukaKiyohara
オープンワールド認識 (第34回全脳アーキテクチャ若手の会 勉強会)
by
Takuma Yagi
全力解説!Transformer
by
Arithmer Inc.
Viewers also liked
PDF
固有顔による生体認証
by
Hiroyuki Kuromiya
PPTX
顔画像からの個人顔識別
by
epcnt19
PPTX
バイオインフォマティクスで実験ノートを取ろう
by
Masahiro Kasahara
PPTX
KantoCV/Selective Search for Object Recognition
by
belltailjp
PDF
20160417dlibによる顔器官検出
by
Takuya Minagawa
PPTX
ようやく分かった!最尤推定とベイズ推定
by
Akira Masuda
固有顔による生体認証
by
Hiroyuki Kuromiya
顔画像からの個人顔識別
by
epcnt19
バイオインフォマティクスで実験ノートを取ろう
by
Masahiro Kasahara
KantoCV/Selective Search for Object Recognition
by
belltailjp
20160417dlibによる顔器官検出
by
Takuya Minagawa
ようやく分かった!最尤推定とベイズ推定
by
Akira Masuda
Similar to べき乗則・パレート分布・ジップの法則
PDF
Pattern Recognition and Machine Learning study session - パターン認識と機械学習 勉強会資料
by
Taro Masuda
PDF
Prml2.1 2.2,2.4-2.5
by
Takuto Kimura
PDF
PRML2.1 2.2
by
Takuto Kimura
PPTX
データサイエンス概論第一=4-2 確率と確率分布
by
Seiichi Uchida
PPTX
Exponential distribution (指数分布)
by
Taro Tezuka
PDF
Zipf? (ジップ則のひみつ?) #DSIRNLP
by
Shuyo Nakatani
PDF
Zansa0130presentation
by
Zansa
PDF
PRML輪読#10
by
matsuolab
PDF
わかりやすいパターン認識 4章
by
Motokawa Tetsuya
Pattern Recognition and Machine Learning study session - パターン認識と機械学習 勉強会資料
by
Taro Masuda
Prml2.1 2.2,2.4-2.5
by
Takuto Kimura
PRML2.1 2.2
by
Takuto Kimura
データサイエンス概論第一=4-2 確率と確率分布
by
Seiichi Uchida
Exponential distribution (指数分布)
by
Taro Tezuka
Zipf? (ジップ則のひみつ?) #DSIRNLP
by
Shuyo Nakatani
Zansa0130presentation
by
Zansa
PRML輪読#10
by
matsuolab
わかりやすいパターン認識 4章
by
Motokawa Tetsuya
べき乗則・パレート分布・ジップの法則
1.
べき乗則・パレート分布・ジップの法則 東京大学大学院教育学研究科修士1年 黒宮寛之
2.
今日の論文 Newman, MEJ, Power
laws, Pareto distributions and Zipf’s law. Contemporary Physics (2005). 特に新しい知見があるわけではないが、べき乗則についてよくまとめられたレビュー論 文
3.
論文に入る前に
4.
べき乗則とは 使われる分野によって3つ言い方が変わりますが、どれもなにかデータを集めてきたら、 その分布が下のような数式で表される分布になるということを意味します べき乗則 パレート分布 ジップの法則 x:変数 C:定数 α:指数
5.
まぎらわしいので注意 指数分布と形がよく似ているので注意が必要:減少の仕方がべき乗分布の方が緩い 指数分布 べき乗分布
6.
今日の目標 ● べき乗分布の基礎的な性質と扱い方について ● べき乗分布が生まれる背景にはどのようなメカニズムがあるか を知りたい。それを ●
式変形の過程を逐次追っかけながら 話すので、誤解や間違いがあれば指摘していただけたらと思っています。
7.
ここから本編
8.
正規分布だけじゃない 身の回りの多くの現象は正規分 布する ex. 身長、車のスピード、・・・
9.
正規分布だけじゃない 街の規模、論文の引用数、ウェブの訪問数、ほんの売上、電話がかかってくる回数、地震 の規模・・・これらはすべてべき乗分布になる
10.
両対数プロットについて 両対数プロットで直線になればべき乗分布を意味します
11.
べき乗分布になるもの一覧
12.
べき乗分布になるもの一覧
13.
実際のデータからべき乗分布を見つける方法 さきほど述べたように、対数目盛りでプロットしてみて直線になれば良い しかし対数目盛りの性質から、対数グラフの尻尾の方がギザギザになることがある ←xのスケールが右にいくほど広くなっていくのでサンプルが集中する yのスケールが下に行くほど広がっていくので微小な差異が強調される
14.
解決法1 - logarithmic
binning 通常のヒストグラム ビンの間隔は一定 1.0~1.1の間に4人 1.1~1.2の間に5人 1.2~1.3の間に3人 ・・・ logarithmic binning ビンの間隔を大きくしていく 1.0~1.1の間に4人 1.1~1.3の間に8人 1.3~1.7の間に9人 ・・・ 適用後
15.
logarithmic binning の問題点 α>1のとき kが増えるにつれてビンの中 のサンプル数が少なくなって いく →グラフの右の方ほどノイズ の影響を受けやすい
16.
解決法2 累積分布 (こっちのほうがベター) 累積分布とは(ウェブサイトより)・・・確率変数Xがある値以下になる確率 https://bellcurve.jp/statistics/course/6708.html ヒストグラムを累積分布に書き直すことで、大きな xの値に対してもサンプル数を確保できる
17.
べき乗分布の累積もまたべき乗分布になる 指数の値は変わるが、べき乗 分布の累積分布もまたべき乗 分布になる →累積分布が両対数プロット で直線になれば元の分布もべ き乗則に従う べき乗則を確かめるには、累積分布を両対数 プロットして、直線になるか確かめるのが定石
18.
rank-frequency plotについて rank-frequency plotは累積分布と等価である? 累積分布におけるある点のy座標はx以上ものの頻 度の累計を表すが、xを頻度順に並び替えてしまえ ばxはx番目に頻度が高いことが保証されるので、 累積分布のある比をとったものにすぎない。
19.
べき指数の推定 両対数プロットに対して最小二乗法で 直線をひけば直線の傾きからべき指 数をある程度推定できるが・・・ このような方法はあまりよくないらしい (おそらく両対数グラフの目盛りの歪 みのため)
20.
最尤推定によるべき指数の推定 尤度(likelihood)を最大化する 尤度って何 ベイズの公式で図のlikelihoodの位置にあるもの http://www.saedsayad.com/naive_bayesian.htm
21.
最尤推定に入る前に 定数Cの扱い
22.
べき指数の最尤推定
23.
べき指数の最尤推定 さきほど出した規格化定数Cを代入して
24.
べき指数の最尤推定
25.
最尤推定によるべき指数の推定 無事べき指数αが求まっ た!!
26.
推定の確信度を知りたい ベイズなら簡単
27.
推定の確信度を知りたい
28.
推定の確信度を知りたい ベイズ更新 P(x), P(α)は定数なので P(α|x
) = P( x|α) P(α) = P(x | α)
29.
推定の確信度を知りたい 値×確率 積分区間が-∞→∞でないので、サンプル数で割る
30.
推定の確信度を知りたい
31.
推定の確信度を知りたい (右図)規格化定数に α-1の指数が入っているので、 α=1の 本ケースではあまり意味をなさなかった。 たぶん工夫すればなんとかなる模様
32.
べき乗則を生み出すメカニズム
33.
べき乗則を生み出すメカニズム ● 指数関数の組み合わせ ● 逆数 ●
ランダムウォーク ● ユール過程 ● 相転移と臨界現象 ● 自己組織化臨界
34.
指数関数の組み合わせ 確率分布保存の法則
35.
指数関数の組み合わせ ランダムタイプライター ランダムに文字を打ち込んでスペースが入るまでを1単語と数え る スペースを打つ確率をqsとすると、アルファベットは全部で26文字 あるので特定の1文字を打つ確率は ql = (1-qs)/27
36.
指数関数の組み合わせ 特定の単語(長さy)の頻度xは
37.
指数関数の組み合わせ
38.
逆数
39.
ランダムウォーク 1次元ランダムウォーク 例えばコイントスをして表が出たら右へ一歩進み、裏が出たら左へ一歩進むというような ことを考える
40.
ランダムウォーク 今回はとくに、0地点から出発してまた0地点に戻ってくるのにかかる時間(first return time)の長さに焦点を当てる t秒後(2mステップ)に原点に戻る確率をf, もう1回、2回、3回・・・と原点に戻ってくる確率 をuとする
41.
ランダムウォーク
42.
ランダムウォーク
43.
ランダムウォーク
44.
ランダムウォーク
45.
ランダムウォーク
46.
ランダムウォーク
47.
ランダムウォーク “Gambler’s ruin” ギャンブラーが破産するまでの時間のヒ ストグラムはべき乗分布になる
48.
ユール過程 分類学でいう「種」と「属」を考える
49.
ユール過程 k個の「種」をもつ「属」の数を 数えてみると、べき乗分布に なる。 その生成メカニズムのモデル がユール過程。
50.
ユール過程 1ステップごとに一定の確率で「種」に遺伝子変異が起きて2つの「種」に分かれる
51.
ユール過程 新たに生まれた「種」は一定の確率で新しい「属」を形成する 属A 属B
52.
ユール過程 1ステップごとに新しい属が1つ生まれ、m個の「種」が既存の属に加わる t時点 t+1時 点 属A 属B 属C
53.
ユール過程 パラメータ ● n → 属の数 ●
k[i] → i番目の属に入っている種の数 ● m → 1ステップで加わる種の数 ● p[k] → k個の種をもつ属の数(確率分布) ルール ● 1ステップごとにnは必ず1増える。この新しい属には新しい1つの種が入る。 ● 新たに加わるm個の種はそれぞれの属がもっている種の数に応じて分配される(た くさん種がある属ほど新たにたくさんの種を獲得しやすい)
54.
ユール過程
55.
ユール過程 n+1ステップ目にk個の種を獲得している属は、nステップ目にk個の種を持っていて変化 していないものか、nステップ目にk-1個の種しかもっていなかったが、1個の種を獲得し てk個の種を持つようになったものである。
56.
ユール過程
57.
ユール過程
58.
ユール過程
59.
ユール過程 ベータ分布の右裾はべ き乗分布とほぼ等しい
Download