板橋Cityマラソン2015タイム統計
- 3. サマリ
• ネットタイムの平均は4時間33分,標準偏差
は55分。
• 5分毎頻度分布の最頻値は3:55-‐4:00.
• スプリットタイムは25-‐30Kmから増加傾向
– どのタイムのランナーでも程度の差はあるものの
25km以降スプリットタイム増加
• 後半スプリットの増大係数はタイムに比例し
て増加するが、サブフォー以降のランナーは
増大係数がさらに増加.
- 4. ネットタイム統計、累積分布
• 平均は4時間33分,標準偏差は55分。
– 中央値(メジアン):4時間28分。
– その他累積分布値:4時間:上位33%,
3.5時間:上位13%、3時間:上位3%
• 正規分布でフィッティング(赤線)。正規分布よりhead,
tailとも短い
– QQプロットによると(-‐1.5σ,2σ)の外(~3時間,6.5時間~)でずれ
7000 9000 11000 13000 15000 17000 19000 21000 23000 25000
0.00.20.40.60.81.0
7000 9000 11000 13000 15000 17000 19000 21000 23000 25000
0.00.20.40.60.81.0
net time [s]
CDF
net time
normal fit
-4 -3 -2 -1 0 1 2 3 4
800012000160002000024000
-4 -3 -2 -1 0 1 2 3 4
800012000160002000024000
Normal Q-Q Plot
Theoretical Quantiles
SampleQuantiles
累積分布
QQプロット
- 6. 5km毎スプリットタイム頻度分布
• 5km毎スプリットタイムの分布。ピークは1700秒(5分40秒/Km)あたり(サブフォー
ペース)。
• 25km〜30kmスプリット(水色)から右側にずれてくる。いわゆる30Kmの壁?
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
split5
split10
split15
split20
split25
split30
split35
split40
- 7. 5km毎スプリットタイム推移
• 5kmスプリット(メジアン)の推移をプロット(前ページ分布のメジア
ンをプロットしたもの)。こちらも25-‐30Kmスプリットから増加。
• ネットタイム走者群別でも算出。程度の差あれ、どの走者群も
25km-‐30kmスプリットから増加。
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
split5 split10 split15 split20 split25 split30 split35 split40
all
3:00-3:05
3:15-3:20
3:30-3:35
3:45-3:50
4:00-4:05
4:15-4:20
4:30-4:35
- 8. 前半後半ペース比較
• ネットタイム走者群別に前半後半のペース[s/km]メジアンを比較。
• サブフォー以降の走者群では後半ペースが増大
– サブフォー走者群では後半の増大は5〜10%、サブフォー以降では急
激に増加して5時間30分の走者群では後半ペースは35%増大。
200250300350400450500550
Index
averagepace[s/km]
200250300350400450500550
Index
averagepace[s/km]
2:30 2:50 3:10 3:30 3:50 4:10 4:30 4:50 5:10 5:30
1st half
2nd half
1.001.051.101.151.201.251.301.351.40
Index
ratiobetweenthefirstandsecondhalves
2:30 2:40 2:50 3:00 3:10 3:20 3:30 3:40 3:50 4:00 4:10 4:20 4:30 4:40 4:50 5:00 5:10 5:20 5:30
前半後半比
前半後半ペース比較
ネットタイム別走者群
ネットタイム別走者群
- 9. 前半ペースとネットタイムの関係
• ネットタイム4時間未満、以上別に前半ペース[s/km]
との関係を線形回帰
– 前半ペース[s/km]=0.0207*
ネットタイム[s]+24
(ネットタイム
<
14400)
(図中赤線)
– 前半ペース[s/km]=0.0156*
ネットタイム[s]+93
(ネットタイム≧14400)
(図中緑線)
– ネットタイム4時間だと前半ペース約5分20秒/km
– (参考)イーブンペースの係数は1/42.195≒0.0237(図中青線).これより上がネガティ
ブスプリット
9
10000 12000 14000 16000 18000 20000
200250300350400450
net time [s]
averagepaceinthe1sthalf[s]
10000 12000 14000 16000 18000 20000
200250300350400450
y=0.021x+24
y=0.016x+93
y=1/42.195x(even pace)
- 10. その他
• 最後の回帰式は微妙.
– ネットタイム=f(走力,ペース配分,その他要因)というモデルだと思うと、説明変数と被説明
変数が逆。i.e.
後半ペースが増大したためにネットタイム増大しているのであって、ネットタイ
ム4時間以上だと後半ペース増大という言い方は逆。
– ランニングアプリのデータが公開されると練習量を説明変数とした回帰分析ができるの
だが。。。
• データ分析
• 抽出:python
requests+lxml(1リクエスト/秒に制限)
• 抽出(プロット):R
• 参考:
– “フルマラソン、初心者は4時間30分を目標に”
• h-p://allabout.co.jp/gm/gc/213777/
– “Runner
Stats”
世界各地のマラソン大会統計
• h-p://runnerstats.net/
– “マラソンの最適ペース配分”
• h-p://d.hatena.ne.jp/rikunora/20130322/p1
– ”インターネット計測とデータ解析”
• h-p://www.iijlab.net/~kjc/classes/sfc2014s-‐measurement/
– “Pythonでクローリング・スクレイピングに使えるライブラリいろいろ”
• h-p://orangain.hatenablog.com/entry/scraping-‐in-‐python