SlideShare a Scribd company logo
1 of 10
Download to read offline
2015板橋Cityマラソン

タイム統計	
2015/5/14	
  
石橋圭介
データ	
•  	
  2015板橋Cityマラソンの大会結果ページから
男子(陸連、一般とも)のデータを抽出,分析。	
  
– h-ps://runnet.jp/101252/record.html	
  
– 走者毎のネットタイム、グロスタイム、5kmラップ、
スプリットタイムが公開されている。	
  
•  データ数:12465人	
  
– 大会結果によると、一般は11183位、陸連は1333
位までなので合計	
  12516人となり、微妙に数字が
あわない(が気にしない)。	
  
サマリ	
•  ネットタイムの平均は4時間33分,標準偏差
は55分。	
  
•  5分毎頻度分布の最頻値は3:55-­‐4:00.	
  
•  スプリットタイムは25-­‐30Kmから増加傾向	
  
– どのタイムのランナーでも程度の差はあるものの
25km以降スプリットタイム増加	
  
•  後半スプリットの増大係数はタイムに比例し
て増加するが、サブフォー以降のランナーは
増大係数がさらに増加.	
  
ネットタイム統計、累積分布	
•  平均は4時間33分,標準偏差は55分。	
  
–  中央値(メジアン):4時間28分。	
  
–  その他累積分布値:4時間:上位33%,	
  3.5時間:上位13%、3時間:上位3%	
  
•  正規分布でフィッティング(赤線)。正規分布よりhead,	
  tailとも短い	
  
–  QQプロットによると(-­‐1.5σ,2σ)の外(~3時間,6.5時間~)でずれ	
7000 9000 11000 13000 15000 17000 19000 21000 23000 25000
0.00.20.40.60.81.0
7000 9000 11000 13000 15000 17000 19000 21000 23000 25000
0.00.20.40.60.81.0
net time [s]
CDF
net time
normal fit
-4 -3 -2 -1 0 1 2 3 4
800012000160002000024000
-4 -3 -2 -1 0 1 2 3 4
800012000160002000024000
Normal Q-Q Plot
Theoretical Quantiles
SampleQuantiles
累積分布	
 QQプロット
ネットタイム頻度分布	
•  5分毎頻度分布の最頻値は14,100〜14,400秒(3時間55分〜
4時間)。	
  
–  その他30分毎にスパイクが存在。	
net time [s]
Frequency
10000 15000 20000 25000
0100300500
5km毎スプリットタイム頻度分布	
•  5km毎スプリットタイムの分布。ピークは1700秒(5分40秒/Km)あたり(サブフォー
ペース)。	
  
•  25km〜30kmスプリット(水色)から右側にずれてくる。いわゆる30Kmの壁?	
  
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
1000 1500 2000 2500 3000 3500 4000 4500
0.00000.00050.00100.00150.0020
split [s]
Density
split5
split10
split15
split20
split25
split30
split35
split40
5km毎スプリットタイム推移	
•  5kmスプリット(メジアン)の推移をプロット(前ページ分布のメジア
ンをプロットしたもの)。こちらも25-­‐30Kmスプリットから増加。	
  
•  ネットタイム走者群別でも算出。程度の差あれ、どの走者群も
25km-­‐30kmスプリットから増加。	
  
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
11001300150017001900210023002500
split(5km)
median[s]
split5 split10 split15 split20 split25 split30 split35 split40
all
3:00-3:05
3:15-3:20
3:30-3:35
3:45-3:50
4:00-4:05
4:15-4:20
4:30-4:35
前半後半ペース比較	
•  ネットタイム走者群別に前半後半のペース[s/km]メジアンを比較。	
  
•  サブフォー以降の走者群では後半ペースが増大	
  
–  サブフォー走者群では後半の増大は5〜10%、サブフォー以降では急
激に増加して5時間30分の走者群では後半ペースは35%増大。	
  
200250300350400450500550
Index
averagepace[s/km]
200250300350400450500550
Index
averagepace[s/km]
2:30 2:50 3:10 3:30 3:50 4:10 4:30 4:50 5:10 5:30
1st half
2nd half
1.001.051.101.151.201.251.301.351.40
Index
ratiobetweenthefirstandsecondhalves
2:30 2:40 2:50 3:00 3:10 3:20 3:30 3:40 3:50 4:00 4:10 4:20 4:30 4:40 4:50 5:00 5:10 5:20 5:30
前半後半比	
前半後半ペース比較	
ネットタイム別走者群	
 ネットタイム別走者群
  前半ペースとネットタイムの関係	
•  ネットタイム4時間未満、以上別に前半ペース[s/km]	
  との関係を線形回帰	
  
–  前半ペース[s/km]=0.0207*	
  ネットタイム[s]+24	
  	
  	
  (ネットタイム	
  <	
  14400)	
  (図中赤線)	
  
–  前半ペース[s/km]=0.0156*	
  ネットタイム[s]+93	
  	
  (ネットタイム≧14400)	
  	
  (図中緑線)	
  
–  ネットタイム4時間だと前半ペース約5分20秒/km	
  
–   (参考)イーブンペースの係数は1/42.195≒0.0237(図中青線).これより上がネガティ
ブスプリット	
9	
10000 12000 14000 16000 18000 20000
200250300350400450
net time [s]
averagepaceinthe1sthalf[s]
10000 12000 14000 16000 18000 20000
200250300350400450
y=0.021x+24
y=0.016x+93
y=1/42.195x(even pace)
 その他	
•  最後の回帰式は微妙.	
  
–  ネットタイム=f(走力,ペース配分,その他要因)というモデルだと思うと、説明変数と被説明
変数が逆。i.e.	
  後半ペースが増大したためにネットタイム増大しているのであって、ネットタイ
ム4時間以上だと後半ペース増大という言い方は逆。	
  
–  ランニングアプリのデータが公開されると練習量を説明変数とした回帰分析ができるの
だが。。。	
  
•  データ分析	
  
•  抽出:python	
  requests+lxml(1リクエスト/秒に制限)	
  
•  抽出(プロット):R	
  
•  参考:	
  
–  “フルマラソン、初心者は4時間30分を目標に”	
  
•  h-p://allabout.co.jp/gm/gc/213777/	
  
–  “Runner	
  Stats”	
  世界各地のマラソン大会統計	
  
•  h-p://runnerstats.net/	
  
–  “マラソンの最適ペース配分”	
  
•  h-p://d.hatena.ne.jp/rikunora/20130322/p1	
  
–  ”インターネット計測とデータ解析”	
  
•  h-p://www.iijlab.net/~kjc/classes/sfc2014s-­‐measurement/	
  
–  “Pythonでクローリング・スクレイピングに使えるライブラリいろいろ”	
  
•  h-p://orangain.hatenablog.com/entry/scraping-­‐in-­‐python	
  

More Related Content

Featured

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

板橋Cityマラソン2015タイム統計

  • 2. データ •   2015板橋Cityマラソンの大会結果ページから 男子(陸連、一般とも)のデータを抽出,分析。   – h-ps://runnet.jp/101252/record.html   – 走者毎のネットタイム、グロスタイム、5kmラップ、 スプリットタイムが公開されている。   •  データ数:12465人   – 大会結果によると、一般は11183位、陸連は1333 位までなので合計  12516人となり、微妙に数字が あわない(が気にしない)。  
  • 3. サマリ •  ネットタイムの平均は4時間33分,標準偏差 は55分。   •  5分毎頻度分布の最頻値は3:55-­‐4:00.   •  スプリットタイムは25-­‐30Kmから増加傾向   – どのタイムのランナーでも程度の差はあるものの 25km以降スプリットタイム増加   •  後半スプリットの増大係数はタイムに比例し て増加するが、サブフォー以降のランナーは 増大係数がさらに増加.  
  • 4. ネットタイム統計、累積分布 •  平均は4時間33分,標準偏差は55分。   –  中央値(メジアン):4時間28分。   –  その他累積分布値:4時間:上位33%,  3.5時間:上位13%、3時間:上位3%   •  正規分布でフィッティング(赤線)。正規分布よりhead,  tailとも短い   –  QQプロットによると(-­‐1.5σ,2σ)の外(~3時間,6.5時間~)でずれ 7000 9000 11000 13000 15000 17000 19000 21000 23000 25000 0.00.20.40.60.81.0 7000 9000 11000 13000 15000 17000 19000 21000 23000 25000 0.00.20.40.60.81.0 net time [s] CDF net time normal fit -4 -3 -2 -1 0 1 2 3 4 800012000160002000024000 -4 -3 -2 -1 0 1 2 3 4 800012000160002000024000 Normal Q-Q Plot Theoretical Quantiles SampleQuantiles 累積分布 QQプロット
  • 5. ネットタイム頻度分布 •  5分毎頻度分布の最頻値は14,100〜14,400秒(3時間55分〜 4時間)。   –  その他30分毎にスパイクが存在。 net time [s] Frequency 10000 15000 20000 25000 0100300500
  • 6. 5km毎スプリットタイム頻度分布 •  5km毎スプリットタイムの分布。ピークは1700秒(5分40秒/Km)あたり(サブフォー ペース)。   •  25km〜30kmスプリット(水色)から右側にずれてくる。いわゆる30Kmの壁?   1000 1500 2000 2500 3000 3500 4000 4500 0.00000.00050.00100.00150.0020 split [s] Density 1000 1500 2000 2500 3000 3500 4000 4500 0.00000.00050.00100.00150.0020 split [s] Density 1000 1500 2000 2500 3000 3500 4000 4500 0.00000.00050.00100.00150.0020 split [s] Density 1000 1500 2000 2500 3000 3500 4000 4500 0.00000.00050.00100.00150.0020 split [s] Density 1000 1500 2000 2500 3000 3500 4000 4500 0.00000.00050.00100.00150.0020 split [s] Density 1000 1500 2000 2500 3000 3500 4000 4500 0.00000.00050.00100.00150.0020 split [s] Density 1000 1500 2000 2500 3000 3500 4000 4500 0.00000.00050.00100.00150.0020 split [s] Density 1000 1500 2000 2500 3000 3500 4000 4500 0.00000.00050.00100.00150.0020 split [s] Density 1000 1500 2000 2500 3000 3500 4000 4500 0.00000.00050.00100.00150.0020 split [s] Density 1000 1500 2000 2500 3000 3500 4000 4500 0.00000.00050.00100.00150.0020 split [s] Density 1000 1500 2000 2500 3000 3500 4000 4500 0.00000.00050.00100.00150.0020 split [s] Density split5 split10 split15 split20 split25 split30 split35 split40
  • 7. 5km毎スプリットタイム推移 •  5kmスプリット(メジアン)の推移をプロット(前ページ分布のメジア ンをプロットしたもの)。こちらも25-­‐30Kmスプリットから増加。   •  ネットタイム走者群別でも算出。程度の差あれ、どの走者群も 25km-­‐30kmスプリットから増加。   11001300150017001900210023002500 split(5km) median[s] 11001300150017001900210023002500 split(5km) median[s] 11001300150017001900210023002500 split(5km) median[s] 11001300150017001900210023002500 split(5km) median[s] 11001300150017001900210023002500 split(5km) median[s] 11001300150017001900210023002500 split(5km) median[s] 11001300150017001900210023002500 split(5km) median[s] 11001300150017001900210023002500 split(5km) median[s] split5 split10 split15 split20 split25 split30 split35 split40 all 3:00-3:05 3:15-3:20 3:30-3:35 3:45-3:50 4:00-4:05 4:15-4:20 4:30-4:35
  • 8. 前半後半ペース比較 •  ネットタイム走者群別に前半後半のペース[s/km]メジアンを比較。   •  サブフォー以降の走者群では後半ペースが増大   –  サブフォー走者群では後半の増大は5〜10%、サブフォー以降では急 激に増加して5時間30分の走者群では後半ペースは35%増大。   200250300350400450500550 Index averagepace[s/km] 200250300350400450500550 Index averagepace[s/km] 2:30 2:50 3:10 3:30 3:50 4:10 4:30 4:50 5:10 5:30 1st half 2nd half 1.001.051.101.151.201.251.301.351.40 Index ratiobetweenthefirstandsecondhalves 2:30 2:40 2:50 3:00 3:10 3:20 3:30 3:40 3:50 4:00 4:10 4:20 4:30 4:40 4:50 5:00 5:10 5:20 5:30 前半後半比 前半後半ペース比較 ネットタイム別走者群 ネットタイム別走者群
  • 9.   前半ペースとネットタイムの関係 •  ネットタイム4時間未満、以上別に前半ペース[s/km]  との関係を線形回帰   –  前半ペース[s/km]=0.0207*  ネットタイム[s]+24      (ネットタイム  <  14400)  (図中赤線)   –  前半ペース[s/km]=0.0156*  ネットタイム[s]+93    (ネットタイム≧14400)    (図中緑線)   –  ネットタイム4時間だと前半ペース約5分20秒/km   –   (参考)イーブンペースの係数は1/42.195≒0.0237(図中青線).これより上がネガティ ブスプリット 9 10000 12000 14000 16000 18000 20000 200250300350400450 net time [s] averagepaceinthe1sthalf[s] 10000 12000 14000 16000 18000 20000 200250300350400450 y=0.021x+24 y=0.016x+93 y=1/42.195x(even pace)
  • 10.  その他 •  最後の回帰式は微妙.   –  ネットタイム=f(走力,ペース配分,その他要因)というモデルだと思うと、説明変数と被説明 変数が逆。i.e.  後半ペースが増大したためにネットタイム増大しているのであって、ネットタイ ム4時間以上だと後半ペース増大という言い方は逆。   –  ランニングアプリのデータが公開されると練習量を説明変数とした回帰分析ができるの だが。。。   •  データ分析   •  抽出:python  requests+lxml(1リクエスト/秒に制限)   •  抽出(プロット):R   •  参考:   –  “フルマラソン、初心者は4時間30分を目標に”   •  h-p://allabout.co.jp/gm/gc/213777/   –  “Runner  Stats”  世界各地のマラソン大会統計   •  h-p://runnerstats.net/   –  “マラソンの最適ペース配分”   •  h-p://d.hatena.ne.jp/rikunora/20130322/p1   –  ”インターネット計測とデータ解析”   •  h-p://www.iijlab.net/~kjc/classes/sfc2014s-­‐measurement/   –  “Pythonでクローリング・スクレイピングに使えるライブラリいろいろ”   •  h-p://orangain.hatenablog.com/entry/scraping-­‐in-­‐python