SlideShare a Scribd company logo
1 of 6
<Nba player clustering(1996-2017s)>
1. 분석동기 및 데이터 처리
농구 선수는 5개의 포지션 구분되나,
선수의 플레이 스타일로 포지션을 재정의 후
이를 통해 심도있는 선수분석을 목적
* 데이터 출처
NBA.com
NBAminer.com
Basketball-reference
ESPN.com
Elias Sports Bureau
Spotrac.com
이상치를 제거하기 위해 출전 경기 30경기 이상,
경기당 평균 출전시간 10분 이상의 선수만 선택
총 152개의 변수에서 실제 NBA 기록의 중요도
및 중복되는 부분을 감안하여 90개의 변수
2. Model setup
* Classification 모델 선택
(1) K-means(K-means++)
: 주어진 데이터를 k개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리차이의
분산을 최소화 하는 방식
(2) Hierarchical Clustering
: 처음에 n개의 군집으로부터 시작하여 점차 군집의 개수를 줄여나가는 방법
(3) EM Clustering
: 관측되지 않는 잠재변수에 의존하는 확률모델에서 최대가능도를 갖는 매개변수를
찾는 반복적 알고리즘
(4) 가장 결과가 좋은 것? K-means++
→ Silhouette coeffients 값이 제일 높은 k-means ++로 clustering을 진행
3. 클러스터별 labeling
클러스터별 특징을 파악하기 위해서 클러스터의 지표 평균을 내주어 위와 같은 그래프를 구현
총 10가지 포지션에 대해서
각 클러스터별 특징을 잘 드러내는 이름으로 labeling 함
(ex : Aggressive big : 공격 리바운드와 블록, 득점력이 강한 선수 )
4. Apply basketball analysis by clustering data
총 10가지 포지션에 대해서 년도 별 포지션의 증감을 알게 됬으며,
각 포지션 간의 상관관계를 구해서
농구의 시대별 흐름(1990년대, 2000년대 등) 에 따른 포지션 증감에 대해서 알아볼 수 있게 됨
5. 결론 및 추후과제
* 결론
- K-Means 클러스터링을 이용하여 NBA Position에 대해 기존의 5가지의 분류와는
다른 새로운 10가지 포지션으로의 분류를 시행함
- 새롭게 정의한 포지션 별 년도별 흐름 파악 및 포지션별 관계
* 추후과제
- 수비에 관한 구체적인 기록들이 많이 반영되지 않아 향후 수비 관련 지표들에
대해 더 추가하여 반영할 필요가 있음
- 2차 스탯 및 플레이오프 스탯 등을 반영할 수 있는 더 정교한 모델 및 클러스터링
작업과 추가적 데이터 확보

More Related Content

Featured

PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...DevGAMM Conference
 

Featured (20)

Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 

패스트캠퍼스 - Dss5 - Teamproject_3

  • 2. 1. 분석동기 및 데이터 처리 농구 선수는 5개의 포지션 구분되나, 선수의 플레이 스타일로 포지션을 재정의 후 이를 통해 심도있는 선수분석을 목적 * 데이터 출처 NBA.com NBAminer.com Basketball-reference ESPN.com Elias Sports Bureau Spotrac.com 이상치를 제거하기 위해 출전 경기 30경기 이상, 경기당 평균 출전시간 10분 이상의 선수만 선택 총 152개의 변수에서 실제 NBA 기록의 중요도 및 중복되는 부분을 감안하여 90개의 변수
  • 3. 2. Model setup * Classification 모델 선택 (1) K-means(K-means++) : 주어진 데이터를 k개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리차이의 분산을 최소화 하는 방식 (2) Hierarchical Clustering : 처음에 n개의 군집으로부터 시작하여 점차 군집의 개수를 줄여나가는 방법 (3) EM Clustering : 관측되지 않는 잠재변수에 의존하는 확률모델에서 최대가능도를 갖는 매개변수를 찾는 반복적 알고리즘 (4) 가장 결과가 좋은 것? K-means++ → Silhouette coeffients 값이 제일 높은 k-means ++로 clustering을 진행
  • 4. 3. 클러스터별 labeling 클러스터별 특징을 파악하기 위해서 클러스터의 지표 평균을 내주어 위와 같은 그래프를 구현 총 10가지 포지션에 대해서 각 클러스터별 특징을 잘 드러내는 이름으로 labeling 함 (ex : Aggressive big : 공격 리바운드와 블록, 득점력이 강한 선수 )
  • 5. 4. Apply basketball analysis by clustering data 총 10가지 포지션에 대해서 년도 별 포지션의 증감을 알게 됬으며, 각 포지션 간의 상관관계를 구해서 농구의 시대별 흐름(1990년대, 2000년대 등) 에 따른 포지션 증감에 대해서 알아볼 수 있게 됨
  • 6. 5. 결론 및 추후과제 * 결론 - K-Means 클러스터링을 이용하여 NBA Position에 대해 기존의 5가지의 분류와는 다른 새로운 10가지 포지션으로의 분류를 시행함 - 새롭게 정의한 포지션 별 년도별 흐름 파악 및 포지션별 관계 * 추후과제 - 수비에 관한 구체적인 기록들이 많이 반영되지 않아 향후 수비 관련 지표들에 대해 더 추가하여 반영할 필요가 있음 - 2차 스탯 및 플레이오프 스탯 등을 반영할 수 있는 더 정교한 모델 및 클러스터링 작업과 추가적 데이터 확보