SlideShare a Scribd company logo
1 of 12
Tutorial
위젯(Widget) 캔버스(Canvas)
- 데이터 관련 위젯 - 시각화 위젯
- 모델링 위젯 - 비지도 학습 위젯- 평가 위젯
캔버스를 통해 어떻게 작업이 이루어지고, 어떤 방향으로 흘러가는지 직관적으로 볼 수 있다.
캔버스를 활용한 워크플로우 작성 방법 :
- 원하는 위젯을 클릭한다
OR 원하는 위젯을 캔버스의 원하는 위치로 드래그한다
OR 캔버스에서 마우스 오른쪽 버튼을 클릭하여 원하는 위젯을 추가한다
- 위젯간 드래그를 통해 데이터 Input/Output 이 가능하다
data set
분포 확인할
데이터 업로드
Distributions
분포 확인
variable , distribution 선택 가능
data set
상자 그림 확인할
데이터 업로드
Box Plot
분포 확인
variable 선택 가능
최솟값, 제 1/2/3/4분위, 최댓값, 이상치 시각화
정규분포, 베타분포, 감마분포, 파레토분포 등의 분포 그래프
2원 3원 교차표의 시각화
data set
데이터 업로드
Mosaic Display
feature 선택 후 확인
서로 다른 집합들간의 관계 시각화
data set
데이터 업로드
Select Rows
2개 이상의 하위 데이터 그룹 설정
(Rows or Columns 가능)
Venn Diagram
Data table 위젯 연결 통해
데이터 확인 가능
data set
산점도 확인할
데이터 업로드 Data Table
File의 데이터 확인
(필요 시 산점도에서
위치 확인할 데이터 선택)
Scatter Plot
산점도 확인
왼쪽 상단에서 x, y축 선택 Data Table에서
선택한 데이터
data set
Silhouette 확인할
데이터 업로드
Silhouette Plot
Cluster가 얼마나 적합하게
나뉘었는지 시각적으로 확인
(inliers/outliers 확인 가능)
Scatter Plot
Silhouette plot에서
선택한 데이터의
산점도에서의 위치 확인
Silhouette plot에서
선택한 데이터
최솟값, 제 1/2/3/4분위, 최댓값, 이상치 시각화
데이터 클러스터 내 일관성 검증 그래프
Train data set
Train data set
훈련 데이터
Test data set
테스트 데이터
Classification tree
결정 트리 학습법 수행
(Tree Viewer 위젯을 활용하면 분류
결과를 확인할 수 있음)
kNN
최근접 이웃 알고리즘 수행
Data Table
File의 데이터 확인 가능
Predictions
훈련 데이터의 Tree와 kNN에 따른
테스트 데이터 결과 예측
데이터와 통계를 활용하여 데이터 모델의 결과 예측 분석
data set
Cluster 확인할
데이터 선택
K-means
입력한 데이터를
k개의 클러스터로
묶어주는 알고리즘
MDS
Multi Dimensional Scaling
(다차원 척도법)
K-means에서 얻은
거리 데이터를 시각화
MDS 결과창
K-Means 결과 클러스터 2개
주어진 데이터를 k개의 클러스터로 묶는 알고리즘
Class-labeled data set
Class-labeled 데이터 선택 Data Table
File의 데이터 확인
Logistic Regression
로지스틱 회귀분석 수행
Random Forest
Random Forest 분석 수행
SVM
Support Vector Machine
알고리즘 수행
Test and Score
분류 분석(learner)간 교차
검증 및 예측 정확도 측정
Confusion Matrix
Confusion 행렬을 통한
추가적인 교차검증 분석 Data Table(1)
Confusion 행렬에서 선택한
셀의 데이터 인스턴스 표시
각기 다른 분류 방법으로 서로 다른 테스트 데이터를 여러 번 골라내서 복수의 테스트 실시
data set
클러스터링 수행할
데이터 파일 업로드
Data Table
File의 데이터 확인
Distances
데이터 샘플간의
거리 계산
Hierarchical Clustering
데이터 샘플간의
거리 계산
Distance Map
데이터간 거리를
Heat map을 통해 시각화
Data Table(1)
Heat map에서 선택된
데이터간 거리 표시
Box Plot
Hierarchical Clustering에서 선택된
데이터를 Box Plot으로 보여줌
Data Table(2)
Hierarchical Clustering에서
선택된 데이터 확인
특정 알고리즘에 의해 데이터를 연결하여 계층적으로 클러스터를 구성

More Related Content

Featured

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Orange tutorial

  • 3. - 데이터 관련 위젯 - 시각화 위젯
  • 4. - 모델링 위젯 - 비지도 학습 위젯- 평가 위젯
  • 5. 캔버스를 통해 어떻게 작업이 이루어지고, 어떤 방향으로 흘러가는지 직관적으로 볼 수 있다. 캔버스를 활용한 워크플로우 작성 방법 : - 원하는 위젯을 클릭한다 OR 원하는 위젯을 캔버스의 원하는 위치로 드래그한다 OR 캔버스에서 마우스 오른쪽 버튼을 클릭하여 원하는 위젯을 추가한다 - 위젯간 드래그를 통해 데이터 Input/Output 이 가능하다
  • 6. data set 분포 확인할 데이터 업로드 Distributions 분포 확인 variable , distribution 선택 가능 data set 상자 그림 확인할 데이터 업로드 Box Plot 분포 확인 variable 선택 가능 최솟값, 제 1/2/3/4분위, 최댓값, 이상치 시각화 정규분포, 베타분포, 감마분포, 파레토분포 등의 분포 그래프
  • 7. 2원 3원 교차표의 시각화 data set 데이터 업로드 Mosaic Display feature 선택 후 확인 서로 다른 집합들간의 관계 시각화 data set 데이터 업로드 Select Rows 2개 이상의 하위 데이터 그룹 설정 (Rows or Columns 가능) Venn Diagram Data table 위젯 연결 통해 데이터 확인 가능
  • 8. data set 산점도 확인할 데이터 업로드 Data Table File의 데이터 확인 (필요 시 산점도에서 위치 확인할 데이터 선택) Scatter Plot 산점도 확인 왼쪽 상단에서 x, y축 선택 Data Table에서 선택한 데이터 data set Silhouette 확인할 데이터 업로드 Silhouette Plot Cluster가 얼마나 적합하게 나뉘었는지 시각적으로 확인 (inliers/outliers 확인 가능) Scatter Plot Silhouette plot에서 선택한 데이터의 산점도에서의 위치 확인 Silhouette plot에서 선택한 데이터 최솟값, 제 1/2/3/4분위, 최댓값, 이상치 시각화 데이터 클러스터 내 일관성 검증 그래프
  • 9. Train data set Train data set 훈련 데이터 Test data set 테스트 데이터 Classification tree 결정 트리 학습법 수행 (Tree Viewer 위젯을 활용하면 분류 결과를 확인할 수 있음) kNN 최근접 이웃 알고리즘 수행 Data Table File의 데이터 확인 가능 Predictions 훈련 데이터의 Tree와 kNN에 따른 테스트 데이터 결과 예측 데이터와 통계를 활용하여 데이터 모델의 결과 예측 분석
  • 10. data set Cluster 확인할 데이터 선택 K-means 입력한 데이터를 k개의 클러스터로 묶어주는 알고리즘 MDS Multi Dimensional Scaling (다차원 척도법) K-means에서 얻은 거리 데이터를 시각화 MDS 결과창 K-Means 결과 클러스터 2개 주어진 데이터를 k개의 클러스터로 묶는 알고리즘
  • 11. Class-labeled data set Class-labeled 데이터 선택 Data Table File의 데이터 확인 Logistic Regression 로지스틱 회귀분석 수행 Random Forest Random Forest 분석 수행 SVM Support Vector Machine 알고리즘 수행 Test and Score 분류 분석(learner)간 교차 검증 및 예측 정확도 측정 Confusion Matrix Confusion 행렬을 통한 추가적인 교차검증 분석 Data Table(1) Confusion 행렬에서 선택한 셀의 데이터 인스턴스 표시 각기 다른 분류 방법으로 서로 다른 테스트 데이터를 여러 번 골라내서 복수의 테스트 실시
  • 12. data set 클러스터링 수행할 데이터 파일 업로드 Data Table File의 데이터 확인 Distances 데이터 샘플간의 거리 계산 Hierarchical Clustering 데이터 샘플간의 거리 계산 Distance Map 데이터간 거리를 Heat map을 통해 시각화 Data Table(1) Heat map에서 선택된 데이터간 거리 표시 Box Plot Hierarchical Clustering에서 선택된 데이터를 Box Plot으로 보여줌 Data Table(2) Hierarchical Clustering에서 선택된 데이터 확인 특정 알고리즘에 의해 데이터를 연결하여 계층적으로 클러스터를 구성