5. 캔버스를 통해 어떻게 작업이 이루어지고, 어떤 방향으로 흘러가는지 직관적으로 볼 수 있다.
캔버스를 활용한 워크플로우 작성 방법 :
- 원하는 위젯을 클릭한다
OR 원하는 위젯을 캔버스의 원하는 위치로 드래그한다
OR 캔버스에서 마우스 오른쪽 버튼을 클릭하여 원하는 위젯을 추가한다
- 위젯간 드래그를 통해 데이터 Input/Output 이 가능하다
6. data set
분포 확인할
데이터 업로드
Distributions
분포 확인
variable , distribution 선택 가능
data set
상자 그림 확인할
데이터 업로드
Box Plot
분포 확인
variable 선택 가능
최솟값, 제 1/2/3/4분위, 최댓값, 이상치 시각화
정규분포, 베타분포, 감마분포, 파레토분포 등의 분포 그래프
7. 2원 3원 교차표의 시각화
data set
데이터 업로드
Mosaic Display
feature 선택 후 확인
서로 다른 집합들간의 관계 시각화
data set
데이터 업로드
Select Rows
2개 이상의 하위 데이터 그룹 설정
(Rows or Columns 가능)
Venn Diagram
Data table 위젯 연결 통해
데이터 확인 가능
8. data set
산점도 확인할
데이터 업로드 Data Table
File의 데이터 확인
(필요 시 산점도에서
위치 확인할 데이터 선택)
Scatter Plot
산점도 확인
왼쪽 상단에서 x, y축 선택 Data Table에서
선택한 데이터
data set
Silhouette 확인할
데이터 업로드
Silhouette Plot
Cluster가 얼마나 적합하게
나뉘었는지 시각적으로 확인
(inliers/outliers 확인 가능)
Scatter Plot
Silhouette plot에서
선택한 데이터의
산점도에서의 위치 확인
Silhouette plot에서
선택한 데이터
최솟값, 제 1/2/3/4분위, 최댓값, 이상치 시각화
데이터 클러스터 내 일관성 검증 그래프
9. Train data set
Train data set
훈련 데이터
Test data set
테스트 데이터
Classification tree
결정 트리 학습법 수행
(Tree Viewer 위젯을 활용하면 분류
결과를 확인할 수 있음)
kNN
최근접 이웃 알고리즘 수행
Data Table
File의 데이터 확인 가능
Predictions
훈련 데이터의 Tree와 kNN에 따른
테스트 데이터 결과 예측
데이터와 통계를 활용하여 데이터 모델의 결과 예측 분석
10. data set
Cluster 확인할
데이터 선택
K-means
입력한 데이터를
k개의 클러스터로
묶어주는 알고리즘
MDS
Multi Dimensional Scaling
(다차원 척도법)
K-means에서 얻은
거리 데이터를 시각화
MDS 결과창
K-Means 결과 클러스터 2개
주어진 데이터를 k개의 클러스터로 묶는 알고리즘
11. Class-labeled data set
Class-labeled 데이터 선택 Data Table
File의 데이터 확인
Logistic Regression
로지스틱 회귀분석 수행
Random Forest
Random Forest 분석 수행
SVM
Support Vector Machine
알고리즘 수행
Test and Score
분류 분석(learner)간 교차
검증 및 예측 정확도 측정
Confusion Matrix
Confusion 행렬을 통한
추가적인 교차검증 분석 Data Table(1)
Confusion 행렬에서 선택한
셀의 데이터 인스턴스 표시
각기 다른 분류 방법으로 서로 다른 테스트 데이터를 여러 번 골라내서 복수의 테스트 실시
12. data set
클러스터링 수행할
데이터 파일 업로드
Data Table
File의 데이터 확인
Distances
데이터 샘플간의
거리 계산
Hierarchical Clustering
데이터 샘플간의
거리 계산
Distance Map
데이터간 거리를
Heat map을 통해 시각화
Data Table(1)
Heat map에서 선택된
데이터간 거리 표시
Box Plot
Hierarchical Clustering에서 선택된
데이터를 Box Plot으로 보여줌
Data Table(2)
Hierarchical Clustering에서
선택된 데이터 확인
특정 알고리즘에 의해 데이터를 연결하여 계층적으로 클러스터를 구성