Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Olap과 다차원 모델

3,971 views

Published on

OLAP and Multi Dimension

Olap과 다차원 모델

  1. 1. OLAP 테크놀로지 OLAP과 다차원모델 강성욱 E-mail : jevida@naver.com Blog : http://sqlmvp.kr Datawaffle : http://datawaffle.com
  2. 2. 차원(디멘전)과 차원항목 차원 • 큐브를 구성하는 축 • 사용자가 데이터를 분석하고자 하는 관점 차원항목(Member 또는 Element) • 각 축의 좌표
  3. 3. 큐브(CUBE)와 셀(CELL) 셀(Cell) • 각 차원을 구성하는 항목들의 조합에 대한 데이터를 저장하 는 논리적인 공간 • 3 x 2 x 3 = 18 cell
  4. 4. 데이터 희박성(Sparsity) 희박성(Sparsity) • 셀은 논리적인 가상공간이며 물리적 존재 여부와는 별개 개념이다. • 데이터가 존재하지 않는 셀은 물리적으로 존재하지 않게 된 다. 이 부분이 희박성 이다.
  5. 5. 계층구조 계층구조 • 데이터가 집계되는 기본적인 경로 페어런트(Parent) • 어떤 항목의 바로 상위 항목 차일드(Child) • 어떤 항목의 바로 하위 항목 씨블링(Sibling) • 동일한 페어런트를 가진 항목 루트항목(Root) • 페어런트를 갖지 않는 항목 리프항목(Leaf) • 차일드를 갖지 않는 항목 앤세스터(Ancestor) • 어떤 항목의 모든 상위 항목 디센던드(Descendent) • 어떤 항목의 모든 하위 항목
  6. 6. 대칭 구조 레벨 레벨4, 제네레이션1 레벨3, 제네레이션2 레벨2, 제네레이션3 레벨1, 제네레이션4
  7. 7. 비대칭 구조 레벨
  8. 8. 애트리뷰트 / 관계식 애트리뷰트(Attribute) • 차원 항목들의 특성을 나타내는 텍스트 형태의 정보 Ex) • 매장 : 매장 주소, 전화번호, 담당자, 매장크기, 직영 여부, 개점일 등 • 제품 : 제품의 색상, 크기, 신제품 여부 등 관계식 • 항목들간의 관계를 식으로 정의 Ex) • 평균 매출 가격 : 매출액 / 매출 수량 • 세금 : 매출액 * 0.2
  9. 9. 스타스키마다차원 데이터를 효과적으로 저장, 조회하기 위한 관계형DB의 설계 기법 • 하나의 팩트 테이블과 다수의 디멘젼 테이블로 구성 • 팩트(사실) : 분석하고자 하는 대상 항 목 • 디멘젼(차원) : 사실을 보는 관점
  10. 10. E-R모델과 스타스키마E-R 모델 스타스키마• 갱신 성능을 최적화 • 최적의 질의 응답을 위한 설계 기법• 정규화됨 • 비정규화 됨• OLTP • OLAP• 다수의 테이블로 구성 • 소수의 테이블로 구성• 소수의 열 • 다수의 컬럼• 테이블간 여러 조인 경로
  11. 11. 사실테이블 / 차원테이블 점진적으로 진화하는 차원에 대한 대처(SCD) • 차원 항목들의 애트리뷰트가 시간이 흐름에 따라 변화 • Ralph Kimball 정의새로운 값으로 덮어 쓰기• 구현이 쉬움• 변경 과정을 파악 할 수 없음• 과거 데이터가 중요하지 않은 경우 사용
  12. 12. 사실테이블 / 차원테이블새로운 레코드 추가• 변경 시점에 새로운 속성값을 가지는 레코드 추가• 써로게이트키(대체키) 이용• 일반적으로 많이 선호 함
  13. 13. 사실테이블 / 차원테이블새로운 필드 추가• 시작 속성과 현재 속성, 변경일 기준으로 관리• 스키마 변경으로 인한 관리 어려움.
  14. 14. 스노우플레이크 스키마• 스타스키마의 팩트 테이블 구조와 동일하게 유지하면서 차원 테 이블은 정규화된 구조를 형성• 팩트 테이블과 조인되는 차원 테이블이 있으며 이 차원 테이블은 또 다른 테이블의 기본키를 참조하는 외래키를 가짐
  15. 15. 스노우플레이크 스키마• 스키마 확장에 용이• 많은 데이터 보유로 인한 성능과 집계 영향• 참조되는 데이터를 Outboard 또는 OutBridge 불림
  16. 16. 변수 차원변수차원• 자산. 부채, 수익, 비용등과 같이 비즈니스 성과를 측정하기 위한 항목특성• 다른 차원들의 존재 기반을 제공• 나머지 차원들의 상세 정도를 결정
  17. 17. 하이퍼 큐브
  18. 18. 블록 멀티 큐브
  19. 19. 시리즈 멀티 큐브
  20. 20. 참고자료• OLAP 테크놀로지 (시그마)

×