SlideShare a Scribd company logo
1 of 35
Download to read offline
빅 데이터 플랫폼?
이것만 하면 80%는
구축할수 있다!
빅 데이터 플랫폼?
이 놈의 실체는?
내가 만약 빅 데이터 플랫폼 부서의 책임자라면
무엇을 제공할 것인가?
빅 데이터 플랫폼 책임자에게 듣는 흔한 질문

• 빅 데이터가 기존의 DW랑 차이가 뭐가 있는지 모르겠습니다.
• 단위 데이터만 봐서는 큰 데이터가 없습니다. 사업의 타당성을 만들수
가 없습니다. 어떻게 해야 하나요?
• A라는 데이터가 있는데 그것으로 뭘 해야할까요?
• 다른 회사는 뭐 한답니까? 혹시 동종업계 비슷한 사례가 있나요?
• 빅 데이터 플랫폼을 만들라는데 이놈이 뭐를 하는 놈인지 모르겠습니
다.
빅 데이터 플랫폼의 역할에 대한 고민

• 빅 데이터 플랫폼에서 하고자 하는 주요 업무는 무엇인가?
• 이 플랫폼에서 누가 무슨일을 하는가?
• 나는 운영자인가 개발자인가 분석가인가?
• 다른 회사는 뭐 한답니까? 혹시 동종업계 비슷한 사례가 있나요?
• 빅 데이터 플랫폼을 만들라는데 이놈이 뭐를 하는 놈인지 모르겠습니
다.
빅 데이터 플랫폼이 제공해야 하는 것
SOFTWARE STACK
빅 데이터 플랫폼이 제공해야 하는 것

INFRA MANAGEMENT
MONITORING
빅 데이터 플랫폼이 제공해야 하는 것

WORKFLOW
빅 데이터 플랫폼이 제공해야 하는 것

분석 및 시각화 환경
빅 데이터 플랫폼이 제공해야 하는 것

• ACCESS
• AUTHENTICATIO
N
• AUTHORIZATION
• ENCRYPTION
• AUDITING
• POLICY
SECURITY
빅 데이터 플랫폼이 제공해야 하는 것

DASHBOARD
빅 데이터 플랫폼이 제공해야 하는 것

• 배치 작업 관리와 작업 모니터링
• 병렬 분석 프로그램
• 사용자의 주요 행동에 대한 모니터링
• 리소스에 대한 각종 접근 통제 정책들…
• 인프라에 대한 접근성을 뛰어나게 하는 다양한 방법들…
Flamingo Project
하지만 우리는 모든 것을 원하지 않아요…
• 현장의 요구사항을 최대한 반영할 수 있는 통합된 환경을 제공해줬으
면 좋겠습니다.
• HADOOP ECOSYSTEM을 그대로 사용할 수 있으면 좋겠습니다.
• 사용자의 업무 패턴과 사용 패턴을 고려했으면 좋겠습니다.
• 현재 나와있는 것들과 충돌이 나거나 동일한 기능을 제공하는 것은 지
양합니다.

• 인프라 고민 하지 않고 만들고 활용하는데 집중했으면 좋겠습니다.
• 하지만 쉬워야 합니다. 그리고 오픈소스여야 합니다.
FLAMINGO의 통합 환경
FLAMINGO의 통합 환경
• 사용자는 작업 공간 내에서 자유롭게 이동하면서 작업을 할 수 있도록
구성
• EXTJS의 DESKTOP APPLICATION을 MVC 구조에 맞춰서 최적화
• 각 화면은 최대한 독립 개발이 가능하도록 분리하여 구성
• 재사용 가능한 것은 컴포넌트화여 코드 작성을 최소화
• 누구나 추가할 수 있도록 최대한 구조를 단순화하고 대중적인 프레임
워크를 사용
• 개발 방법도 모두 표준화 (도구, 절차, 매뉴얼, 환경 등등)
FLAMINGO를 구성하는 오픈소스 프레임워크

• SPRING FRAMEWORK 4
• MYBATIS 3

• EXTJS 4
• APACHE TOMCAT 7

• OPENGRAPH 1 (자체 개발)
• (ANY) APACHE HADOOP, APACHE PIG, APACHE HIVE
FLAMINGO의 기본 아키텍처
FLAMINGO TEAM의 개발 원칙

• 우리는 커뮤니케이션 비용을 최소화하기 위해서 예외를 두
지 않음 (모든 방법은 표준화를 통해 간소화함)
• 기반이 되는 것은 모두 직접 개발함
• 남이 이미 만든 것은 개발하지 않고 의존하지 않음 (사용자
가 알아서 사용하는 것임)

• 철저하게 현장에서 필요로 하는 기능을 개발함
• 사용자의 러닝커브를 최소화하고 효율성을 극대화함
FLAMINGO의 소스코드 구조

UI 구조는 직관적
EXTJS의 JAVASCRIPT는 340여개
FLAMINGO의 워크플로우 디자이너
FLAMINGO의 워크플로우 디자이너

• 기 개발한 MAPREDUCE를 그대로 통합할 수 있어야 함
• 개발자가 개발한 MAPREDUCE를 디자이너에 통합하는데
가이드를 따르는 경우 30분 이내 추가할 수 있어야 함
• DIRECT ACYCLIC GRAPH(DAG) 기반
• 각 노드의 정보가 상호 연계하여 동작
• 동작에 대한 코드는 0%, 메타데이터 설정만으로 동작 방식
을 변경 (유지보수 최소화를 추구)
FLAMINGO의 파일 시스템 관리
FLAMINGO의 파일 시스템 관리

• APACHE HADOOP의 HDFS를 관리하는 메인 화면
• 사용자는 디렉토리/파일을 관리

• 파일 업로드 및 다운로드 가능
• 디렉토리의 내용을 즉시 데이터베이스화 하여 조회

• HIVE METASTORE 연동하여 동작
FLAMINGO의 파일 시스템 처리 이력
FLAMINGO의 WORKFLOW MONITORING
FLAMINGO의 JOB TRACKER MONITORING
FLAMINGO의 JOB TRACKER MONITORING
FLAMINGO의 JOB MANAGEMENT
FLAMINGO의 JOB MANAGEMENT
FLAMINGO의 HIVE EDITOR
FLAMINGO의 향후 마일스톤
• 데이터 전처리 모듈, 추론 엔진 등을 디자이너에 추가할 예정
• JOB TRACKER 기능 추가 및 워크플로우 연동 추가
• HIVE 파티션 생성 기능 추가
• 설정 정보 관리 기능 통합 (ECLIPSE와 같은 스타일)
• 사용자별 쿼터 설정 및 권한 추가

• HADOOP 2 지원 추가
• AMAZON EMR 지원을 위한 테스트
• RACKSPACE의 HADOOP PLATFORM 지원
라이선스 정책
• UI는 EXTJS를 이용하므로 GPL 라이선스를 적용 (APACHE 라이선스로
전환하기 위한 의사결정을 추후 진행할 예정)
• 서버 애플리케이션을 구성하는 모든 자바 코드는 APACHE 라이센스
FLAMINGO 프로젝트 관련 정보
• 배포판 다운로드
HTTP://SOURCEFORGE.NET/PROJECTS/HADOOP-MANAGER
• 위키
HTTP://WIKI.OPENCLOUDENGINE.ORG/PAGES/VIEWPAGE.ACTION
?PAGEID=819205
• 이슈 관리 HTTP://JIRA.OPENCLOUDENGINE.ORG
• 빌드 서버 HTTP://BUILD.OPENCLOUDENGINE.ORG
감사합니다.

More Related Content

Viewers also liked

Johnstown Pa Defense Hub
Johnstown   Pa Defense HubJohnstown   Pa Defense Hub
Johnstown Pa Defense HubBob Shark
 
Uye Cekim Degerlendirmesi
Uye Cekim DegerlendirmesiUye Cekim Degerlendirmesi
Uye Cekim DegerlendirmesiSamet Tuna
 
F Business Presentatie 180609 Final
F Business Presentatie 180609 FinalF Business Presentatie 180609 Final
F Business Presentatie 180609 FinalPatrick Terranea
 
#IgNiteTH Keynote by iannnnn
#IgNiteTH Keynote by iannnnn#IgNiteTH Keynote by iannnnn
#IgNiteTH Keynote by iannnnniannnnn
 
Kenenisa
KenenisaKenenisa
Kenenisargana
 
20100812 Comfi Web Presentation
20100812 Comfi Web Presentation20100812 Comfi Web Presentation
20100812 Comfi Web PresentationGunther De Backer
 
Web Configurator
Web ConfiguratorWeb Configurator
Web Configuratormikuzz
 
Social media analysis for toronto 2010 mayoral election
Social media analysis for toronto 2010 mayoral electionSocial media analysis for toronto 2010 mayoral election
Social media analysis for toronto 2010 mayoral electionPatrick Gladney
 
Outsourcing to India Publication IJAS 2010
Outsourcing to India Publication IJAS 2010Outsourcing to India Publication IJAS 2010
Outsourcing to India Publication IJAS 2010Debopriyo Roy
 
Rims Metal and Mining Session talk by F+C Oboni, Riskope
Rims Metal and Mining Session talk by F+C Oboni, RiskopeRims Metal and Mining Session talk by F+C Oboni, Riskope
Rims Metal and Mining Session talk by F+C Oboni, RiskopeOboni Riskope Associates Inc.
 
Financiranje malih in srednjih podjetij
Financiranje malih in srednjih podjetijFinanciranje malih in srednjih podjetij
Financiranje malih in srednjih podjetijDamjana Kocjanc
 
Wight session 5 digital presentation
Wight session 5 digital presentationWight session 5 digital presentation
Wight session 5 digital presentationmrswight
 
Ivi master class path to commercialization for csu exec ed mba in kazan
Ivi master class path to commercialization for csu exec ed mba in kazanIvi master class path to commercialization for csu exec ed mba in kazan
Ivi master class path to commercialization for csu exec ed mba in kazanThomas Nastas
 

Viewers also liked (19)

Earth Day
Earth DayEarth Day
Earth Day
 
Johnstown Pa Defense Hub
Johnstown   Pa Defense HubJohnstown   Pa Defense Hub
Johnstown Pa Defense Hub
 
Uye Cekim Degerlendirmesi
Uye Cekim DegerlendirmesiUye Cekim Degerlendirmesi
Uye Cekim Degerlendirmesi
 
F Business Presentatie 180609 Final
F Business Presentatie 180609 FinalF Business Presentatie 180609 Final
F Business Presentatie 180609 Final
 
#IgNiteTH Keynote by iannnnn
#IgNiteTH Keynote by iannnnn#IgNiteTH Keynote by iannnnn
#IgNiteTH Keynote by iannnnn
 
Kenenisa
KenenisaKenenisa
Kenenisa
 
Tennessee Ballot
Tennessee BallotTennessee Ballot
Tennessee Ballot
 
20100812 Comfi Web Presentation
20100812 Comfi Web Presentation20100812 Comfi Web Presentation
20100812 Comfi Web Presentation
 
The colorfulfriends
The colorfulfriendsThe colorfulfriends
The colorfulfriends
 
Web Configurator
Web ConfiguratorWeb Configurator
Web Configurator
 
Social media analysis for toronto 2010 mayoral election
Social media analysis for toronto 2010 mayoral electionSocial media analysis for toronto 2010 mayoral election
Social media analysis for toronto 2010 mayoral election
 
Free Software
Free SoftwareFree Software
Free Software
 
Generation Myth
Generation MythGeneration Myth
Generation Myth
 
Zas
ZasZas
Zas
 
Outsourcing to India Publication IJAS 2010
Outsourcing to India Publication IJAS 2010Outsourcing to India Publication IJAS 2010
Outsourcing to India Publication IJAS 2010
 
Rims Metal and Mining Session talk by F+C Oboni, Riskope
Rims Metal and Mining Session talk by F+C Oboni, RiskopeRims Metal and Mining Session talk by F+C Oboni, Riskope
Rims Metal and Mining Session talk by F+C Oboni, Riskope
 
Financiranje malih in srednjih podjetij
Financiranje malih in srednjih podjetijFinanciranje malih in srednjih podjetij
Financiranje malih in srednjih podjetij
 
Wight session 5 digital presentation
Wight session 5 digital presentationWight session 5 digital presentation
Wight session 5 digital presentation
 
Ivi master class path to commercialization for csu exec ed mba in kazan
Ivi master class path to commercialization for csu exec ed mba in kazanIvi master class path to commercialization for csu exec ed mba in kazan
Ivi master class path to commercialization for csu exec ed mba in kazan
 

Similar to 제14회 JCO Presentation - Build Your Big Data Platform

OpenSource Big Data Platform : Flamingo Project
OpenSource Big Data Platform : Flamingo ProjectOpenSource Big Data Platform : Flamingo Project
OpenSource Big Data Platform : Flamingo ProjectBYOUNG GON KIM
 
OpenSource Big Data Platform - Flamingo v7
OpenSource Big Data Platform - Flamingo v7OpenSource Big Data Platform - Flamingo v7
OpenSource Big Data Platform - Flamingo v7BYOUNG GON KIM
 
OpenSource Big Data Platform - Flamingo 소개와 활용
OpenSource Big Data Platform - Flamingo 소개와 활용OpenSource Big Data Platform - Flamingo 소개와 활용
OpenSource Big Data Platform - Flamingo 소개와 활용BYOUNG GON KIM
 
회사에서 새로운 기술_적용하기
회사에서 새로운 기술_적용하기회사에서 새로운 기술_적용하기
회사에서 새로운 기술_적용하기Dexter Jung
 
Droid knights 2019 - (Large-scale App을 위한) Android Architecture 총정리
Droid knights 2019 - (Large-scale App을 위한) Android Architecture 총정리Droid knights 2019 - (Large-scale App을 위한) Android Architecture 총정리
Droid knights 2019 - (Large-scale App을 위한) Android Architecture 총정리Sa-ryong Kang
 
Joget Workflow 오픈 소스 워크플로우 애플리케이션 빌더 - 도입부
Joget Workflow 오픈 소스 워크플로우 애플리케이션 빌더 - 도입부Joget Workflow 오픈 소스 워크플로우 애플리케이션 빌더 - 도입부
Joget Workflow 오픈 소스 워크플로우 애플리케이션 빌더 - 도입부Joget Workflow
 
서버학개론(백엔드 서버 개발자를 위한)
서버학개론(백엔드 서버 개발자를 위한)서버학개론(백엔드 서버 개발자를 위한)
서버학개론(백엔드 서버 개발자를 위한)수보 김
 
예비 개발자를 위한 소프트웨어 세상 이야기
예비 개발자를 위한 소프트웨어 세상 이야기예비 개발자를 위한 소프트웨어 세상 이야기
예비 개발자를 위한 소프트웨어 세상 이야기수보 김
 
[Ankus Open Source Conference 2013] Introduction to ankus integration tool (f...
[Ankus Open Source Conference 2013] Introduction to ankus integration tool (f...[Ankus Open Source Conference 2013] Introduction to ankus integration tool (f...
[Ankus Open Source Conference 2013] Introduction to ankus integration tool (f...SuHyun Jeon
 
HTML5 스펙 소개
HTML5 스펙 소개HTML5 스펙 소개
HTML5 스펙 소개Toby Yun
 
141118 최창원 웹크롤러제작
141118 최창원 웹크롤러제작141118 최창원 웹크롤러제작
141118 최창원 웹크롤러제작Changwon Choe
 
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)Treasure Data, Inc.
 
태블로 소프트웨어(Tableau Software) 소개
태블로 소프트웨어(Tableau Software) 소개태블로 소프트웨어(Tableau Software) 소개
태블로 소프트웨어(Tableau Software) 소개HT Kim
 
기술적 변화를 이끌어가기
기술적 변화를 이끌어가기기술적 변화를 이끌어가기
기술적 변화를 이끌어가기Jaewoo Ahn
 
100% Serverless big data scale production Deep Learning System
100% Serverless big data scale production Deep Learning System100% Serverless big data scale production Deep Learning System
100% Serverless big data scale production Deep Learning Systemhoondong kim
 
UI/UX 개선을 위한 빠른 프로토타이핑
UI/UX 개선을 위한 빠른 프로토타이핑UI/UX 개선을 위한 빠른 프로토타이핑
UI/UX 개선을 위한 빠른 프로토타이핑Dongsik Yang
 
HashiTalk 2021 - Terraform 도입과 파이프라인 구축 및 운영
HashiTalk 2021 - Terraform 도입과 파이프라인 구축 및 운영HashiTalk 2021 - Terraform 도입과 파이프라인 구축 및 운영
HashiTalk 2021 - Terraform 도입과 파이프라인 구축 및 운영JooHyung Kim
 
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개Gruter
 
Open standard open cloud engine (3)
Open standard open cloud engine (3)Open standard open cloud engine (3)
Open standard open cloud engine (3)uEngine Solutions
 

Similar to 제14회 JCO Presentation - Build Your Big Data Platform (20)

Flamingo project v4
Flamingo project v4Flamingo project v4
Flamingo project v4
 
OpenSource Big Data Platform : Flamingo Project
OpenSource Big Data Platform : Flamingo ProjectOpenSource Big Data Platform : Flamingo Project
OpenSource Big Data Platform : Flamingo Project
 
OpenSource Big Data Platform - Flamingo v7
OpenSource Big Data Platform - Flamingo v7OpenSource Big Data Platform - Flamingo v7
OpenSource Big Data Platform - Flamingo v7
 
OpenSource Big Data Platform - Flamingo 소개와 활용
OpenSource Big Data Platform - Flamingo 소개와 활용OpenSource Big Data Platform - Flamingo 소개와 활용
OpenSource Big Data Platform - Flamingo 소개와 활용
 
회사에서 새로운 기술_적용하기
회사에서 새로운 기술_적용하기회사에서 새로운 기술_적용하기
회사에서 새로운 기술_적용하기
 
Droid knights 2019 - (Large-scale App을 위한) Android Architecture 총정리
Droid knights 2019 - (Large-scale App을 위한) Android Architecture 총정리Droid knights 2019 - (Large-scale App을 위한) Android Architecture 총정리
Droid knights 2019 - (Large-scale App을 위한) Android Architecture 총정리
 
Joget Workflow 오픈 소스 워크플로우 애플리케이션 빌더 - 도입부
Joget Workflow 오픈 소스 워크플로우 애플리케이션 빌더 - 도입부Joget Workflow 오픈 소스 워크플로우 애플리케이션 빌더 - 도입부
Joget Workflow 오픈 소스 워크플로우 애플리케이션 빌더 - 도입부
 
서버학개론(백엔드 서버 개발자를 위한)
서버학개론(백엔드 서버 개발자를 위한)서버학개론(백엔드 서버 개발자를 위한)
서버학개론(백엔드 서버 개발자를 위한)
 
예비 개발자를 위한 소프트웨어 세상 이야기
예비 개발자를 위한 소프트웨어 세상 이야기예비 개발자를 위한 소프트웨어 세상 이야기
예비 개발자를 위한 소프트웨어 세상 이야기
 
[Ankus Open Source Conference 2013] Introduction to ankus integration tool (f...
[Ankus Open Source Conference 2013] Introduction to ankus integration tool (f...[Ankus Open Source Conference 2013] Introduction to ankus integration tool (f...
[Ankus Open Source Conference 2013] Introduction to ankus integration tool (f...
 
HTML5 스펙 소개
HTML5 스펙 소개HTML5 스펙 소개
HTML5 스펙 소개
 
141118 최창원 웹크롤러제작
141118 최창원 웹크롤러제작141118 최창원 웹크롤러제작
141118 최창원 웹크롤러제작
 
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
 
태블로 소프트웨어(Tableau Software) 소개
태블로 소프트웨어(Tableau Software) 소개태블로 소프트웨어(Tableau Software) 소개
태블로 소프트웨어(Tableau Software) 소개
 
기술적 변화를 이끌어가기
기술적 변화를 이끌어가기기술적 변화를 이끌어가기
기술적 변화를 이끌어가기
 
100% Serverless big data scale production Deep Learning System
100% Serverless big data scale production Deep Learning System100% Serverless big data scale production Deep Learning System
100% Serverless big data scale production Deep Learning System
 
UI/UX 개선을 위한 빠른 프로토타이핑
UI/UX 개선을 위한 빠른 프로토타이핑UI/UX 개선을 위한 빠른 프로토타이핑
UI/UX 개선을 위한 빠른 프로토타이핑
 
HashiTalk 2021 - Terraform 도입과 파이프라인 구축 및 운영
HashiTalk 2021 - Terraform 도입과 파이프라인 구축 및 운영HashiTalk 2021 - Terraform 도입과 파이프라인 구축 및 운영
HashiTalk 2021 - Terraform 도입과 파이프라인 구축 및 운영
 
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
 
Open standard open cloud engine (3)
Open standard open cloud engine (3)Open standard open cloud engine (3)
Open standard open cloud engine (3)
 

제14회 JCO Presentation - Build Your Big Data Platform

  • 1. 빅 데이터 플랫폼? 이것만 하면 80%는 구축할수 있다!
  • 2. 빅 데이터 플랫폼? 이 놈의 실체는?
  • 3. 내가 만약 빅 데이터 플랫폼 부서의 책임자라면 무엇을 제공할 것인가?
  • 4. 빅 데이터 플랫폼 책임자에게 듣는 흔한 질문 • 빅 데이터가 기존의 DW랑 차이가 뭐가 있는지 모르겠습니다. • 단위 데이터만 봐서는 큰 데이터가 없습니다. 사업의 타당성을 만들수 가 없습니다. 어떻게 해야 하나요? • A라는 데이터가 있는데 그것으로 뭘 해야할까요? • 다른 회사는 뭐 한답니까? 혹시 동종업계 비슷한 사례가 있나요? • 빅 데이터 플랫폼을 만들라는데 이놈이 뭐를 하는 놈인지 모르겠습니 다.
  • 5. 빅 데이터 플랫폼의 역할에 대한 고민 • 빅 데이터 플랫폼에서 하고자 하는 주요 업무는 무엇인가? • 이 플랫폼에서 누가 무슨일을 하는가? • 나는 운영자인가 개발자인가 분석가인가? • 다른 회사는 뭐 한답니까? 혹시 동종업계 비슷한 사례가 있나요? • 빅 데이터 플랫폼을 만들라는데 이놈이 뭐를 하는 놈인지 모르겠습니 다.
  • 6. 빅 데이터 플랫폼이 제공해야 하는 것 SOFTWARE STACK
  • 7. 빅 데이터 플랫폼이 제공해야 하는 것 INFRA MANAGEMENT MONITORING
  • 8. 빅 데이터 플랫폼이 제공해야 하는 것 WORKFLOW
  • 9. 빅 데이터 플랫폼이 제공해야 하는 것 분석 및 시각화 환경
  • 10. 빅 데이터 플랫폼이 제공해야 하는 것 • ACCESS • AUTHENTICATIO N • AUTHORIZATION • ENCRYPTION • AUDITING • POLICY SECURITY
  • 11. 빅 데이터 플랫폼이 제공해야 하는 것 DASHBOARD
  • 12. 빅 데이터 플랫폼이 제공해야 하는 것 • 배치 작업 관리와 작업 모니터링 • 병렬 분석 프로그램 • 사용자의 주요 행동에 대한 모니터링 • 리소스에 대한 각종 접근 통제 정책들… • 인프라에 대한 접근성을 뛰어나게 하는 다양한 방법들…
  • 14. 하지만 우리는 모든 것을 원하지 않아요… • 현장의 요구사항을 최대한 반영할 수 있는 통합된 환경을 제공해줬으 면 좋겠습니다. • HADOOP ECOSYSTEM을 그대로 사용할 수 있으면 좋겠습니다. • 사용자의 업무 패턴과 사용 패턴을 고려했으면 좋겠습니다. • 현재 나와있는 것들과 충돌이 나거나 동일한 기능을 제공하는 것은 지 양합니다. • 인프라 고민 하지 않고 만들고 활용하는데 집중했으면 좋겠습니다. • 하지만 쉬워야 합니다. 그리고 오픈소스여야 합니다.
  • 16. FLAMINGO의 통합 환경 • 사용자는 작업 공간 내에서 자유롭게 이동하면서 작업을 할 수 있도록 구성 • EXTJS의 DESKTOP APPLICATION을 MVC 구조에 맞춰서 최적화 • 각 화면은 최대한 독립 개발이 가능하도록 분리하여 구성 • 재사용 가능한 것은 컴포넌트화여 코드 작성을 최소화 • 누구나 추가할 수 있도록 최대한 구조를 단순화하고 대중적인 프레임 워크를 사용 • 개발 방법도 모두 표준화 (도구, 절차, 매뉴얼, 환경 등등)
  • 17. FLAMINGO를 구성하는 오픈소스 프레임워크 • SPRING FRAMEWORK 4 • MYBATIS 3 • EXTJS 4 • APACHE TOMCAT 7 • OPENGRAPH 1 (자체 개발) • (ANY) APACHE HADOOP, APACHE PIG, APACHE HIVE
  • 19. FLAMINGO TEAM의 개발 원칙 • 우리는 커뮤니케이션 비용을 최소화하기 위해서 예외를 두 지 않음 (모든 방법은 표준화를 통해 간소화함) • 기반이 되는 것은 모두 직접 개발함 • 남이 이미 만든 것은 개발하지 않고 의존하지 않음 (사용자 가 알아서 사용하는 것임) • 철저하게 현장에서 필요로 하는 기능을 개발함 • 사용자의 러닝커브를 최소화하고 효율성을 극대화함
  • 20. FLAMINGO의 소스코드 구조 UI 구조는 직관적 EXTJS의 JAVASCRIPT는 340여개
  • 22. FLAMINGO의 워크플로우 디자이너 • 기 개발한 MAPREDUCE를 그대로 통합할 수 있어야 함 • 개발자가 개발한 MAPREDUCE를 디자이너에 통합하는데 가이드를 따르는 경우 30분 이내 추가할 수 있어야 함 • DIRECT ACYCLIC GRAPH(DAG) 기반 • 각 노드의 정보가 상호 연계하여 동작 • 동작에 대한 코드는 0%, 메타데이터 설정만으로 동작 방식 을 변경 (유지보수 최소화를 추구)
  • 24. FLAMINGO의 파일 시스템 관리 • APACHE HADOOP의 HDFS를 관리하는 메인 화면 • 사용자는 디렉토리/파일을 관리 • 파일 업로드 및 다운로드 가능 • 디렉토리의 내용을 즉시 데이터베이스화 하여 조회 • HIVE METASTORE 연동하여 동작
  • 32. FLAMINGO의 향후 마일스톤 • 데이터 전처리 모듈, 추론 엔진 등을 디자이너에 추가할 예정 • JOB TRACKER 기능 추가 및 워크플로우 연동 추가 • HIVE 파티션 생성 기능 추가 • 설정 정보 관리 기능 통합 (ECLIPSE와 같은 스타일) • 사용자별 쿼터 설정 및 권한 추가 • HADOOP 2 지원 추가 • AMAZON EMR 지원을 위한 테스트 • RACKSPACE의 HADOOP PLATFORM 지원
  • 33. 라이선스 정책 • UI는 EXTJS를 이용하므로 GPL 라이선스를 적용 (APACHE 라이선스로 전환하기 위한 의사결정을 추후 진행할 예정) • 서버 애플리케이션을 구성하는 모든 자바 코드는 APACHE 라이센스
  • 34. FLAMINGO 프로젝트 관련 정보 • 배포판 다운로드 HTTP://SOURCEFORGE.NET/PROJECTS/HADOOP-MANAGER • 위키 HTTP://WIKI.OPENCLOUDENGINE.ORG/PAGES/VIEWPAGE.ACTION ?PAGEID=819205 • 이슈 관리 HTTP://JIRA.OPENCLOUDENGINE.ORG • 빌드 서버 HTTP://BUILD.OPENCLOUDENGINE.ORG