kor ver. [Abstract] 고객맞춤형 여행사이트(Front-Back-End / Bigdata 역량) 아키텍쳐 : Linux(CentOs) -> Java -> JSP -> Mysql-> Hadoop -> R -> Output 목적 - 여행상품을 관리자에게 사용자가 원하는 정보를 입력하고 신청하여 그 정보(데이터)를 관리자가 그에 맞는 여행사 패키지상품을 제공 하도록 홈페이지를 만들고 로그데이터로 소비자성향을 분석하는 프로젝트 였습니다. 1. 고객 맞춤형 여행추천 사이트 제작 2. 반응형 웹사이트 구현 3. 데이터베이스 활용 및 비정형 데이터(액세스 로그) 분석 4. 분산파일시스템 Hadoop 활용 5. 실시간 통계 및 인사이트 도출 [Method & Process] 본 프로젝트는 사용자 중심의 tour 홈페이지를 만들어 여러 소프트웨어 툴과 기반을 응용하여 설계부터 실행단계까지의 과정을 거쳐 프로젝트를 진행하였습니다. Customer-Centered Tour 라는 주제를 정하여 여행상품을 관리자에게 사용자가 원하는 정보를 입력하고 신청하여 그 정보(데이터)를 관리자가 그에 맞는 여행사 패키지상품을 제공 하도록 설계하였습니다. MVC모델을 기점으로 환경설정 프로그램, 소프트웨어, 분석틀을 이용하여 프로젝트를 연구 및 진행하였으며, Customer-Based Tour 홈페이지를 설계하여 소프트웨어 중심으로 JAVA와 같은 객체지향언어와 관계형 데이터베이스(Oracle11g)의 환경설정이나 (Linux) 소프트웨어를 연동하여 분석틀로 데이터를 분석하는 프로그래밍(R, 하둡)을 이용하여 입출력 된 데이터를 분석하여 프로젝트를 완료하였습니. 각 프로그램과 애플리케이션툴을 소개하고 응용 및 연구진행절차를 작성하였습니다. Customer Mode 사용자가 메인 페이지(index)를 기점으로 회원가입 페이지를 통해 아이디를 만들어 회원인증을 하여 Customer mode로 접속합니다. Customer Mode에서는 홈페이지 상위에 더 많은 카테고리를 찾을 수 있습니다. 또한 메인 페이지 하단에서 사용자가 원하는 각 나라별 여행지를 클릭하여 다음페이지인 나라별상세정보를 볼 수 있음과 동시에 패키지상품을 신청할 수 있는 페이지로 가도록 링크를 설계하였습니다. 또한 사용자는 홈페이지에서 제공하는 여행지 통계를 각 나라별, 테마별, 계졀별, 연령별로 볼 수 있도록 제공됩니다. Administrator Mode 패키지상품을 등록하면 그 정보가 관리자(Administrator)에게 로그데이터가 입력되고 여행사별 패키지상품과 사용자(Customer Mode)에게 연결을 하여 다시 사용자에게 보내줍니다. 관리자는 VIP고객정보, 회원관리 등을 위한 페이지와 R과 하둡을 통해 분석한 통계자료를 위한 페이지 등을 확인 할 수 있습니다. [Results & discussions] [한계] 웹어플리케이션 관련 하여서는 사용자 동시 접속은 로그인 상태를 유지하고 있는 세션(session)의 갯수를 측정하는 것입니다. 하지만 웹서비스는 사용자가 로그아웃한 시점을 파악하기는 어려웠으며 서버의 지원 상황(메모리,CPU,네트워크)에 따라 성능 편차(오차)가 발생하였습니다.순간 처리량으로 서버의 모든 성능을 평가할 수 없다는 결론이 나왔습니다. 성능평가 사용자 입장에서는 서버 응답시간이 짧을수록 좋음 서버가 아무리 빠르더라도 서버와 사용자 사이에는 네트워크 회선이 존재하기 때문에 지연 시간(latency time)이 발생할 수 밖에 없음. 서버 설계 및 관리자 입장에서는 서버 중단(halt)가 가장 큰 문제가 될 수 있다. 사용자의 최적한 서비스 경험을 위한 "짧은 응답 시간(short response time)" 과 서버의 안정적인 운영을 위한 "적절한 처리량(proper throughtput)"이 성능지표의 가장 큰 기준이 된다고 할 수 있다. [역량] 본 프로젝트로부터 빅데이터를 이용한 다양한 분석 역량 및 시스템 구축역량을 습득한 후 기존시스템에서 발생한 다량의 데이터를 활용하여 여러 분야의 비즈니스가 진행될 수 있음을 알게되었습니다. 리눅스 OS/기본지식습득으로는 현업에서 애용하는 리눅스를 개별 PC에 설치/활용하여 대형시스템 운영능력을 습득하고 리눅스 OS기반의 프로그램 개발 능력 및 SQL 사용 능력을 습득하였습니다. 빅데이터 시스템과 응용 애플리케이션 연동으로는 빅데이터 환경에서 분석된 자료를 WebApplication 및 다양한 Application 과의 연동을 통해 분석 자료 Visualization 기술을 습득하였습니다. 빅데이터 시스템 구축/ 다양한 빅데이터 분석 역량 습득하였습니다. 빅데이터 환경을 위한 하둡 시스템 구축과 그에 연관된 하둡에코 시스템을 구축 하고 다양한 현업에서 필요로 하는 분석전문가가 되기 위해 빅데이터 분석 기법/전략 실습을 진행하였습니다. [Conclusion] 본 프로젝트와 같이 홈페이지를 개설, 운영 및 유지하는 과정과 더불어 실시로 분석하는 과정을 통하여 통합적이고 끊김 없는 관리자-소비자 체인의 브랜드 관계 형성을 보다 용이하게 할 수 있다. 왜냐하면 운영자(관리자)는 실시간 데이터로그를 통하여 소비자의 홈페이지에서 행하는 행위들을 데이터로 알 수 있기 때문이다. 여행상품이 구글과 같은 포털사이트의 알고리즘에 잘 맞춰져 검색이 잘 되도록 노력해야 하며 콘텐츠 확산성을 위한 연구 및 개발이 필요하다. 소비자들은 정보를 검색하고, 관리자는 소비자에게 정보를 제공하는 방식으로서 이 둘을 매핑하는 노력이 필요하게 될 것이며 비정형화된 데이터를 이용가능한 정형데이터로 만드는 작업을 용이하게 하여 딜레마를 최소화하여 한다.