2015년 추계멀티미디어학회 투고논문 슬라이더파일입니다
요약
본 논문은 창원시의 공용자전거 누비자의 활용성을 높이기위한 모바일 시스템의 설계와 구현에 관한 논문이다. 누비
자는 창원시가 운영하는 무인 공영자전거 대여 시스템으로 247곳의 무인대여 터미널을 이용하여 일일 평균 8,000명 이상의 사용자들이 이용하고 있다. 이러한 공영자전거 대여시스템을 모바일용으로 개발하기 위하여 공공기관에서 운영하고 있는 누비자 서버의 정보를 파싱하여 실시간으로 터미널의 사용정도와 현황을 제공하는 서비스를 구현하였다.
(오리지널 구글 프리젠테이션은 http://goo.gl/uiX2UH 에)
- 권재명 (Jaimyoung Kwon)
1. 실리콘 벨리 데이터 기업들
2. 온라인 광고 사업
3. 데이터 사이언티스트, 데이터 엔지니어, 머신러닝 사이언티스트
4. 실리콘 벨리 데이터 사이언티스트의 하루
5. 데이터 사이언스 툴채인
6. 데이터 사이언스 베스트 프랙티스
7. 데이터 사이언스 필수 통계 개념
8. 사내 데이터 사이언스 도입
2015년 추계멀티미디어학회 투고논문 슬라이더파일입니다
요약
본 논문은 창원시의 공용자전거 누비자의 활용성을 높이기위한 모바일 시스템의 설계와 구현에 관한 논문이다. 누비
자는 창원시가 운영하는 무인 공영자전거 대여 시스템으로 247곳의 무인대여 터미널을 이용하여 일일 평균 8,000명 이상의 사용자들이 이용하고 있다. 이러한 공영자전거 대여시스템을 모바일용으로 개발하기 위하여 공공기관에서 운영하고 있는 누비자 서버의 정보를 파싱하여 실시간으로 터미널의 사용정도와 현황을 제공하는 서비스를 구현하였다.
(오리지널 구글 프리젠테이션은 http://goo.gl/uiX2UH 에)
- 권재명 (Jaimyoung Kwon)
1. 실리콘 벨리 데이터 기업들
2. 온라인 광고 사업
3. 데이터 사이언티스트, 데이터 엔지니어, 머신러닝 사이언티스트
4. 실리콘 벨리 데이터 사이언티스트의 하루
5. 데이터 사이언스 툴채인
6. 데이터 사이언스 베스트 프랙티스
7. 데이터 사이언스 필수 통계 개념
8. 사내 데이터 사이언스 도입
빅데이터 구축 및 술루션 가이드 주요 내용
- 고객 내부 빅데이터 프로젝트 진행시 단계별 진행 가이드
- 빅데이터 프로젝트 구축 타입
- 각 산업분야별로 빅데이터 엔진을 활용한 솔루션 구축 가이드
(딥 러닝 기법 기반의 분석 포함)
코세나(kosena), 이승훈 실장 admin@kosena.kr, kosena21@naver.com
010-9338-6400
We provide Business Success and Best Performance to the customers with our
“The Good Company “ which involves Initiative, expertise and passionate developers based on
Open-source SW & Cloud Technology such as Big Data (BI), Cloud(PaaS), Mobile, Web & CMS, UX
링크드인의 Big Data Recommendation Products - 어제의 데이터를 통해 내일을 예측한다Evion Kim
DEVIEW 2013 발표 내용입니다 - http://deview.kr/2013/detail.nhn?topicSeq=36
링크드인 플랫폼 상의 다양한 Recommendation Product들, 이 제품들의 키워드는 바로 'Relevance(연관성)' 입니다. 가장 관련있는 데이터들을 제공함으로써 사용자의 삶을 더 쉽고 편하게 만들어 주는것이 링크드인 데이터 팀의 목표라 할 수 있겠습니다. 그렇다면 어떻게 해야 사용자에게 가장 연관성 높은 데이터를 제공 할 수 있을까요? 이에 대한 답을 한문장으로 요약하자면 '어제의 데이터를 분석하여 내일의 사용자의 행동을 예측한다' 가 될 것 같습니다.
본 발표에서는 이 한 문장을 좀 더 길게 풀어보려 합니다. 링크드인에서는 Hadoop, Key-Value Storage, Machine Learning등의 기술을 어떤 식으로 활용하여 연관성 높은 Recommendation Product를 만들고 있는지에 대해 소개해보겠습니다.
빅데이터 구축 및 술루션 가이드 주요 내용
- 고객 내부 빅데이터 프로젝트 진행시 단계별 진행 가이드
- 빅데이터 프로젝트 구축 타입
- 각 산업분야별로 빅데이터 엔진을 활용한 솔루션 구축 가이드
(딥 러닝 기법 기반의 분석 포함)
코세나(kosena), 이승훈 실장 admin@kosena.kr, kosena21@naver.com
010-9338-6400
We provide Business Success and Best Performance to the customers with our
“The Good Company “ which involves Initiative, expertise and passionate developers based on
Open-source SW & Cloud Technology such as Big Data (BI), Cloud(PaaS), Mobile, Web & CMS, UX
링크드인의 Big Data Recommendation Products - 어제의 데이터를 통해 내일을 예측한다Evion Kim
DEVIEW 2013 발표 내용입니다 - http://deview.kr/2013/detail.nhn?topicSeq=36
링크드인 플랫폼 상의 다양한 Recommendation Product들, 이 제품들의 키워드는 바로 'Relevance(연관성)' 입니다. 가장 관련있는 데이터들을 제공함으로써 사용자의 삶을 더 쉽고 편하게 만들어 주는것이 링크드인 데이터 팀의 목표라 할 수 있겠습니다. 그렇다면 어떻게 해야 사용자에게 가장 연관성 높은 데이터를 제공 할 수 있을까요? 이에 대한 답을 한문장으로 요약하자면 '어제의 데이터를 분석하여 내일의 사용자의 행동을 예측한다' 가 될 것 같습니다.
본 발표에서는 이 한 문장을 좀 더 길게 풀어보려 합니다. 링크드인에서는 Hadoop, Key-Value Storage, Machine Learning등의 기술을 어떤 식으로 활용하여 연관성 높은 Recommendation Product를 만들고 있는지에 대해 소개해보겠습니다.
3. 선행 기술
알그레인즈 PURE:Sum
Daumsoft
소셜 미디어를 통한
사용자 감정 분석
- Konan Analytics4
- pulseK
- 국립국어원 말뭉치 구축
- 한국여성정책연구원 여성 정책
빅데이터 분석
- 심층 분석
- 속성 분석
- 모니터링
KONAN Technology
비정형 데이터 통합
분석 플랫폼
Saltlux
데이터 과학 기술을
통한 분석 서비스 제공
TIBUZZ
SNS, 커뮤니티 사이트
분석 / 시각화
- BC Social Media Analysis
- 방송사 Trend Insight Platform
- 브랜드 리포트
3
4. 관련 기술
알그레인즈 PURE:Sum
기계학습
- 학습데이터 선별
- 워드 임베딩 (Word2Vec)
- 학습 모델 생성
데이터 분석
학습 모델을 토대로
Data Set 감정 분석
Web Server 구축
- Django의 Rest Framework를 활용한
- RESTful 서비스
데이터 정형화
- BeautifulSoup을 이용한
- 웹 스크레이핑
- KoNLPy 클래스 성능 비교를 통한
형태소 분석
-
시각화
- 워드클라우드
- 누적빈도그래프
PURE:Sum
Step 01
Step 05
Step 02
Step 03
Step 04
4
5. 검색
- 키워드를 검색하거나
카테고리 이용
고성능 분석
- 카테고리에 저장된 항목들은 미리 분석된
데이터를 서버에서 불러옴
시각화
- 워드클라우드를 활용한
긍부정 비율 및 키워드 출력
- 리뷰 요약 출력
활용 방안 및 기대 효과알그레인즈 PURE:Sum
5
6. 개발 일정
알그레인즈 PURE:Sum
주요내용 1월 2월 3월 4월 5월
웹 Data 수집 ㅇ ㅇ ㅇ
형태소 분석 및 감정 식별 ㅇ ㅇ ㅇ
서버 설계 ㅇ ㅇ
Mobile Application 제작 ㅇ ㅇ
6