This document discusses using Bayesian networks for predictive analysis and machine learning perspectives on data utilization. It provides an example of using Bayesian networks to accurately predict incident clearance time based on variables like type of incident, number of police/ambulance vehicles, number of injuries, and number of vehicles involved. The document also discusses applying Bayesian networks by collecting current situation data as evidence to perform inference on a constructed inference model.
The document discusses data visualization trends in Korea. It covers factors accelerating data visualization like open source technologies and big data investments. It also outlines major players in the data visualization market like Tableau and Splunk, and their focus on industries like healthcare, retail and location analytics. Key technologies enabling data visualization are also mentioned.
대형 병원의 교양 세미나에서 발표한 자료입니다.
이미 기술 지식은 충분하셨고 사례를 많이 궁금해 하셨습니다. 그래서 제 경험을 통해 얻었던 인사이트를 많이 나누었습니다. 하지만 의료현장은 플랫폼이나 기술보다는 의료기기로 접근하지 않으면 사용되기 힘들다는 생각이 들었습니다.
2014년은 사물인터넷으로 시작해서 사물인터넷으로 끝날만큼 사물인터넷에 대한 다양한 논의가 진행되었던 한해였던것 같습니다. 그러나, 겉으로 드러난 모습은 사물인터넷으로 포장된 다양한 커넥티드 디바이스들과 몇몇 사물인터넷 플랫폼이 출시되는 수준이었습니다. 제대로 된 사물인터넷 서비스는 눈을 씻고 찾으려 해도 찾아볼 수 없는 것이 현실이었죠. 그래서, 사물인터넷 컨셉을 바탕으로 하는 서비스 어프로치에 대해서 3개의 카테고리 8개 어프로치로 구분하여 정리했습니다. 아직까지 생각을 정리하는 중이기는 하지만, 사물인터넷 비즈니스를 준비하시는 분들에게 도움이 되었으면 하는 마음에 자료를 공유합니다. 본 자료는 2014년 12월 11일 저녁 7시부터 9시 사이에 IoT혁신센터에서 발표한 자료임을 말씀드립니다.
This document discusses using Bayesian networks for predictive analysis and machine learning perspectives on data utilization. It provides an example of using Bayesian networks to accurately predict incident clearance time based on variables like type of incident, number of police/ambulance vehicles, number of injuries, and number of vehicles involved. The document also discusses applying Bayesian networks by collecting current situation data as evidence to perform inference on a constructed inference model.
The document discusses data visualization trends in Korea. It covers factors accelerating data visualization like open source technologies and big data investments. It also outlines major players in the data visualization market like Tableau and Splunk, and their focus on industries like healthcare, retail and location analytics. Key technologies enabling data visualization are also mentioned.
대형 병원의 교양 세미나에서 발표한 자료입니다.
이미 기술 지식은 충분하셨고 사례를 많이 궁금해 하셨습니다. 그래서 제 경험을 통해 얻었던 인사이트를 많이 나누었습니다. 하지만 의료현장은 플랫폼이나 기술보다는 의료기기로 접근하지 않으면 사용되기 힘들다는 생각이 들었습니다.
2014년은 사물인터넷으로 시작해서 사물인터넷으로 끝날만큼 사물인터넷에 대한 다양한 논의가 진행되었던 한해였던것 같습니다. 그러나, 겉으로 드러난 모습은 사물인터넷으로 포장된 다양한 커넥티드 디바이스들과 몇몇 사물인터넷 플랫폼이 출시되는 수준이었습니다. 제대로 된 사물인터넷 서비스는 눈을 씻고 찾으려 해도 찾아볼 수 없는 것이 현실이었죠. 그래서, 사물인터넷 컨셉을 바탕으로 하는 서비스 어프로치에 대해서 3개의 카테고리 8개 어프로치로 구분하여 정리했습니다. 아직까지 생각을 정리하는 중이기는 하지만, 사물인터넷 비즈니스를 준비하시는 분들에게 도움이 되었으면 하는 마음에 자료를 공유합니다. 본 자료는 2014년 12월 11일 저녁 7시부터 9시 사이에 IoT혁신센터에서 발표한 자료임을 말씀드립니다.
Structures of Twitter Crowds and Conversations Six distinct types of crowds t...datasciencekorea
There are six distinct types of crowds that form on Twitter based on the shape of connections between users discussing a topic:
1) Polarized crowds have sharply divided subgroups.
2) Community crowds consist of tightly interconnected groups.
3) Brand crowds form around corporate/organization topics.
4) Bazaar crowds bring together various interested parties.
5) Broadcast crowds have a central influencer and surrounding audiences/communities.
6) Support crowds assist and provide feedback to companies.
The Emergent Mind of City (EMC) project aims to visualize the "qualia landscapes" or collective emotions that emerge from people's subjective perspectives on a city. It does this by creating virtual "mind neurons" that map connections between news, emotions, and images related to topics of public interest. The project was inspired by Leonardo da Vinci's conception of an organic, hygienic city and seeks to bridge divisions between individual and group perspectives, as well as across disciplines.
This document discusses data-centric education and learning. It begins by outlining past and present technologies used in education. It then discusses how data-centric learning is enabled by devices that connect to the cloud and collect real-time student data. This data can provide adaptive instruction, feedback, and insights into learning processes. Examples are given of social network analysis and predictive analytics projects using large educational datasets. Finally, frameworks for designing data-driven learning environments and strategies to improve performance are presented. The conclusion emphasizes using data and analytics responsibly and strategically to improve education.
The document discusses the benefits of a data-centric approach to science and research. Some key points include:
- Data can now be easily and quickly shared and moved, allowing for open collaboration across disciplines.
- With many computational tools available, data has a high potential for adding value when analyzed and explored from different perspectives.
- However, challenges remain around dealing with diverse and siloed data from different sources and domains.
- Linking and relating data across layers and disciplines is important for data-centric science to reach its full potential.
Studying Social Selection vs Social Influence in Virtual Financial Communitiesdatasciencekorea
This document summarizes research studying social selection versus social influence in virtual financial communities. Stochastic actor-oriented models were used to analyze panel data from an advice network in an Australian virtual financial community. The results show that individuals' contribution behavior influences the advice network structure over time, but the network structure also influences individuals' contribution behavior, indicating both selection and influence effects. Specifically, highly contributing individuals are more likely to be sought for advice, and individuals adjust their contribution levels based on the number of advice ties they receive.
International Collaboration Networks in the Emerging (Big) Data Sciencedatasciencekorea
This document summarizes research on international collaboration networks in emerging big data science. It finds that while global scientific collaboration is widespread, collaboration specifically in big data research is still relatively limited. The United States, Germany, United Kingdom, France, and other developed countries form the most central hubs in the big data collaboration network. The study aims to build on previous descriptive analyses by applying social network analysis and examining collaboration patterns and trends over time.
Analyzing Big Data to Discover Honest Signals of Innovationdatasciencekorea
The document discusses communication styles that are effective for creativity and innovation. It identifies three types of collaborative networks - a collaborative interest network, learning network, and innovation network - which differ in their degree of sharing, interactivity, and connectivity. The most effective communicators achieve a balance of personal and community aspects. The document also includes several charts and graphs analyzing aspects of communication and collaboration such as leadership styles, customer satisfaction, and emotional tone.
A Unified Music Recommender System Using Listening Habits and Semantics of Tagsdatasciencekorea
The document describes a unified music recommendation system that combines users' listening habits and semantics of tags. It proposes generating three types of user profiles: listening habits-based, tag-based, and a hybrid approach. A tag and emotion ontology are used to preprocess tags and assign weights. A music recommendation algorithm finds similar users and calculates item scores. An evaluation of the approaches found the hybrid method achieved the best precision and recall based on F-measure, outperforming listening habits only or tag-based recommendations. Statistical analysis confirmed the hybrid approach performed significantly better.
4.
도시가계가 일상생활을 영위하기 위해 구입하는
상품가격과 서비스 요금의 변동을 종합적으로 측
정하기 위해 작성하는 지수
2010년을 기준(=100)으로 가계소비지출에서 차
지하는 비중이 1/10,000 이상인 품목 481개를
대상으로 작성
5년 단위 품목 및 기준 재설정
5.
데이터 모델을 온라인상으로 한정하여 CPI와 같이
물가지수를 산정
구글물가지수(Google Price Index)
◦ 2013.10 전미실물경제협회(NABE) 콘퍼런스
BPP(Billion Price Project)
◦ MIT의 물가지수 프로젝트
◦ 국가별 대표적인 온라인 마트의 가격 동향 조사결과를 지
수화
6. 소비자의 구매 패턴 변화 반영이 어려움
생활비 추가 지출분에 대한 물가지수 반영이 어려움
물가지수 분석의 신속성과 예측이 어려움
7. 시간적
측면
• web crawling 이용하여 빠른 시간 내에 대
용량 데이터 수집
비용
측면
• 온라인에서 판매되는 상품의 가격 정보를 기
계적으로 수집하기 때문에 비용절감
기술의
진보
• 대용량 수집/저장/분석 및 변동된 가격 정보
를 자동 추출하는 기술 자동화
8. 한국형 BPP
MIT
- 전세계적으로 물가지수 조사
- 국가별 대표적인 온라인 마
켓을 대상으로 조사
- 특정 품목에 한정
MBPP
- Modified BPP
- 온라인 마켓의 특성 응
용
한국형
- CPI 조사 품목에 대해 전반
적인 조사 가능
- 국내 온라인 마켓을 전수 조
사
- 많이 팔리는 품목에 가
중치를 두는 방식
9.
일반 소비자가 느끼는 물가에 대한 감성적 지수
“싸다”, ”비싸다”에 대한 의견으로 소비자가 체감하는 느
낌에 대한 평가 지수
주관적 기준이며, 절대적인 평가기준은 없음
집단지성처럼 많은 통계치가 모였을 때 의미를 가짐
11. 개별 품목 지수
품목 물가지수
(기준시점부터 현재시점까지)
BPP 물가지수
산출
시점 t에서의 품목 레벨 지수.
Jevons Index
품목 내 가중치가
없는 기하평균 품목지수
Chain Index
기준시점부터 현재시점까지
계산된 개별 품목지수의 곱으로
기준시점 기준 지수.
Supermarket Index
산술 가중 평균을 이용한
최종 BPP물가지수
29.
과연 팔리는 물건인가?
◦ 온라인 업체의 판매량 및 품목에 대한 조사 필요
매일 전수조사가 가능한가?
◦ 네이버 지식쇼핑 건수 : 1억건 이상
온라인상으로 수집하지 못하는 품목은?
◦ 지역별 버스요금 등
잘못된 가격정보 게시
◦ 부정확한 전국 주요소별 가격 정보 등
31.
BPP 효용성
◦ 국가별 CPI와 비교시 추세가 아주 유사함
◦ 특정 국가는 CPI가 BPP대비 월등히 낮게 발표되고 있음
CPI 비교
◦ 대체수단으로서의 BPP는 더 연구가 필요함
◦ BPP가 추세적으로 유사한 경우 활용성이 있을 것으로 예
상
◦ CPI의 보조지표로 BPP 활용 가능
32.
물가는 지역별로 차이가 있음
지역 고려 시 온라인 물가지수 문제점
◦ 대부분의 온라인 사이트는 전국단위로 구성됨
온라인화 되어 있는 지역별 재래시장 및 도소매 시
장 가격 추적 필요