- 뉴스 생태계의 변화: 플랫폼, UX
- 뉴스 빅데이터의 정의: 메타, NLP, SNA
- 뉴스 빅데이터 분석: NLP, SNA
- 뉴스 빅데이터의 BM: 데이터 저널리즘, 전문가 시스템, 분석도구, 데이터 기반 서비스, CMS, 플랫폼
- 뉴스 빅데이터의 목표: Build Better World
Newspapers 26 years: the history of newspapers by visualizing 3.1 million new...Daemin Park
visualization site: http://goo.gl/I7PZdp
(powered by VISUAL DIVE & FUNEX>
- definition of news big data
- natural language processing of news articles
- news semantic network analysis
- visualization of news history
한국언론진흥재단에 대해
뉴스 미디어의 미래 디지털 및 모바일 혁신 분과에서 나온 제안 사항
1) 콘텐츠 혁신
- 포맷: 카드뉴스, 웹툰, 게임, 드론, 시각화, VR 등 새로운 뉴스 포맷 연구 및 개발 지원
- UX: 독자 분석을 위한 UX, 연결망 분석, 추천 알고리즘 등의 연구와 교육, UX 기반 서비스 연구 및 기획, 네이티브 광고 연구 및 기획
- 저널리즘 가치: 롱폼 저널리즘, 알고리즘 저널리즘, 참여 저널리즘 등 새로운 저널리즘 가치 연구
- 뉴스 빅데이터: 뉴스 빅데이터 고도화 및 활용을 위한 연구 및 시스템 서비스의 기획과 개발, 전문개발자 확충, 지능형 뉴스 검색엔진 기획, Structured journalism, 부가서비스 기획
2) 조직 혁신
- 인력: 전 직급 언론인 대상 모바일 혁신 교육 실시, 언론인 및 언론학자 맞춤형 모바일/디지털 스킬 매뉴얼 제작
- 조직: 모바일 퍼스트를 위한 인사 평가와 조직 개편 연구, 모바일 퍼스트를 위한 업무 프로세스 연구
- CMS: SaaS를 활용한 저비용/고효율 CMS 개발 지원, CMS 연계된 언론사 맞춤형 각종 플러그인 개발 및 공유, 사용자용 CMS 기획 개발
- 플랫폼: 뉴스 빅데이터 시스템을 활용한 오픈API, 오픈데이터, 오픈소스 전략 수립, 오픈플랫폼 활용 극대화를 위한 교육과 개발 협력을 위한 개발자 컨퍼런스 개최
3) 비즈니스 모델 혁신
- 광고: 네이티브 광고, 언론사 공동 광고 인벤토리 추진
- 저작권: 뉴스 빅데이터 사업을 통한 데이터 판매(B2B 영역) 방식의 저작권 사업 추진
- 부가사업: 언론사 사내 벤처 또는 언론사와 미디어 스타트업 간 협업 지원, 미디어 혁신 한정해 사내 벤처의 월급 지원, 미디어 해커톤 개최
- 투자: 개발자 컨퍼런스 개최, VC와 연결하고 기술 공유와 협업 및 투자 기회 제공
Natural language processing of News (intermediate): rule based modelDaemin Park
NLP of news in news big data analysis systems such as
1) 'NewsSource Beta' (powered by Advanced Institutes of Convergence Technology, Seoul National University)
2) 'Big kinds' (powered by Korea Press Foundation)
Toward a debating machine: A news sentence network analysis algorithm based o...Daemin Park
This research suggests news sentence network analysis algorithm based on similarity and cooccurence. News contains abundant arguments with facts and quotes those are critical to represent agendas. News sentence network is a semantic network which consists of quotes as nodes. Connectivity is defined by relevance between quotes. Relevance matrix is the sum of similarity matrix calculated by cosine similarity algorithm and cooccurence matrix. This study analyzed 949 quotes from 405 news articles and visualized networks. The results verified that semantic paths were well defined to show the sequence of sub-agendas. News semantic network analysis algorithm can provide a methodology to automatically generate a massive corpus in a sentence level as a training set to develop a debating machine.
- Big data is like teenage sex
- Structures of Big data
- News big data
- Natural language processing
- News source network
- Examples
- News big data anaysis software
- Further studies
News Semantic Network Analysis of Named EntitiesDaemin Park
News Semantic Network Analysis of Named Entities
- named entity recognition: person, organization from news
- tagging topics manually per sentences or articles
- semantic network analysis between persons and organizations
개체명 중심 뉴스 의미 연결망 분석
- 뉴스에서 인명, 기관명을 개체명 인식을 통해 추출
- 주제 태그를 부착
- 사람, 기관, 주제 간의 연결망 분석
- 단어 의미 연결망 한계 극복
Newspapers 26 years: the history of newspapers by visualizing 3.1 million new...Daemin Park
visualization site: http://goo.gl/I7PZdp
(powered by VISUAL DIVE & FUNEX>
- definition of news big data
- natural language processing of news articles
- news semantic network analysis
- visualization of news history
한국언론진흥재단에 대해
뉴스 미디어의 미래 디지털 및 모바일 혁신 분과에서 나온 제안 사항
1) 콘텐츠 혁신
- 포맷: 카드뉴스, 웹툰, 게임, 드론, 시각화, VR 등 새로운 뉴스 포맷 연구 및 개발 지원
- UX: 독자 분석을 위한 UX, 연결망 분석, 추천 알고리즘 등의 연구와 교육, UX 기반 서비스 연구 및 기획, 네이티브 광고 연구 및 기획
- 저널리즘 가치: 롱폼 저널리즘, 알고리즘 저널리즘, 참여 저널리즘 등 새로운 저널리즘 가치 연구
- 뉴스 빅데이터: 뉴스 빅데이터 고도화 및 활용을 위한 연구 및 시스템 서비스의 기획과 개발, 전문개발자 확충, 지능형 뉴스 검색엔진 기획, Structured journalism, 부가서비스 기획
2) 조직 혁신
- 인력: 전 직급 언론인 대상 모바일 혁신 교육 실시, 언론인 및 언론학자 맞춤형 모바일/디지털 스킬 매뉴얼 제작
- 조직: 모바일 퍼스트를 위한 인사 평가와 조직 개편 연구, 모바일 퍼스트를 위한 업무 프로세스 연구
- CMS: SaaS를 활용한 저비용/고효율 CMS 개발 지원, CMS 연계된 언론사 맞춤형 각종 플러그인 개발 및 공유, 사용자용 CMS 기획 개발
- 플랫폼: 뉴스 빅데이터 시스템을 활용한 오픈API, 오픈데이터, 오픈소스 전략 수립, 오픈플랫폼 활용 극대화를 위한 교육과 개발 협력을 위한 개발자 컨퍼런스 개최
3) 비즈니스 모델 혁신
- 광고: 네이티브 광고, 언론사 공동 광고 인벤토리 추진
- 저작권: 뉴스 빅데이터 사업을 통한 데이터 판매(B2B 영역) 방식의 저작권 사업 추진
- 부가사업: 언론사 사내 벤처 또는 언론사와 미디어 스타트업 간 협업 지원, 미디어 혁신 한정해 사내 벤처의 월급 지원, 미디어 해커톤 개최
- 투자: 개발자 컨퍼런스 개최, VC와 연결하고 기술 공유와 협업 및 투자 기회 제공
Natural language processing of News (intermediate): rule based modelDaemin Park
NLP of news in news big data analysis systems such as
1) 'NewsSource Beta' (powered by Advanced Institutes of Convergence Technology, Seoul National University)
2) 'Big kinds' (powered by Korea Press Foundation)
Toward a debating machine: A news sentence network analysis algorithm based o...Daemin Park
This research suggests news sentence network analysis algorithm based on similarity and cooccurence. News contains abundant arguments with facts and quotes those are critical to represent agendas. News sentence network is a semantic network which consists of quotes as nodes. Connectivity is defined by relevance between quotes. Relevance matrix is the sum of similarity matrix calculated by cosine similarity algorithm and cooccurence matrix. This study analyzed 949 quotes from 405 news articles and visualized networks. The results verified that semantic paths were well defined to show the sequence of sub-agendas. News semantic network analysis algorithm can provide a methodology to automatically generate a massive corpus in a sentence level as a training set to develop a debating machine.
- Big data is like teenage sex
- Structures of Big data
- News big data
- Natural language processing
- News source network
- Examples
- News big data anaysis software
- Further studies
News Semantic Network Analysis of Named EntitiesDaemin Park
News Semantic Network Analysis of Named Entities
- named entity recognition: person, organization from news
- tagging topics manually per sentences or articles
- semantic network analysis between persons and organizations
개체명 중심 뉴스 의미 연결망 분석
- 뉴스에서 인명, 기관명을 개체명 인식을 통해 추출
- 주제 태그를 부착
- 사람, 기관, 주제 간의 연결망 분석
- 단어 의미 연결망 한계 극복
News Media Network Analysis: Comparing Media Systems MathematicallyDaemin Park
Comparing media systems mathematically by news sources
Defining news media network by similarity and uniqueness
news media uniqueness = 1 – (Σ(Cosine Similarity of quoted sources-1)) / (number of media-1)
- 정보원 인용 패턴의 유사성을 계산하여 매체 간 유사도를 계산
- 중복되지 않는 압도적으로 많은 정보원 존재
- 순위를 고려할 경우 각 신문는 매우 다름 (순위 고려 불필요)
- 이에 따라 유사도 계산에 단순 코사인 알고리즘을 활용할 수 있음
- 유사도 값을 합산하고 역산해준 뒤 표준화하여 언론매체의 독창성(media uniqueness)을 계산:
media uniqueness = 1 – (Σ(Cosine Similarity of quoted sources-1)) / (number of media-1)
- 4대강으로 검색한 8개 중앙지 기사 약 3000건 분석
- 모든 매체가 독창적인 가운데, 그 중 한겨레가 가장 독창적이며, 경향이 정보원이 가장 많고, 세계일보가 가장 덜 독창적, 한겨레 경향이 비교적 겹침, 보수지 간에도 편차도 큼
- 반론 활성화하는 한겨레는 독자적으로 정보원 발굴, 세계일보가 공식 정보원 의존 가장 높고 다른 신문을 참조했을 가능성이 큼, 세계일보의 인적 물적 자원이 열악하거나 4대강 보도를 과소평가했을 가능성이 있음
- indexing hypothesis는 기각된다고 할 수 있음
- 매체 ranking algorithm으로 응용 가능
데이터 저널리즘을 이해할 수 있는 유용한 자료 입니다.
http://newsjel.ly
내부적 이해
1. 데이터 저널리즘 개념잡기
(1) 빅데이터 시대, 빅데이터란?
(2) 빅데이터의 종류와 활용분야
(3) 빅데이터와 저널리즘의 상관관계
(4) 데이터 - 중심 저널리즘
(5) 사례로 보는 데이터 저널리즘
2. 데이터 저널리즘 과정알기
(1) 데이터 저널리즘 과정
외부적 기회
3. 데이터 저널리즘의 미래 찾기
(1) 데이터 저널리즘 관련 기관/행사
(2) 데이터 저널리즘의 전망
데이터 저널리즘.
많이는 들어봤는데, 누가 하는걸까?
그리고 그들의 비즈니스 모델은 무엇일까?!
뉴스젤리가 파헤친
데이터 저널리즘 비즈니스 모델!!
1. 영리기업
1) 기성언론
- 뉴욕타임스
- 가디언
- LA타임즈
- 블룸버그
- 로이터
- 이코노미스트
2) 스타트업
- Wanna Hacks
- Statista
- Timetric
- Data Market
- CSC
- DATA 뉴스
2.비영리 단체 및 기업
1) Propublica
2) Texas Tribune
3) Stiftung Warentest
데이터 저널리즘의 새 바람, 뉴스젤리(Newsjelly)
http://newsjel.ly
데이터 저널리즘을 이해할 수 있는 유용한 자료 입니다.
http://newsjel.ly
1. 만남 : 저널리즘에 빅데이터를 입히다
(1) 저널리즘에 빅데이터를 입히다
(2) 해외 데이터 저널리즘의 대표적 사례
2. 기회 : 공공데이터의 개방 추세
(1) 공공데이터의 개방 추세
(2) 왜 공공데이터가 중요할까?
3. 효과 : 정부, 저널리스트, 구독자 간의 선순환
(1) 정부, 저널리스트, 국민 모두 WIN-WIN
(2) 데이터 저널리즘은 지속가능한 선순환 모델
4. 방법 : 프로세스와 데이터 시각화
(1) 데이터 저널리즘의 특징과 프로세스
(2) 데이터 시각화 방법
5. 사례 : 국내 사례 분석 & 뉴스젤리
(1) 데이터 저널리즘 포지셔닝 맵
(2) 데이터 저널리즘 언론
(3) 데이터 저널리즘 유관기관
(4) 데이터 저널리즘 행사
(5) 데이터 저널리즘의 새 바람 뉴스젤리
Automated discourse analysis with BigKinds and Semantic Network AnalyzerDaemin Park
News Big Data analysis as Automated Discourse Analysis with BigKinds and Semantic Network Analyzer
https://www.kinds.or.kr/
- News Big Data
- Word Cloud
- BigKinds
- Semantic Network Analyzer
- Appendix: Cases
1. Research Histories of news big data analytics
- distribution of news semantic network
- multilevel semantic network analysis of news
- news big data analysis system <newssource> and <bigkinds>
- webzine <news>
http://story.visualdive.co.kr/2016/04/newspaper26y/ (in Korean)
- 14 articles and 3 books
2. Research Plans
- expert systems using multi-modal data
- opinion dynamics, Bayesian statistics, machine learning
Debating Machine: Rule Based News Sentence Network AnalysisDaemin Park
Debating Machine: Rule Based News Sentence Network Analysis
- sentence level of analysis
- relevance matrix constructed by cooccurence and quoted sources info
- sentence level ranking
- defining sentence network, sentence distance, and semantic path(semantic diameter, summarized path, and extended path)
- methodology to automatically build corpus with relevance information among news sentences, which contain a lot of political, economic, cultural, and social agendas based on simple rules
토론기계: 규칙 기반 뉴스 문장 의미연결망 분석
- 단어(명사 중심)이 아닌 문장 수준의 분석 시도
- 기사공동출현과 인접기간 동일정보원 발언을 바탕으로 관련도 행렬 구성
- 문장 단위의 순위화, 문장 중심 연결망, 의미거리, 의미경로(지름, 축약경로, 확장경로)를 정의
- 정치, 경제, 사회, 문화, 국제 등 다양한 주제를 담은 뉴스 기사를 이용해 토론기계가 학습할 문장 간 관계 정보를 담은 말뭉치를 대규모로 자동으로 구축
News Media Network Analysis: Comparing Media Systems MathematicallyDaemin Park
Comparing media systems mathematically by news sources
Defining news media network by similarity and uniqueness
news media uniqueness = 1 – (Σ(Cosine Similarity of quoted sources-1)) / (number of media-1)
- 정보원 인용 패턴의 유사성을 계산하여 매체 간 유사도를 계산
- 중복되지 않는 압도적으로 많은 정보원 존재
- 순위를 고려할 경우 각 신문는 매우 다름 (순위 고려 불필요)
- 이에 따라 유사도 계산에 단순 코사인 알고리즘을 활용할 수 있음
- 유사도 값을 합산하고 역산해준 뒤 표준화하여 언론매체의 독창성(media uniqueness)을 계산:
media uniqueness = 1 – (Σ(Cosine Similarity of quoted sources-1)) / (number of media-1)
- 4대강으로 검색한 8개 중앙지 기사 약 3000건 분석
- 모든 매체가 독창적인 가운데, 그 중 한겨레가 가장 독창적이며, 경향이 정보원이 가장 많고, 세계일보가 가장 덜 독창적, 한겨레 경향이 비교적 겹침, 보수지 간에도 편차도 큼
- 반론 활성화하는 한겨레는 독자적으로 정보원 발굴, 세계일보가 공식 정보원 의존 가장 높고 다른 신문을 참조했을 가능성이 큼, 세계일보의 인적 물적 자원이 열악하거나 4대강 보도를 과소평가했을 가능성이 있음
- indexing hypothesis는 기각된다고 할 수 있음
- 매체 ranking algorithm으로 응용 가능
데이터 저널리즘을 이해할 수 있는 유용한 자료 입니다.
http://newsjel.ly
내부적 이해
1. 데이터 저널리즘 개념잡기
(1) 빅데이터 시대, 빅데이터란?
(2) 빅데이터의 종류와 활용분야
(3) 빅데이터와 저널리즘의 상관관계
(4) 데이터 - 중심 저널리즘
(5) 사례로 보는 데이터 저널리즘
2. 데이터 저널리즘 과정알기
(1) 데이터 저널리즘 과정
외부적 기회
3. 데이터 저널리즘의 미래 찾기
(1) 데이터 저널리즘 관련 기관/행사
(2) 데이터 저널리즘의 전망
데이터 저널리즘.
많이는 들어봤는데, 누가 하는걸까?
그리고 그들의 비즈니스 모델은 무엇일까?!
뉴스젤리가 파헤친
데이터 저널리즘 비즈니스 모델!!
1. 영리기업
1) 기성언론
- 뉴욕타임스
- 가디언
- LA타임즈
- 블룸버그
- 로이터
- 이코노미스트
2) 스타트업
- Wanna Hacks
- Statista
- Timetric
- Data Market
- CSC
- DATA 뉴스
2.비영리 단체 및 기업
1) Propublica
2) Texas Tribune
3) Stiftung Warentest
데이터 저널리즘의 새 바람, 뉴스젤리(Newsjelly)
http://newsjel.ly
데이터 저널리즘을 이해할 수 있는 유용한 자료 입니다.
http://newsjel.ly
1. 만남 : 저널리즘에 빅데이터를 입히다
(1) 저널리즘에 빅데이터를 입히다
(2) 해외 데이터 저널리즘의 대표적 사례
2. 기회 : 공공데이터의 개방 추세
(1) 공공데이터의 개방 추세
(2) 왜 공공데이터가 중요할까?
3. 효과 : 정부, 저널리스트, 구독자 간의 선순환
(1) 정부, 저널리스트, 국민 모두 WIN-WIN
(2) 데이터 저널리즘은 지속가능한 선순환 모델
4. 방법 : 프로세스와 데이터 시각화
(1) 데이터 저널리즘의 특징과 프로세스
(2) 데이터 시각화 방법
5. 사례 : 국내 사례 분석 & 뉴스젤리
(1) 데이터 저널리즘 포지셔닝 맵
(2) 데이터 저널리즘 언론
(3) 데이터 저널리즘 유관기관
(4) 데이터 저널리즘 행사
(5) 데이터 저널리즘의 새 바람 뉴스젤리
Automated discourse analysis with BigKinds and Semantic Network AnalyzerDaemin Park
News Big Data analysis as Automated Discourse Analysis with BigKinds and Semantic Network Analyzer
https://www.kinds.or.kr/
- News Big Data
- Word Cloud
- BigKinds
- Semantic Network Analyzer
- Appendix: Cases
1. Research Histories of news big data analytics
- distribution of news semantic network
- multilevel semantic network analysis of news
- news big data analysis system <newssource> and <bigkinds>
- webzine <news>
http://story.visualdive.co.kr/2016/04/newspaper26y/ (in Korean)
- 14 articles and 3 books
2. Research Plans
- expert systems using multi-modal data
- opinion dynamics, Bayesian statistics, machine learning
Debating Machine: Rule Based News Sentence Network AnalysisDaemin Park
Debating Machine: Rule Based News Sentence Network Analysis
- sentence level of analysis
- relevance matrix constructed by cooccurence and quoted sources info
- sentence level ranking
- defining sentence network, sentence distance, and semantic path(semantic diameter, summarized path, and extended path)
- methodology to automatically build corpus with relevance information among news sentences, which contain a lot of political, economic, cultural, and social agendas based on simple rules
토론기계: 규칙 기반 뉴스 문장 의미연결망 분석
- 단어(명사 중심)이 아닌 문장 수준의 분석 시도
- 기사공동출현과 인접기간 동일정보원 발언을 바탕으로 관련도 행렬 구성
- 문장 단위의 순위화, 문장 중심 연결망, 의미거리, 의미경로(지름, 축약경로, 확장경로)를 정의
- 정치, 경제, 사회, 문화, 국제 등 다양한 주제를 담은 뉴스 기사를 이용해 토론기계가 학습할 문장 간 관계 정보를 담은 말뭉치를 대규모로 자동으로 구축
OWL reasoning with WebPIE: calculating the closer of 100 billion triplesMahdi Atawneh
The document presents a methodology for using MapReduce and WebPIE, a reasoning engine, to perform OWL reasoning on large datasets in a distributed, scalable manner. It extends previous work that used this approach for RDFS reasoning. The methodology partitions data and distributes rules across nodes to perform joins and derive inferences in parallel. An experiment demonstrated the approach could reason over datasets with billions of triples within hours and showed good scalability with input size and node count. However, results for the largest dataset were not reported and the approach may be costly to implement due to its use of MapReduce.
빅데이터, 데이터마이닝, 공공데이터, 오픈데이터 - 그 어느때보다 데이터 분석 및 활용이 중요해진 이 시기에 웹 상의 수많은 공개된 자료를 직접 수집할 수 있는 웹 스크래핑/크롤링 기술은 데이터 수집 및 활용 능력에 큰 도움이 됩니다.
이 강의에서는 크롤링 프레임웍을 사용하지 않고 HTTP, DOM, concurrency를 담당하는 기본적인 라이브러리만을 사용해 직접 웹 스크래퍼를 처음부터(from scratch) 작성해 봄으로써, 언제든 자유도 높은 동시성 크롤러를 직접 구현할 수 있도록 작동 원리를 이해할 수 있도록 합니다.
시연에서 작성된 전체 소스코드는 아래 링크에서 보실 수 있습니다.
https://gist.github.com/cornchz/0ec0c3f5ca69bac2b625
title: 중국 VR 보고서 - 2016
1. 중국 TMT 기업의 VR 접점
2. 중국 VR산업 투자 현황(2015년 1분기-2016년 2분기)
3. VR산업의 이상과 현실
4. VR 콘텐츠 출시 계획
5. VR - 차세대 플랫폼
6. AR, VR 그리고 MR
7. 중국 VR산업 투자리스트
SmartCall is an AI-powered call answering system that uses natural language processing to answer citizen complaints and inquiries for governments. It was created to address the problems of inefficient call centers and long wait times by routing calls to the right departments. The system benefits governments by improving response times, increasing transparency, and reducing costs compared to traditional call centers. SmartCall can be used by any government agency and was founded in 2015 in Pakistan.
Top 8 mental health associate resume samplesdavimores
This document provides resources for mental health associate resumes, interviews, and careers. It lists resume templates including chronological, functional, curriculum vitae, combination, targeted, professional, new graduate, and executive resumes. It also provides links to materials on interview preparation, common interview questions, thank you letters, and negotiating salaries. Finally, it suggests fields and job levels that these resumes could be applicable to, such as healthcare, education, engineering, and entry-level through executive level roles.
This document summarizes a study on the performance and emissions of a diesel engine fueled with blends of cotton seed oil methyl ester (biodiesel) and petro-diesel. Tests were conducted on a single cylinder diesel engine at full load with fuel blends ranging from B0 (petro-diesel) to B100 (cotton seed oil methyl ester). The results showed that the B25 blend provided the best performance with higher brake thermal efficiency, lower specific fuel consumption, and lower emissions like smoke density and oxides of nitrogen compared to other blends and petro-diesel. Therefore, the B25 blend is concluded to be a viable alternative fuel that can save 25% of pet
This study experimentally analyzed the emission characteristics of a diesel engine fueled with cotton seed oil methyl ester (biodiesel) and petrodiesel at different static injection timings. Tests were conducted on a single cylinder diesel engine at full load. Emissions including oxygen, carbon dioxide, carbon monoxide, smoke density, and other pollutants were measured and compared between the fuels. The results showed that a static injection timing of 22 degrees before top dead center produced the lowest emissions for both biodiesel and petrodiesel.
Voľnočasové aktvity
Pravidelná fyzická aktivita
Aktívny transport
Rolové správanie otca, matky, najlepšieho priateľa – pravidelný šport
Prostredie podporujúce fyzickú aktivitu
Organizované voľnočasové aktivity
Sledovanie televízie
Hranie počítačových hier
Práca na počítači
Religiozita
Sociálne siete
Rizikové využívanie internetu
Rovesníci
Popularita
Sociálna opora rovesníkov
Subkultúry mládeže
Romantické vzťahy a sexuálne správanie
Zaľúbenosť
Vyhľadávanie informácií o sexualite na internete
Rozhovory s rodičmi o sexualite
Pohlavná zrelosť: Výskyt menštruácie u dievčat
Skúsenosť s pohlavným stykom
Ochrana pred neželaným tehotenstvom
Normy – sexuálne správanie
Násilné správanie
Účasť na bitke
Šikanovania
Normy – šikanovanie
Rodina
Socio-ekonomické charakteristiky rodiny
Zamestnanosť rodičov
Vzťahy s rodičmi
Rodičovské pravidlá
Spoločne strávené aktivity s rodičmi
Škola, školské prostredie
Spokojnosť so školou
Školský výkon
Neospravedlnené absencie v škole
Vzťahy medzi spolužiakmi
Vzťahy s učiteľmi
Participácia na triednych pravidlách a školských aktivitách
Pravidelná podpora v príprave do školy
Postoj k vzdelaniu
Vzdelanostné ašpirácie
Vybrané charakteristiky škôl zaradených do výskumného súboru
Zastúpenie mužov v učiteľskom zbore
Závažné problémy v okolí školy
Závažné vnútorné problémy školy
Zariadenia a vybavenie školy
Stravovanie v školách
Sortiment ponúkaný v školských automatoch, obchodoch alebo bufetoch
Podpora fyzickej aktivity
Počet vyučovacích hodín telesnej výchovy za týždeň
Dostupnosť zariadení pre fyzickú aktivitu a šport
뉴스 빅데이터 분석 연구들은 첫째, 뉴스 정보원 연결망과 뉴스 인용문 주제 연결망이 두터운 꼬리 분포를 갖는다는 점을 고려할 때 시간 압박이 있고 인용을 중요한 사실성 관행으로 사용하는 객관주의 저널리즘 관행 아래 정보원 인용이나 주제 선정에서 편향성은 사회물리학적으로 필연적인 현상임을 시사한다. 둘째, 다양한 매체 이용의 빈도가 멱함수 분포임을 고려하면 특정 매체를 훨씬 더 많이 보고, 특정 기사에 댓글 작성 등 참여를 훨씬 더 많이 여론독과점 역시 필연적 현상임을 보여준다. 즉 충분히 많은 매체와 매체 이용이 있을 경우, 기존의 여론독과점 매체를 보게 하지 않더라도 다른 매체를 중심으로 여론독과점이 재형성될 가능성이 높다. 셋째, 최상위권 정보원과 인용문 주제를 시계열로 비교할 때 매체 간 차이는 크지 않으며 단지 시계열 상의 패러다임 변화만 발견된다. 넷째, 순위를 고려한 매체 간 유사도를 따져볼 때, 매체 간 차이는 상위권 안에서는 오히려 줄어들며, 중상위권에서도 크지 않다. 다섯째, 매체 간 차이는 기사량 자체, 즉 연결망의 크기(size)와 두터운 꼬리에 해당하는 하위권 정보원과 주제에서 나타난다. 뉴스 빅데이터 기반 매체 간 비교 연구 성과는 최소한 동종 매체 간에 동조화된 파편화가 나타난다.
통계, 즐기셈 배우셈 나라셈에서! - 통계청 국민디자인단
통계청 경인지방통계청 조사지원과
2015년 자율과제
[국민디자인단]
서비스 디자이너 : 정지홍 (삼성디자인학교 교수)
전문가 : 김기영 (연세대 문헌정보학과 교수)
국민 : 박희만 (회사원)
국민 : 한예림 (대학원생)
학생 : 박영진 (홍익대 커뮤니케이션디자인 전공)
공무원 : 고영희 (경인지방통계청 조사지원과)
공무원 : 김만회 (경인지방통계청 조사지원과)
--------
• 통계정보, 통계분석상담, 통계직업체험, 통계커뮤니티 형성 등
통계에 관한 모든 것을 국민이 편리하게 이용할 수 있도록
맞춤형 서비스
• ’15년 원스톱 통계자료서비스, 통계커뮤니티 공간제공, 통계직업체험 프로그램 실시
’16년 통계분석상담서비스, 통계직업체험 프로그램 확대, 온라인 홍보체계 구축
----------
□ 추진배경
○ 다양한 통계정보의 편리하고 선별된 활용을 원하는 통계수요자의
욕구가 점증하여 이에 대한 새로운 도서관서비스 개발이 필요
- 기존 통계도서관은 간행물 위주 운영으로 다양한 정보제공 한계
- 공간 협소와 시설 노후로 서비스 제약 및 이용만족도 저해 요인
□ 추진내용
○ 통계간행물 위주 서비스에서 심층적인 통계데이터와 전문적인
통계 조언, 통계 체험 등을 제공하는 통계정보센터로 진화
- 도서관 확장 및 시설 개선으로 쾌적한 서비스 공간 구성
- 무선인터넷 활용 열람대, 개인연구 지원 독서대 설치 운영
- 통계원시자료 이용위한 MDSS센터(Micro Data Service System) 운영
- 통계분석, 활용 관련 맞춤형 조언 제공하는 통계상담실 운영
- 통계 관련 회의, 연구 지원 위해 세미나실 민간 개방
□ 국민체감 기대효과
○ 통계정보센터의 다양한 서비스를 체험하여 통계 친밀감을 높이고
생활 속의 통계활용 기회 확대
- 창업, 연구, 교육 등에 통계정보의 다양한 활용 및 편리한 체험
- 통계보고서, 통계DB정보, 통계원시자료, 통계전문서적, 통계상담 등 통계에 관련된 모든 궁금증 한 곳에서 해결로 만족 극대화
□ 성공요인
○ 통계청이 가진 방대하고 전문적인 통계정보를 일반국민이 손쉽게
활용할 수 있도록 환경 조성, 서비스 개발, 시설 개방
- 다양한 수요자 맞춤형 서비스를 원스톱 제공하는 개방과 공유의 열린 도서관 실현
고려대학교 대학원 교육정보서비스 특론 수업 4-5주 교안
고려대학교 정보대학 컴퓨터학과 강장묵 교수 강의
본 교안은 빅데이터 기술을 활용한 교육정보서비스에 대한 것임
강의는 교육정보에서 활용될 수 있는 여타 ICT 기술의 원리 중 정보공유와 API, 빅데이터 정보처리 과정과 하둡 프로그래밍의 이해, 구글 지도와 크레이그리스트의 매쉬업 사례 등을 다룸
2016년 촛불집회는 과거와 달리 수도권뿐만 아니라 지방에서도 전개되었다. 그러나 서울 광화
문 광장 이외에서 진행된 촛불집회에 대한 사회적 관심은 그 중요성에 비해서 주목받지 못했다.
이 연구는 지방의 촛불집회 특히, 대통령의 정치적 고향인 대구·경북(TK) 촛불집회에 주목하였
다. 본 논문은 페이스북에 남겨진 데이터를 이용해 촛불집회에 나타난 TK지역 여론의 행위자와
댓글의 내용을 검토한다. 첫째, 페이지의 운영주체에 따라 페이스북 이용자 행위의 차이가 있는
지 살펴보았다. 둘째, 집회유형에 따른 댓글의 의견과 그 전개양상이 다른지 살펴보았다. 분석방
법으로 이용자 반응분석, 연결망분석(social network analysis), 의미망분석이 사용되었다. 연구결과,
페이스북 이용자들의 관심도, 참여율, 응집도는 전통 미디어에서 운영한 페이지보다 시민참여형
UCC(user created content) 페이지에서 높게 나타났다. 집회유형으로 보면, 촛불집회 댓글들과 비
교해 ‘박사모’ 반응에서 노인폄하 단어 등 부정적 단어들이 더 자주 출현했다. 이 연구는 페이스
북 댓글 데이터를 이용해서 기존에 자주 수행된 마케팅과 선거캠페인을 넘어서 새로운 연구방향
을 제시했다는 점에서 학술적 의미뿐만 아니라 사회적 가치가 있다.
- K-core 분석을 통한 한국 미디어 스타트업의 투자 연결망 분석
- 2006-2019년 미디어 스타트업 299개, 307개 투자사의 공동 투자 관계 분석
- 투자연결망은 투자자를 노드로, 동일 스타트업 공동 투자여부를 엣지 정보로 하는 연결망
- 기술통계로 보면 비공개 제외 투자 규모는 1.36조원에 달했으며 시리즈 B단계까지 투자 받은 곳이 많았고 시리즈 C 단계에서 M&A가 이뤄짐
- 네이버의 투자를 받은 캠프모바일이나 스노우와 광고 마케팅 쪽의 누적 투자액 규모가 컸으며 그 외 200억 이상 누적 투자액인 곳으로는 레진엔터, 얍컴퍼니, 메이크어스, 마이쿤, 왓챠, 문피아 등
- 분석결과 공동투자를 가장 많이 한 집단에서는 한국산업은행 투자시 공동투자하는 경우가 많았음
- 가장 많은 투자 집단이 모인 군집은 공동투자 건수가 10건인 집단(10 core 군집에만 속한 투자사)로 본엔젤스파트너스를 비롯한 팁스 운영사가 다수였으며, 얼리스테이지 투자 비중이 높았으며 최종 투자 단계는 시리즈 B 수준이 많아 많이 성장한 단계는 아님
- 3 core에 속한 투자 그룹의 평균 투자액이 많은데, 이는 IPO나 M&A가 많았기 때문이며, 이 그룹의 투자사는 미디어 스타트업 투자 건수가 대부분 1건으로 평소 관심 없다가 엑싯에만 참가한 것임
결론
- 한국산업은행, 팁스, 4차산업혁명위의 위원장이 창업자인 본엔젤스파트너스 등 정부 영향력이 미디어 스타트업 투자에 반영됨
- 정부 지원 아래 성장 사례가 많지 않은 미디어 스타트업 분야에서도 얼리스테이지 투자가 많이 이뤄지고 있는 것으로 보임
8 week: Technology of Platformless Media BlockchainDaemin Park
- The architecture of platformless media blockchain
- Wallet
- Micropayment
- Decentralized storage with big data system
- Decentralized identification
(국민대학교 소프트웨어융합대학원 블록체인 전공 <블록체인과 미디어> 2019년 여름학기 수업)
Steemit and Governance for Creators (2019-S: Media Blockchain)Daemin Park
- Governance issues in blockchain
- The cryptoeconomy of Steemit
- The governance issue of Steemit
(국민대학교 소프트웨어융합대학원 블록체인 전공 <블록체인과 미디어> 2019년 여름학기 수업)
Media Innovation Ecosystem (2019-S: Media Blockchain) Daemin Park
국민대 소프트웨어융합대학원 블록체인 전공 <블록체인과 미디어> 2019년 여름학기 수업
내용:
- 정보통치성 시대의 주체, 시간, 공간, 노동, 자본, 시장, 사회의 구성
- 사용자 떠나는 레거시 미디어
- 미디어 스타트업 생태계 맵과 투자 현황
- 미디어 스타트업의 수행
- 모드 내 독점과 모드 간 경쟁 상황과 여덟가지 변화
- 미디어 플랫폼의 대항품행과 미디어 블록체인의 등장
내용
- 어반플레이의 미디어 전략과 도시 OS 전략
- 아는동네 잡지, 네이버 협업, 연남장 및 연남방앗간 등 공간 구축, 재주상회와의 협업, VC 투자 유치 등
발표 개요
- 발표자: 홍주석 어반플레이 대표
- 장소: 광주 아시아문화전당
- 일시: 5월 18일
- 학회명: 한국언론학회 봄철 정기학술대회
- 세션: 로컬 크리에이터 일반 세션
- 주최: 미디어 블록체인 & 스타트업 연구회
- 후원: GS홈쇼핑, 명승은 벤처스퀘어 대표
내용
- 지역방송의 뉴미디어 전략 실행 사례 발표
- MBC 강원영동 X 더유니브의 유튜브 채널 '하우투' 운영
- '하우투'는 TV 특강 강연자 소스를 바탕으로 제작
발표 개요
- 발표자: 하현제 강원영동MBC PD
- 장소: 광주 아시아문화전당
- 일시: 5월 18일
- 학회명: 한국언론학회 봄철 정기학술대회
- 세션: 로컬 크리에이터 일반 세션
- 주최: 미디어 블록체인 & 스타트업 연구회
- 후원: GS홈쇼핑, 명승은 벤처스퀘어 대표
세션 2-2: 블록체인 기반 미디어 유통을 위한 메타데이터 표준의 중요성 (박춘원)Daemin Park
내용
- 영상 기반 미디어 블록체인의 메타데이터 표준안
발표 개요
- 발표자: 박춘원 미디어체인 대표
- 장소: 광주 아시아문화전당
- 일시: 5월 18일
- 학회명: 한국언론학회 봄철 정기학술대회
- 세션: 미디어 블록체인 특별 세션
- 주최: 미디어 블록체인 & 스타트업 연구회
- 후원: 미디어체인
세션 2-3: 블록체인이 콘텐츠 딜리버리 시스템에 미치는 영향과 그 변화에 관하여 (남현우)Daemin Park
내용
- 트론과 비트토렌트의 블록체인 활용
- 블록체인 기반 P2P 콘텐츠 유통 시스템 제안
발표 개요
- 장소: 광주 아시아문화전당
- 일시: 5월 18일
- 학회명: 한국언론학회 봄철 정기학술대회
- 세션: 미디어 블록체인 특별 세션
- 주최: 미디어 블록체인 & 스타트업 연구회
- 발표자: 남현우 오딘네트워크 대표
- 후원: 미디어체인
세션 2-4: 자유 없는 블록체인은 디스토피아의 BIG (BR)Other (유성훈)Daemin Park
내용
- 블록체인의 급진 자유주의적 성격
발표 개요
- 발표자: 유성훈 에피토미CL 창업자
- 장소: 광주 아시아문화전당
- 일시: 5월 18일
- 학회명: 한국언론학회 봄철 정기학술대회
- 세션: 미디어 블록체인 특별 세션
- 주최: 미디어 블록체인 & 스타트업 연구회
- 후원: 미디어체인
내용
- 미디어 블록체인의 현황과 복잡계적 특성
- 카이스트 과학저널리즘 전공 석사 논문
발표 개요
- 장소: 광주 아시아문화전당
- 일시: 5월 18일
- 학회명: 한국언론학회 봄철 정기학술대회
- 세션: 미디어 블록체인 일반 세션
- 주최: 미디어 블록체인 & 스타트업 연구회
- 발표자: 김상호 강원영동MBC PD
- 후원: 소셜뉴스(위키트리)
- 누구의 발언에 어떤 사람들이 함께 찬반을 말하는가?
- 어떤 주제의 하위 주제는 무엇인가?
- 누가 무슨 주제에 관심이 있나?
- 뉴스 중심어 연결망의 정의
- 자동화된 방식으로 관련 의제, 관심 주제, 해당 주제의 전문가 찾기
- 뉴스 중심어 연결망 분석 실습
- Ucinet의 Netdraw를 활용한 시각화
2019년 1학기 한양대학교 <뉴스 빅데이터 기반 저널리즘 연구>
- 뉴스 정보원-주제 연결망의 정의
- 뉴스 정보원-주제 연결망의 2 mode 중앙성과 eigenvector 해석
- 자동화된 방식으로 전문가와 일반가 찾기
- 뉴스 정보원-주제 연결망 분석 실습
- NetMiner와 Ucinet의 Netdraw를 활용한 시각화
2. 2
News Big Data System Design
2016 Semantic Network Analyzers for News Big Data
2016 Newspaper 26 years [link]
2015 <BigKinds> RFP [link]
2013 NewsSource Beta [link for general users] [link for analysts]
2013 UPI news source network visualization prototype program [link]
2012 News source network analysis prototype program
News Big Data Research
Park, D.M., Kim, G.N., & On, B.W.(2016). Understanding the network fundamentals of the news sources associated with a specific topic. Information Sciences.
327, 32-52.
PARK, D.M.(2016, January). Toward a debating machine: A news sentence network analysis algorithm based on similarity and cooccurrence. In Proceedings of
HCI Korea (pp. 491-498). Hanbit Media, Inc..
박대민, 오세욱(2016). 방송 뉴스 빅데이터 분석의 가능성. <방송문화연구>, 28권 1호, 7-51.
박대민(2016). 뉴스 기사의 자연어처리: <뉴스소스 베타>를 중심으로. <커뮤니케이션이론>, 12권 1호, 4-52.
박대민(2015). 사실기사의 직접인용에 대한 이중의 타당성 문제의 검토: 동아일보와 한겨레신문의 4대강 추진 논란 기사에 대한 뉴스 정보원 연결망 및 인용문 분석. <한국언론학보>,
59권 5호, 121-151.
박대민, 박진우(2015). 양적 완화 정책에 대한 국내 언론 보도의 정보원 및 인용문 분석: 경제 저널리즘의 신자유주의적 경향에 대한 비판적 고찰. <한국언론학보>, 59권 1호, 37-61.
박대민, 김기남, 강남용, 서봉원, 하효지, 온병원(2014). 저널리즘 가치에 기초한 알고리즘을 이용한 뉴스의 시각화. <한국HCI학회 논문지>, 9권 2호, 5-12.
박대민(2014). 뉴스 정보원 인용에서의 폭발성과 언론의 편향성. <커뮤니케이션 이론>, 10권 1호, 295-324.
박대민(2013). 뉴스 기사의 빅데이터 분석 방법으로서 뉴스정보원연결망분석. <한국언론학보>, 57권 6호, 233-261.
박대민, 이중식, 서봉원(2016.12.). <(가제) 사용자 중심 뉴스 빅데이터 플랫폼 연구>. 서울: 한국언론진흥재단. (책임연구).
박대민, 백영민, 김선호(2015.12.). <뉴스 빅데이터 분석 시스템 연구>. 서울: 한국언론진흥재단. (책임연구).
박대민, 김선호, 양정애(2014.12.). <스마트 미디어 뉴스 혁신 전략>. 서울: 한국언론진흥재단.
박대민, 오세욱(2016.6.). 인공지능 21년: 뉴스 빅데이터로 본 인공지능의 역사. <News Big Data Analytics & Insights>, 1권 2호. 서울: 한국언론진흥재단.
박대민(2016.4.). 신문 26년: 뉴스 빅데이터로 본 신문 보도의 역사. <News Big Data Analytics & Insights>, 1권 1호. 서울: 한국언론진흥재단.
박대민. 김선호(2015.9.). 청년실업: 언론보도와 국민인식. <미디어이슈>, 1권 14호. 서울: 한국언론진흥재단.
박대민(2015.8). 망언의 네트워크: 신문뉴스 빅데이터 분석으로 본 일본 망언보도 10년사. <미디어이슈>, 1권 12호. 서울: 한국언론진흥재단.
Profile
3. 뉴스 생태계의 변화
목차
뉴스 빅데이터의 정의
뉴스의 미래,
뉴스 빅데이터의 혁신
3
뉴스 빅데이터 분석 1: 자연어처리
뉴스 빅데이터 분석 2: 의미연결망분석
뉴스 빅데이터의 BM
뉴스 빅데이터의 목표
5. The End of Paper Platforms
허브
언론사
독자 광고주
플랫폼
기능 흡수
콘텐츠 공급자 분화 콘텐츠
사업자
UGC
네이티브
광고
박대민, 양정애, 김선호(2014). <스마트 미디어 뉴스 생태계의 혁신 전략>. 서울: 한국언론진흥재단.
5
6. 사용자의 생산, 유통 참여
취재
편집
유통
판매
광고
부가
사업
편집국
광고
사업국
CP
취재
플랫폼
판매
유통
광고
부가
사업
편집
독자 사용자
박대민, 양정애, 김선호(2014). <스마트 미디어 뉴스 생태계의 혁신 전략>. 서울: 한국언론진흥재단.
6
7. 사용자 중심 저널리즘 가치
7
Watts, D. J., & Dodds, P. S. (2007). Influentials, networks, and public opinion formation. Journal of consumer research, 34(4), 441-458.
https://en.wikipedia.org/wiki/Death_of_Alan_Kurdi
박대민(2015). ‘민주주의 기술’ 은 진화하는가. < ICT인문사회융합동향>. 2015년 3호.
9. VS
Data/Robot Journalism vs. News Big Data
9
https://docs.google.com/presentation/d/1rJ1xfELWBfmoZkKFKBgN2a3B-slOjgEf8rKbgxiHL8A/edit#slide=id.g3368db5e8_115
12. - 형태소분석, NER
- 구문분석, 의미분석
- data cleansing
- 프로그램 기획 개발
- Visualization
- 정보원 분석
- 인용문 분석
- 담론분석
- 구조 파악
- Transpose, Diagonal,
Dichotomize
- centrality
01
02
03
04
Crawling NLP, Data cleansing
Semantic Network
Analysis
Discourse Analysis
12
- 데이터 모델링
- 수작업, Crawler, 계약
- 자료는 충분히 많아야
함
Procedure of News Big Data Analytics
빅카인즈
13. Natural Language Processing of News
토큰 분리, 어간 추출, 품사 부착, 색인, 벡터화
문장 경계 인식, 구문분석, 공기어, 개체명 사전 구축(PLOT, 수치, 외국어 한글 표
기), 개체명 인식
대용어 해소(대명사, 두문자어, 약어, 수치), 의미 중의성 해결(동명이인, 이명동인)
분류, 군집, 중복, 요약, 가중치, 순위화, 토픽 모델링, 이슈 트래킹, 평판분석, 감성분
석, 복합논증분석,
형태소분석
구문분석
의미분석
담론분석
박대민(2016). 뉴스 기사의 자연어처리: <뉴스소스 베타>를 중심으로. <커뮤니케이션이론>, 12권 1호, 4-52.
13
18. Fundamentals of News Source Network
박대민(2013). 뉴스 기사의 빅데이터 분석 방법으로서 뉴스정보원연결망분석. <한국언론학보>, 57권 6호, 233-261.
21
1
2 3
1
4 5
2 3
1
4 5
18
19. Dynamics of News Source Network
Park, D.M., Kim, G.N., & On, B.W.(2016). Understanding the network fundamentals of the news sources associated with a specific topic. Information
Sciences, 327. 32-52
19
38. Business for Journalism
38
Facebook was not originally created to be a
company.
It was built to accomplish a social mission-
to make the world more open and connected.
Be open, build social value.
Mark Zuckerberg’s Letter to Investors: ‘The Hacker Way’
39. Q & A
39
We don’t build (news) services to make money.
We make money to build better world.