19년 4월 1일, 서울대학교 SNCC와 공동 주최로 열린 논문 정보 수집과 연구 동향 분석 공개 세미나 발표 자료 입니다.
논문 정보를 수집할 수 있는 NetMiner 확장프로그램, Biblio Data Collector 에 대한 소개와 이를 활용한 분석 사례 소개로 구성되어 있습니다.
그리고 마지막 깜짝 발표, NetMiner 또 다른 확장프로그램 SNS Data Collector 의 업데이트 소식(인스타그램 수집)까지 보실 수 있습니다.
세미나 현장 영상 보기 >> https://www.youtube.com/channel/UCEyZjvgAc4uEIuHKRI5Jk0w
세미나 결과 보기 >> https://cyram.tistory.com
19년 4월 1일, 서울대학교 SNCC와 공동 주최로 열린 논문 정보 수집과 연구 동향 분석 공개 세미나 발표 자료 입니다.
논문 정보를 수집할 수 있는 NetMiner 확장프로그램, Biblio Data Collector 에 대한 소개와 이를 활용한 분석 사례 소개로 구성되어 있습니다.
그리고 마지막 깜짝 발표, NetMiner 또 다른 확장프로그램 SNS Data Collector 의 업데이트 소식(인스타그램 수집)까지 보실 수 있습니다.
세미나 현장 영상 보기 >> https://www.youtube.com/channel/UCEyZjvgAc4uEIuHKRI5Jk0w
세미나 결과 보기 >> https://cyram.tistory.com
News Semantic Network Analysis of Named EntitiesDaemin Park
News Semantic Network Analysis of Named Entities
- named entity recognition: person, organization from news
- tagging topics manually per sentences or articles
- semantic network analysis between persons and organizations
개체명 중심 뉴스 의미 연결망 분석
- 뉴스에서 인명, 기관명을 개체명 인식을 통해 추출
- 주제 태그를 부착
- 사람, 기관, 주제 간의 연결망 분석
- 단어 의미 연결망 한계 극복
Toward a debating machine: A news sentence network analysis algorithm based o...Daemin Park
This research suggests news sentence network analysis algorithm based on similarity and cooccurence. News contains abundant arguments with facts and quotes those are critical to represent agendas. News sentence network is a semantic network which consists of quotes as nodes. Connectivity is defined by relevance between quotes. Relevance matrix is the sum of similarity matrix calculated by cosine similarity algorithm and cooccurence matrix. This study analyzed 949 quotes from 405 news articles and visualized networks. The results verified that semantic paths were well defined to show the sequence of sub-agendas. News semantic network analysis algorithm can provide a methodology to automatically generate a massive corpus in a sentence level as a training set to develop a debating machine.
Natural language processing of News (intermediate): rule based modelDaemin Park
NLP of news in news big data analysis systems such as
1) 'NewsSource Beta' (powered by Advanced Institutes of Convergence Technology, Seoul National University)
2) 'Big kinds' (powered by Korea Press Foundation)
News Media Network Analysis: Comparing Media Systems MathematicallyDaemin Park
Comparing media systems mathematically by news sources
Defining news media network by similarity and uniqueness
news media uniqueness = 1 – (Σ(Cosine Similarity of quoted sources-1)) / (number of media-1)
- 정보원 인용 패턴의 유사성을 계산하여 매체 간 유사도를 계산
- 중복되지 않는 압도적으로 많은 정보원 존재
- 순위를 고려할 경우 각 신문는 매우 다름 (순위 고려 불필요)
- 이에 따라 유사도 계산에 단순 코사인 알고리즘을 활용할 수 있음
- 유사도 값을 합산하고 역산해준 뒤 표준화하여 언론매체의 독창성(media uniqueness)을 계산:
media uniqueness = 1 – (Σ(Cosine Similarity of quoted sources-1)) / (number of media-1)
- 4대강으로 검색한 8개 중앙지 기사 약 3000건 분석
- 모든 매체가 독창적인 가운데, 그 중 한겨레가 가장 독창적이며, 경향이 정보원이 가장 많고, 세계일보가 가장 덜 독창적, 한겨레 경향이 비교적 겹침, 보수지 간에도 편차도 큼
- 반론 활성화하는 한겨레는 독자적으로 정보원 발굴, 세계일보가 공식 정보원 의존 가장 높고 다른 신문을 참조했을 가능성이 큼, 세계일보의 인적 물적 자원이 열악하거나 4대강 보도를 과소평가했을 가능성이 있음
- indexing hypothesis는 기각된다고 할 수 있음
- 매체 ranking algorithm으로 응용 가능
고려대학교 대학원 교육정보서비스 특론 수업 4-5주 교안
고려대학교 정보대학 컴퓨터학과 강장묵 교수 강의
본 교안은 빅데이터 기술을 활용한 교육정보서비스에 대한 것임
강의는 교육정보에서 활용될 수 있는 여타 ICT 기술의 원리 중 정보공유와 API, 빅데이터 정보처리 과정과 하둡 프로그래밍의 이해, 구글 지도와 크레이그리스트의 매쉬업 사례 등을 다룸
- Keyword centric network of news sources and schools
- Keyword centric network of news topics and related topics
- Keyword centric network of news sources-news topics
- News sources' interests and topics' related news sources
Automated discourse analysis with BigKinds and Semantic Network AnalyzerDaemin Park
News Big Data analysis as Automated Discourse Analysis with BigKinds and Semantic Network Analyzer
https://www.kinds.or.kr/
- News Big Data
- Word Cloud
- BigKinds
- Semantic Network Analyzer
- Appendix: Cases
온라인 커뮤니티 상의 게시글에 대해 Louvain method와 클러스터링 기법을 적용한 내부 커뮤니티 성향 탐지 기법 Sun-young Kim
오늘날 웹 상의 SNS나 블로그, 커뮤니티를 통해 사람들은 자신의 다양한 관심사와 취향을 드러낸다. 과거에는 데이터의 규모에 비해 부족한 데이터 처리 능력으로 인해 웹 상의 자료에 대한 분석이 충분히 이루어지지 못 했 으나 대용량 데이터 처리 기술과 인프라의 발전으로 기업이나 정부 등 많은 조직들이 데이터 분석을 수행하여 의사 결정에 필요한 핵심 정보를 얻고 있다. 본 논문은 기존에 연구가 활발하게 이루어진 SNS에서의 사용자 분 석이 아닌 온라인 커뮤니티에서의 내부 커뮤니티 탐지 기법을 제안한다. 사용자간의 관계가 명확하게 정해진 SNS와 달리 커뮤니티에서의 사용자 관계를 그래프 기반과 컨텐츠 기반의 두 가지 기법으로 분석함으로써 보다 정확한 커뮤니티 탐지 결과를 얻을 수 있다. 기법의 검증을 위해 국내 커뮤니티 사이트의 데이터를 대상으로 실 험을 수행하였으며 실험 결과 사용자들의 관계 및 게시글 성향에 따라 사용자들의 군집을 분류하는데 성공하였 음을 실험으로 보인다.
2015년 추계멀티미디어학회 투고논문 슬라이더파일입니다
요약
본 논문은 창원시의 공용자전거 누비자의 활용성을 높이기위한 모바일 시스템의 설계와 구현에 관한 논문이다. 누비
자는 창원시가 운영하는 무인 공영자전거 대여 시스템으로 247곳의 무인대여 터미널을 이용하여 일일 평균 8,000명 이상의 사용자들이 이용하고 있다. 이러한 공영자전거 대여시스템을 모바일용으로 개발하기 위하여 공공기관에서 운영하고 있는 누비자 서버의 정보를 파싱하여 실시간으로 터미널의 사용정도와 현황을 제공하는 서비스를 구현하였다.
News Semantic Network Analysis of Named EntitiesDaemin Park
News Semantic Network Analysis of Named Entities
- named entity recognition: person, organization from news
- tagging topics manually per sentences or articles
- semantic network analysis between persons and organizations
개체명 중심 뉴스 의미 연결망 분석
- 뉴스에서 인명, 기관명을 개체명 인식을 통해 추출
- 주제 태그를 부착
- 사람, 기관, 주제 간의 연결망 분석
- 단어 의미 연결망 한계 극복
Toward a debating machine: A news sentence network analysis algorithm based o...Daemin Park
This research suggests news sentence network analysis algorithm based on similarity and cooccurence. News contains abundant arguments with facts and quotes those are critical to represent agendas. News sentence network is a semantic network which consists of quotes as nodes. Connectivity is defined by relevance between quotes. Relevance matrix is the sum of similarity matrix calculated by cosine similarity algorithm and cooccurence matrix. This study analyzed 949 quotes from 405 news articles and visualized networks. The results verified that semantic paths were well defined to show the sequence of sub-agendas. News semantic network analysis algorithm can provide a methodology to automatically generate a massive corpus in a sentence level as a training set to develop a debating machine.
Natural language processing of News (intermediate): rule based modelDaemin Park
NLP of news in news big data analysis systems such as
1) 'NewsSource Beta' (powered by Advanced Institutes of Convergence Technology, Seoul National University)
2) 'Big kinds' (powered by Korea Press Foundation)
News Media Network Analysis: Comparing Media Systems MathematicallyDaemin Park
Comparing media systems mathematically by news sources
Defining news media network by similarity and uniqueness
news media uniqueness = 1 – (Σ(Cosine Similarity of quoted sources-1)) / (number of media-1)
- 정보원 인용 패턴의 유사성을 계산하여 매체 간 유사도를 계산
- 중복되지 않는 압도적으로 많은 정보원 존재
- 순위를 고려할 경우 각 신문는 매우 다름 (순위 고려 불필요)
- 이에 따라 유사도 계산에 단순 코사인 알고리즘을 활용할 수 있음
- 유사도 값을 합산하고 역산해준 뒤 표준화하여 언론매체의 독창성(media uniqueness)을 계산:
media uniqueness = 1 – (Σ(Cosine Similarity of quoted sources-1)) / (number of media-1)
- 4대강으로 검색한 8개 중앙지 기사 약 3000건 분석
- 모든 매체가 독창적인 가운데, 그 중 한겨레가 가장 독창적이며, 경향이 정보원이 가장 많고, 세계일보가 가장 덜 독창적, 한겨레 경향이 비교적 겹침, 보수지 간에도 편차도 큼
- 반론 활성화하는 한겨레는 독자적으로 정보원 발굴, 세계일보가 공식 정보원 의존 가장 높고 다른 신문을 참조했을 가능성이 큼, 세계일보의 인적 물적 자원이 열악하거나 4대강 보도를 과소평가했을 가능성이 있음
- indexing hypothesis는 기각된다고 할 수 있음
- 매체 ranking algorithm으로 응용 가능
고려대학교 대학원 교육정보서비스 특론 수업 4-5주 교안
고려대학교 정보대학 컴퓨터학과 강장묵 교수 강의
본 교안은 빅데이터 기술을 활용한 교육정보서비스에 대한 것임
강의는 교육정보에서 활용될 수 있는 여타 ICT 기술의 원리 중 정보공유와 API, 빅데이터 정보처리 과정과 하둡 프로그래밍의 이해, 구글 지도와 크레이그리스트의 매쉬업 사례 등을 다룸
- Keyword centric network of news sources and schools
- Keyword centric network of news topics and related topics
- Keyword centric network of news sources-news topics
- News sources' interests and topics' related news sources
Automated discourse analysis with BigKinds and Semantic Network AnalyzerDaemin Park
News Big Data analysis as Automated Discourse Analysis with BigKinds and Semantic Network Analyzer
https://www.kinds.or.kr/
- News Big Data
- Word Cloud
- BigKinds
- Semantic Network Analyzer
- Appendix: Cases
온라인 커뮤니티 상의 게시글에 대해 Louvain method와 클러스터링 기법을 적용한 내부 커뮤니티 성향 탐지 기법 Sun-young Kim
오늘날 웹 상의 SNS나 블로그, 커뮤니티를 통해 사람들은 자신의 다양한 관심사와 취향을 드러낸다. 과거에는 데이터의 규모에 비해 부족한 데이터 처리 능력으로 인해 웹 상의 자료에 대한 분석이 충분히 이루어지지 못 했 으나 대용량 데이터 처리 기술과 인프라의 발전으로 기업이나 정부 등 많은 조직들이 데이터 분석을 수행하여 의사 결정에 필요한 핵심 정보를 얻고 있다. 본 논문은 기존에 연구가 활발하게 이루어진 SNS에서의 사용자 분 석이 아닌 온라인 커뮤니티에서의 내부 커뮤니티 탐지 기법을 제안한다. 사용자간의 관계가 명확하게 정해진 SNS와 달리 커뮤니티에서의 사용자 관계를 그래프 기반과 컨텐츠 기반의 두 가지 기법으로 분석함으로써 보다 정확한 커뮤니티 탐지 결과를 얻을 수 있다. 기법의 검증을 위해 국내 커뮤니티 사이트의 데이터를 대상으로 실 험을 수행하였으며 실험 결과 사용자들의 관계 및 게시글 성향에 따라 사용자들의 군집을 분류하는데 성공하였 음을 실험으로 보인다.
2015년 추계멀티미디어학회 투고논문 슬라이더파일입니다
요약
본 논문은 창원시의 공용자전거 누비자의 활용성을 높이기위한 모바일 시스템의 설계와 구현에 관한 논문이다. 누비
자는 창원시가 운영하는 무인 공영자전거 대여 시스템으로 247곳의 무인대여 터미널을 이용하여 일일 평균 8,000명 이상의 사용자들이 이용하고 있다. 이러한 공영자전거 대여시스템을 모바일용으로 개발하기 위하여 공공기관에서 운영하고 있는 누비자 서버의 정보를 파싱하여 실시간으로 터미널의 사용정도와 현황을 제공하는 서비스를 구현하였다.
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big dataK data
미래의 ICT생태계는 데이터를 중심으로 형성될 것입니다. 디지털라이제이션(digitalization)의 가속화로 우리의 일상은 빠르게 데이터 기반으로 급변하고 있습니다. 빅데이터라는 용어가 라디오 프로그램의 선곡기준으로도 등장하는 현 시점에서 다양한 관점의 빅데이터를 살펴봄으로써 실제 산업 생태계에 가져올 기술, 사회, 제도적 혁신의 조짐을 살펴보고자 합니다.
먼저 오픈소스가 가져오는 IT 생태계의 변화와 공유경제라는 키워드를 통해 함께함으로써 커지는 데이터의 가치, 그리고 그 가치를 더욱 크게 할 메타데이터의 중요성을 이야기하겠습니다. 또한 데이터 생태계의 활성화를 위한 거래 플랫폼이 가진 멀티 사이드 플랫폼의 가치와 이러한 플랫폼 활성화를 위한 공공 정책의 데이터 기반 변화 트렌드와 개인 프라이버시 보호 트렌드 및 기술을 살펴보고자합니다.
서울시 빅데이터 캠퍼스 안내 및 데이터 설명
안녕하십니까.
서울시 빅데이터 캠퍼스입니다.
데이터기반 사회혁신 모델을 만들어가고자 하는 서울시 빅데이터 캠퍼스의 지향과 서비스에 대한 안내 드립니다.
더불어, 캠퍼스 입주에 필요한 절차와 입주 후 제공되는 데이터, 인프라 서비스에 대한 상세한 설명을 보실 수 있습니다.
감사합니다.
KISTI-WATEF-BK21Plus-사이버감성연구소 2017 동계세미나 자료집Han Woo PARK
WATEF 2017 동계세미나 및 정기총회 개최
1. 행사 개요
o 목 적 : 데이터와 콘텐츠 기반 과학기술의 공공성 회복방향에 대한 전문가 의견
공유
o 일 시 : 2017. 11.30(목)
o 장 소 : KISTI(한국과학기술정보연구원) 대전 본원 별관 회의실
o 참석자 : WATEF 회원 및 KISTI 관련자 등 50여명
o 주 관 : WATEF
o 주 최 : WATEF, KISTI(한국과학기술정보연구원), 영남대 BK플러스사업단 사물
인터넷 빅데이터 지능서비스 사업팀, 영남대사이버감성연구소(빅데이터
융복합센터)
http://watef.org/home/bbs/board.php?bo_table=notice&wr_id=73
학회원 여러분 위와같이 WATEF 2017 동계세미나를 KISTI 대전본원 회의실에서 개최합니다. 많은 회원분들의 참석 바랍니다.
사전등록신청은 지난번 하계세미나처럼 온라인으로 간편하게 접수 가능합니다.
https://goo.gl/forms/FPLfxGQ5ZeOdh6A63 <- 사전등록신청 링크
WATEF 2018 신년 세미나
안녕하십니까?
이번 세미나는 인적교류 및 정보교류와 더불어 유연한 관계형성을 목적으로
소규모의 사랑방 형식으로 진행하고자 하오니 많은 참석바랍니다.
□ 일 시 : 2018. 2. 2. (금) 오후 3:30~5:30
□ 장 소 : 스마트미디어센터(대구 동구 동대구로 489번지 대구무역회관 2층)
□ 발표주제
【좌장】 백승대(영남대)
【세션1】 성폭력에 대한 언론 보도 양상과 사회적 인식 탐구
- 발표자: 임연수(홍익대)
- 토론자: 석민(매일신문사), 남인용(부경대), 윤희웅(오피니언라이브)
【세션2】 지역의 미래전략에 미치는 미래준비 요인에 관한 연구
- 발표자: 송영조(한국정보화진흥원)
- 토론자: 이정미(대구경북연구원), 안중곤(대구시청), 오경묵(한국경제신문)
WATEF 2018 신년 세미나
안녕하십니까?
이번 세미나는 인적교류 및 정보교류와 더불어 유연한 관계형성을 목적으로
소규모의 사랑방 형식으로 진행하고자 하오니 많은 참석바랍니다.
□ 일 시 : 2018. 2. 2. (금) 오후 3:30~5:30
□ 장 소 : 스마트미디어센터(대구 동구 동대구로 489번지 대구무역회관 2층)
□ 발표주제
【좌장】 백승대(영남대)
【세션1】 성폭력에 대한 언론 보도 양상과 사회적 인식 탐구
- 발표자: 임연수(홍익대)
- 토론자: 석민(매일신문사), 남인용(부경대), 윤희웅(오피니언라이브)
【세션2】 지역의 미래전략에 미치는 미래준비 요인에 관한 연구
- 발표자: 송영조(한국정보화진흥원)
- 토론자: 이정미(대구경북연구원), 안중곤(대구시청), 김윤영(한국패션산업연구원)
Another Interdisciplinary Transformation: Beyond an Area-studies JournalHan Woo PARK
Journal of Contemporary Eastern Asia (ISSN 2383-9449) is a refereed biannual journal that takes a lead on a new scholarship in Asia. In the past, the JCEA was dedicated to the study of current political, social and economic trends in East and Southeast Asia. But now, the JCEA finds unique aspects of Asian scholarship by expanding its scope to (socio-technical) convergence and future (network) studies. The JCEA editors are working very hard to boost the scholarly presence of new Asian scholarship around the world and secure its reputation as an emerging world-class publishing outlet. The editors welcome manuscripts based on original research or significant reexamination of existing literature.
암호화폐에 대해 적극 규제 입장을 보이는 정부에 대해 아쉬움을 드러내며 청와대에 규제 반대 청원을 낸 영남대 사이버감성연구소 박한우 교수. 국내 빅 데이터 연구 권위자로 잘 알려진 그는 지금까지 100여 편에 달하는 관련 논문을 게재하며 빅 데이터를 통해 사회를 해석하고 있는 학자다. 게다가 빅 데이터를 활용한 여론조사 특허까지 획득하며 빅 데이터 연구의 체계를 잡아가고 있다. 그런 그가 암호화폐 규제 반대에 대한 이유와 블록체인 기술과 정부가 해야 할 일에 대해 의견을 들었다.
1. 청와대에 가상화폐 규제를 반대하는 청원을 낸 것으로 알고 있다. 가상화폐 규제에 반대 하는 이유는 무엇인가
가상화페는 오역된 단어이다. 엄격히 말하면, 암호화폐가 맞다. 세계 암호화페 시장은 기축통화인 비트코인 그리고 이더리움 등 알트코인을 포함하면 약 700여 개가 등록되어 있다. 앞으로 3,000여 개가 등록 준비 중이다. 우리나라도 미래자산으로서 비트코인 거래가 활성화되고 있다. 현재 암호화폐 시장에 특히 한국시장에 유독 과열이 심한 건 맞다고 본다. 상징적인 가격대인 1만 달러를 넘으면서 우리나라 뿐 아니라 전 세계 각국에서도 고민이 커져가고 있는 것도 사실이다. 그러나 문재인 정부가 이러한 트렌드에 제대로 부응하려면, 암호화폐 분야의 세계적 동향과 국내 현황 간 미스매치를 언급하며 정책적 지원이 필요함을 역설해야지 규제를 말할 단계가 아니다.
close
2. 가상화폐 규제 시 어떤 문제점이 발생할 것이라 예상되는가
신호등 효과가 발생할 것이다. 청색등에서 적색으로 바뀌기 전 황색등 기간에 더 많은 부작용이 생겨날 것이다. 일확천금의 마지막 기회라고 생각해서 시장이 더 불안정해질 것이며, 아노미 상태가 될 것이다. 규제의 근거로서 청소년과 주부의 무분별한 투기행태를 언급하는 것은 적폐대상인 탁상행정을 다시 보여주는 것이다. 2018년 중등 교육과정에 코딩수업이 정규과정으로 포함된다. 코딩수업에서 우리의 청소년이 꿈꾸어야 할 직업은 무엇인가? 그것은 바로 글로벌 경쟁력을 지닌 암호화폐를 개발하는 것이다. 이더리움은 러시아 프로그래머인 비탈릭 부테린이 개발했다. 고학력의 경력단절 여성들이 육아와 가사를 병행하면서 할 수 있는 무엇인가? 모바일 금융거래사로서 새로운 사회적 성장동력이 되는 것이다. 상황이 이러함에도 불구하고, 새로운 정부는 기술의 편의성과 위험성 이슈를 운운하는 구태를 드러내고 있다, 기능이 겹치거나 기술이 완성되지 못한 암호화폐는 자연도태 되게 되어있다. 정부에서도 무조건적인 투자, 투기라기보다는 위험성을 제대로 알려주면서 암호화폐의 건전한 발전을 위한 제도를 만들어 나가는 게 필요하다고 본다. 암호화폐나 블록체인이 우리 국가를 어떻게 더 나은 사회로 만들 수 있는지에 대해 새로운 정책을 만들고 그 정책에 따라 규제를 연결지어 나오는게 더 올바르지 않을까 생각한다.
close
3. 암호화폐와 블록체인 기술의 가능성에 대해 어떻게 보고있는가
미국 시카고 선물시장에서 비트코인 거래가 개시되었다. 이것이 암호화폐의 제도권 진입을 공식화하지는 않지만, 신기루처럼 허구는 아닐 수 있다는 것을 드러낸다. 2018년에는 비트코인 거래의 대중화와 캐쉬리스 모바일 지불결제의 확산될 것이다. 또한 비트코인을 이용한 개인-개인(P2P) 사이트가 생겨나면서 중고물품과 디지털콘텐츠 거래시스템 활용논의가 중요하게 등장할 것이다. 또한 블록체인의 질적 성장을 통해 탈중앙화를 가속화 시키고 국가가 분산, 투명, 협력 되는 생태계를 만들어 내는 기회를 삼을 수 있으리라 생각한다. 4차산업 혁명에서 가장 핵심이 되는 기술이 공정성과 신뢰성을 가진 연결 융합 플랫폼을 구현하는 것이라고 본다.
4. 정부는 블록체인 기술 발전을 위해 어떤 역할을 해야 한다고 생각하는가
블록체인 기술이 발전하기 위해서는 암호화폐가 반드시 필요하다. 암호화폐와 블록체인은 한 몸이라 보면 된다. 암호화폐에 심각한 규제를 가하기 시작하면 블록체인 기술을 통해 4차 산업을 육성하는 것은 불가능하다고 볼 수 있다.
비트코인 광풍의 이면에 대기업에서 운영하는 암호화폐 거래소의 사회적 책임의식 부재와 이용자 미보호가 심각한 문제로 등장하는 것이 핵심 트렌드임을 깨달아야 한다. 나아가, 소득이 있는 곳에 세금이 있다는 원칙을 지키면 된다. 거래소 개설 이후의 소득에 대해서는 세금을 부과해야 한다. 하지만 주택임대사업자처럼 일정금액 이상은 부가세를 면제하여 개미투자자들을 보호하면 된다. 이것은 문재인 정부가 추구하는 정의로운 나라와 궤를 같이 하는 것이다.
나아가 블록체인에 대한 세계적 관심이 더 높아지면서 관련 원천기술의 확보방안이 주요 이슈로 부상될 것이다. Lisk coin은 독일 베를린에 오미세고는 태국 방콕, 라이트코인은 싱가폴에 본부를 두고 있다
장성혁기자 jsh0529@msnet.co.kr
Global mapping of artificial intelligence in Google and Google ScholarHan Woo PARK
Omar, M., Mehmood, A., Choi, G.S., Park, H.W.@ (2017 Online First). Global mapping of artificial intelligence in Google and Google Scholar. Scientometrics.
https://link.springer.com/article/10.1007%2Fs11192-017-2534-4
#인공지능 분야의 국가별 현황과 전망을 #웹보메트릭스 #빅데이터 #구글데이터 이용해서 세계지도를 그렸습니다.
박한우 영어 이력서 Curriculum vitae 경희대 행사 제출용Han Woo PARK
Full Prof. Dr. Han Woo PARK, http://www.hanpark.net https://www.slideshare.net/hanpark
(BA-HUFS, MA-Seoul Nat'l Univ. PhD-SUNY Buffalo)
Dept of Media & Communication, Interdisciplinary Program of Digital Convergence Business, YeungNam University, 214-1, Dae-dong, Gyeongsan-si, Gyeongsangbuk-do, South Korea, Zip Code 712-749
Editor-In-Chief of Journal of Contemporary Eastern Asia, https://jceasia.org/
Guest Editors of Social Science Computer Review, Journal of Computer-Mediated Communication, Asian Journal of Communication, Scientometrics, Quality & Quantity, Technological Forecasting & Social Change
Editorial Boards of Scientometrics, Quality & Quantity, International Journal of Internet Science, Big Data & Society, CollNet Journal of Scientometrics & Information Management, Knowledge Economy, International Journal of Technology Management & Sustainable Development, Social Media & Society, Triple Helix - A Journal of University-Industry-Government Innovation and Entrepreneurship, Technological Forecasting & Social Change, Journal of Data & Information Science, Scholarly Metrics and Analytics (a specialty of Frontiers in Library and Information Science)
Director of Cyber Emotions Research Institute
President of WATEF (World Association for Triple Helix & Future Strategy Studies,
Formerly, Asia Triple Helix Society)
Formerly, Directors of World Class University Webometrics Institute and TEDxPalgong ,Visiting Scholar of Oxford Internet Institute https://www.oii.ox.ac.uk/people/han-woo-park/ Research Associate of Royal Netherland Academy (NIWI-KNAW http://virtualknowledgestudio.nl/people/former-vks-members/
Twitter network map of #ACPC2017 1st day using NodeXLHan Woo PARK
The Asian Conference for Political Communication 2017 is a biennial conference spearheaded by the Media Programme Asia of Konrad-Adenauer-Stiftung. Join fellow influencers in academia, politics and government on this special occasion. Talk about challenges on social media, discuss the odds and threats of #twiplomacy, analyze the phenomena of rising populism and watch the hottest tools for e-campaigning.
2016년 촛불집회는 과거와 달리 수도권뿐만 아니라 지방에서도 전개되었다. 그러나 서울 광화
문 광장 이외에서 진행된 촛불집회에 대한 사회적 관심은 그 중요성에 비해서 주목받지 못했다.
이 연구는 지방의 촛불집회 특히, 대통령의 정치적 고향인 대구·경북(TK) 촛불집회에 주목하였
다. 본 논문은 페이스북에 남겨진 데이터를 이용해 촛불집회에 나타난 TK지역 여론의 행위자와
댓글의 내용을 검토한다. 첫째, 페이지의 운영주체에 따라 페이스북 이용자 행위의 차이가 있는
지 살펴보았다. 둘째, 집회유형에 따른 댓글의 의견과 그 전개양상이 다른지 살펴보았다. 분석방
법으로 이용자 반응분석, 연결망분석(social network analysis), 의미망분석이 사용되었다. 연구결과,
페이스북 이용자들의 관심도, 참여율, 응집도는 전통 미디어에서 운영한 페이지보다 시민참여형
UCC(user created content) 페이지에서 높게 나타났다. 집회유형으로 보면, 촛불집회 댓글들과 비
교해 ‘박사모’ 반응에서 노인폄하 단어 등 부정적 단어들이 더 자주 출현했다. 이 연구는 페이스
북 댓글 데이터를 이용해서 기존에 자주 수행된 마케팅과 선거캠페인을 넘어서 새로운 연구방향
을 제시했다는 점에서 학술적 의미뿐만 아니라 사회적 가치가 있다.
Facebook bigdata to understand regime change and migration patterns during ca...Han Woo PARK
1) The document discusses Prof. Han Woo Park's research analyzing Facebook data to understand political changes in South Korea during 2016-2017, including candlelight protests over President Park's impeachment and the 2017 presidential election.
2) It focuses on the regions of Taegu and Kyeongbuk, where support for conservative candidate Hong Joon-pyo remained strong in the election, showing some regional divisions remain.
3) Prof. Park interviewed local media in Taegu and analyzed social media data and comments to understand shifting public opinions from the impeachment protests to the presidential campaign.
세계산학관협력총회 http://www.watef.org 패널을 공지합니다.
토론자로 참여가능한 분도 모집합니다. 많은 관심을 부탁드려요.
2017 Triple Helix Conference Special Issue Session http://www.triplehelix-korea.org/
Theme (주제): Measuring Triple Helix Synergies and Innovations using Scientometric, Technometric, Informetric, Webometric, and Altmetric Data
9월 15일 금요일 16:45 - 18:15 장소: 대구엑스코
페이스북 라이브 생중계: 서인수 (즐거운 사물인터넷 대표)
Organizers
Mi Young Chong (Univ. of North Texas, USA) miyoungchong@my.unt.edu
Han Woo Park (Yeungnam University, South Korea)
발표자: 김도훈, Brandon Moore, 윤정원
Presenter: Leo Kim
Title: From Institution to Individual: Data-Based Reflection of Triple-Helix Operation in South Korea
Biography: Leo Kim is the CEO of Ars Praxia. He graduated from LSE (Methodology, Master) and University of Sussex (Science and Technology Studies, PhD). He has been developing the methodology of semantic network analysis and has a professional background in innovation studies and unstructured data analysis.
Presenter: Brandon Moore
Title: Improving open data accessibility: Using domain driven design and microservice architecture to create user friendly open data systems
Biography: Brandon Moore is a solutions architect for Nationstar Mortgage LLC. He has 20 years experience as a software engineer and is currently the lead architect for a new reverse mortgage platform. He is also an Information Science PhD student at the University of North Texas. His research interests are text analytics and data mining.
Presenter: Jungwon Yoon
TItle: Triple Helix Dynamics of Technological Innovation Systems in South Korea: A Comparative Analysis
Biography: Jungwon Yoon is a research fellow at Soongsil University in South Korea. She received her Ph.D. in Sociology of Technology and Science from Georgia Institute of Technology, USA. Her areas of expertise are in science and technology studies (STS), including science & technology policy, sociology of sciences, innovation studies, and technology management. Her current research focuses on dynamics of innovation systems in both South and North Korea. Her latest publications include "Triple helix dynamics of South Korea’s innovation system: a network analysis of inter-regional technological collaborations" and "Quintuple helix structure of Sino-Korean research collaboration in science."
1. 사이버소셜여론 조사도구로서의 Naver
ㅡ웹보메트릭스와 빅데이터 분석
Virtual Knowledge Studio (VKS)
Prof. Dr. Han Woo PARK
CyberEmotions Research Institute
Dept. of Media & Communication
YeungNam University
214-1 Dae-dong, Gyeongsan-si,
Gyeongsangbuk-do 712-749
Republic of Korea
www.hanpark.net
cerc.yu.ac.kr
eastasia.yu.ac.kr
asia-triplehelix.org
한국사이버커뮤니케이션학회 2014년‘네이버와 포털’특별 세미나
2. 웹 빅데이터와 검색엔진
검색엔진이 없는 웹은 Chaos: 검색엔진은 나침반
검색엔진이 색인한 웹문서의 수는 민간 crawler 능가함
검색엔진을 이용한 데이터 수집은 누구나 가능함
검색엔진의 조사결과에 대해서 Replication 용이함
API를 이용하여 자동화된 분석도구의 개발과 접근
실시간에 가까운 사회네트워크분석과 시각적 가시화
다른 API 서비스와 결합해서 통합적 사회조사분석 수행
5. How Google searches 30 trillion web pages,
100 billion times a month
Search starts, of course, with crawling and
indexing, and Google says that the web now has
30 trillion unique individual pages. That up an
astonishing 30 times in five years:
Google reported in 2008 that the web had just
one trillion pages.
Google says that it stores information about
those 30 trillion pages in the Google Index,
which is now at 100 million gigabytes. That’s
about a thousand terabytes, and you’d need over
three million 32GB USB thumb drives to store all
that data. http://venturebeat.com/2013/03/01/how-google-searches-30-
trillion-web-pages-100-billion-times-a-month/
6.
7. Introduction
Webometrics is broadly defined as the study of web-
based content (e.g., text, images, audio-visual objects, and
hyperlinks) with primarily quantitative indicators for
social science research goals and visualization techniques
derived from information science and social network
analysis.
9. 9
• Han Woo Park
- “hidden” and “relational” data about
lots of people as well as the few
individuals, or small groups
• Lev Manovich
- “surface” data about lots of people (i.e.,
statistical, mathematical or computational
techniques for analyzing data)
- “deep” data about the few individuals or small
groups (i.e., hermeneutics, participant
observation, thick description, semiotics, and
close reading)
10. First type of Webometrics
• Hyperlink Network Analysis
- Inter-linkage: who linked to whom matrix
- Co-inlink: a link to two different nodes from a third node
- Co-outlink: A link from two different nodes to a third node
Björneborn (2003)
11. 하이퍼링크 데이터 수집과 검색엔진
AltaVista
- 2000년 전후에 주로 사용
- but 2004년에 Yahoo가 인수한 후에 폐쇄
Yahoo
- AltaVista 하이퍼링크 검색을 2005년 9월에 “Site Explorer” 서비스로
재개함
- 연구자들이 자동 다운로드를 위해서 API 서비스도 제공
- However, Yahoo도 API 서비스를 2011년 4월에 중지
- Site Explorer도 2011년 11월에 중지
- Yahoo 검색부분 Bing 인계됨
Bing
- 링크 데이터 옵션을 최근 제공한다고 했으나, 실제 이용방식이 난해함
Google: Find pages that are similar to, or link to, a URL
- 링크 데이터 옵션이 있으나, 제한적 서비스라는 이유로 일부 연구자만
사용 중
14. 2nd type of Webometrics: Web Visibility
웹가시성: 온라인 파워의 지표
- 대중들 사이에서 논의 중인 행위자와 이슈의 현재 상황과
출현 방식에 대한 조사
- 행위자와 이슈에 대한 대중반응에 대한 통찰력을 얻고 지속
적 추적 가능함
검색엔진을 이용한 웹가시성 조사
- 구전효과(WOM): 관찰조사와 모니터링
- 웹영향력 측정: 검색 빈도, 웹문서 규모, 하이퍼링크
- 사회관계망 조사: 검색어의 공동출현 빈도
15. 박한우, 소셜 여론조사의 실제와 과제- ‘저비용 고효율’ SNS
로 여론 읽기. 월간 <신문과 방송>, 2012년 7월. 84-88쪽.
16. 웹보메트릭스에 대해서 더 궁금하다면
http://www.hanpark.net
Research Section에 가면 논문 원문 제공
홈페이지 아래 Slideshow에 가면 파워포인트 제공
Software Section에 가면 비영리학술연구용 툴 제공
https://www.facebook.com/groups/asiatriplehelix/
* 이 슬라이는 네이버에 초점을 맞추고 있기에 검색엔
진과 웹보메트릭스 빅데이터 분석과 관련된 상세한
논의는 최소 내용만 포함함
17. 검색엔진 네이버와 웹보메트릭스 조사분석
국내 최고 이용자를 보유한 포털: 정보생산자
네이버가 색인한 웹문서 분량: 정보 없음
1st 웹보메트릭스: 하이퍼링크 검색 불가
2nd 웹보메트릭스: 웹가시성 조사 가능
API 제공으로 자동화된 조사도구 개발과 접근
- 1일 1계정당 25,000건 검색 가능
- But 기간과 상세검색 불가로 풍부한 분석이 어려움
http://blog.naver.com/mu1tong?Redirect=Log&logNo=20203387135
23. 네이버 오픈API를 이용한 e-리서치 도구개발
David Stuart
- M. Thelwall 제자
- 영국옥스퍼드인터넷연구소 방문교수시 공동작업 (2008-2009년)
- 구글 번역기를 이용해서 네이버 오픈API 분석
WeboNaver 개발과 보완
- 박한우, 박세정, David Stuart, 이승욱 (2010). API를 활용한 검색 프로
그램 WeboNaver의 이해와 적용 : 18대 국회의원의 웹 가시성 분석
과 신종플루 관련단어의 연관성 분석. Journal of the Korean Data
Analysis Society. 11권 6호 (B). 3427-3440.
24. WeboNaver 관련 논문
• 박한우, 박세정, David Stuart, 이승욱 (2009). API를 활용한 검색 프로그램 WeboNaver의 이해와 적용 : 18대 국회의원의 웹
가시성 분석과 신종플루 관련단어의 연관성 분석. Journal of the Korean Data Analysis Society. 11권 6호 (B). 3427-3440.
• 박한우 (2010년 12월). e-사이언스 시대의 인문사회학 연구하기-인터넷 연구방법을 중심으로. 사회과학연구. 30권, 2호,
195-211.
• 임연수, 박한우 (2010년 2월). 10.28 재보궐 선거의 블로그 캠페인에 대한 웹계량화 분석. Journal of the Korean Data
Analysis Society, 12권, 1호 (B), 539-551.
• Khan, G. F., & Park, H. W. @ (2011). Measuring the Triple Helix on the Web: Longitudinal Trends in the University-
Industry-Government Relationship in Korea. Journal of the American Society for Information Science and
Technology*.16 (12), 2443-2455.
• Khan, G.F., Cho, S.E., & Park, H. W. @ (2012). A Comparison of the Daegu and Edinburgh Musical Industries: A Triple
Helix Approach. Scientometrics*. 90 (1), 85-99.
• Lim, Y. S., & Park, H. W. @ (2011). How Do Congressional Members Appear on the Web?: Tracking the Web Visibility of
South Korean Politicians. Government Information Quarterly*. 28 (4), 514-521.
• Lim, Y. S., & Park, H.W. @ (2013). The Structural Relationship between Politicians' Web Visibility and Political Finance
Networks: A Case Study of South Korea's National Assembly Members. New Media & Society*. 15(1), 93-108.
• Nam, Y., Lee, Y.-O., Park, H.W. @ (2013). Can web ecology provide a clearer understanding of people’s information
behavior during election campaigns?. Social Science Information*. 52(1), 91-109.
• Nam, Y., Lee, Y., & Park, H.W.@ (2014 Accepted). Measuring web ecology by Facebook, Twitter, Blog and online news:
2012 general election in South Korea. Quality & Quantity*. DOI: 10.1007/s11135-014-0016-9.
• Ozel, B., & Park, H. W. @ (2012). Examining Korean political figures using co-word analysis in agreement with facial
expressions in posted self-images. COLLNET JOURNAL OF SCIENTOMETRICS & INFORMATION MANAGEMEN, 6 (1), 43-
60.
• Ozel, B., & Park, H. W. @ (2012). Online Image Content Analysis of Political Figures: An Exploratory Study, Quality &
Quantity*. 46 (4), 1013–1024. DOI 10.1007/s11135-011-9445-x
• Sams, S., Lim, Y. S., & Park, H. W. @ (2011). E-research applications for tracking online socio-political capital in the Asia-
Pacific region. Asian Journal of Communication*. 21 (5), 450-466.
• Vergeer, M., Lim, Y. S., & Park, H. W. (2011). Mediated relations: New methods to study online social capital. Asian
Journal of Communication*. 21 (5), 430-449.
25. Interface
25
WeboNaver API (ver. 2012-03-26)
Save Data Type
-> 기록 방식을 선택
Data Sources
-> 검색이 되는 카테고리를 선택
OutPut Format
-> 자료가 저장될 때에 포멧을 선택
Query File
-> 검색할 단어가 들어있는 TXT를 선택
Naver API, Authentication Key
-> 가지고 있는 키를 적어넣는다.
Run Queries -> 검색을 실시
32. Manipulate
32
WeboNaver API (ver. 2012-03-26)
Manipulate
Parsed Records
-> API URL (혹은 Short URL)을 저장한 TEXT
문서를 넣는다.
Converted_Count
진행 상황을 알수 있다.
프로그램 실행
34. Webometric Analyst
그 결과, 검색어 ‘김연아’ 에 대해 dreamlive.tistory.com 도메인
에서 19.6%로 가장 많은 검색 결과가 나타났고, 그 뒤를 이어
www.youtube.com(16.6%), blog.daum.net(2.5%)이 나타난다.
37. 웹보네이버 이용의 상세한 절차는
특강과 워크숍이 필요함
• WeboNaver 관련 파워포인트
• http://www.slideshare.net/hanpark/understa
nding-webonaver
• http://www.slideshare.net/WcuAtYeungNam/
webo-naver-manual24-dec2009sj
• http://www.slideshare.net/goharferozkhan/ss
kbusanworkshop
• http://www.slideshare.net/goharferozkhan/st
andfordthconferencepresentation
• 비공개 내부 자료들
38. 네이버를 e-리서치 도구로 활용과 이슈
웹가시성(WebVisibility) 분석의 장점
- 인터넷 이용자들(공중)이 온라인 공간에서 주목하고
있는 행위자, 사건 또는 이슈들의 현존성 파악이 용이
(Ackland, Gibson, Lusoli, & Ward, 2010; Gauvin, 2010).
39. 네이버를 e-리서치 도구로 활용과 이슈
Park, H.W. (2012). How do social scientists use link
data from search engines to understand Internet-
based political and electoral communication.
Quality & QuantityVolume 46, Number 2, 679-
693, DOI: 10.1007/s11135-010-9421-x
http://www.springerlink.com/content/m5922633j2235586/
40. • Our claim, however, is that a search engine does not need to be
exhaustive, reliable, and objective. The essential purpose of the search
engine lies in returning useful information in a short period of time,
not in providing comprehensive and unbiased coverage.
• As emphasized by Thelwall (2008), the search engine should be viewed
as an engineering product, not as a mathematical tool. Further,
Elgesem (2008, p.239) argued that “search engines are objective in the
sense that these engines try to be consistent with their own stated
policies.” With respect to coverage and consistency, problems may
occur due to the nature of the unstructured web. In other words, the
lack of reliability may not be caused by the search engine.
• Science organizes, structures, and evaluates information to develop a
systematic body of knowledge. It is up to the researcher to draw the
appropriate conclusions, using his or her expertise, about the
information gathered from the web using search engines. While search
engines collect data from the entire web, finding the truth from the
information is the business of academics (Caldas et al., 2008).
41. Prof. Han Woo PARK
CyberEmotions Research Center
Department of Media and Communincation,
YeungNam University, Korea
hanpark@ynu.ac.kr
http://www.hanpark.net
Formerly,
World Class University Webometrics Institute
WCU
WEBOMETRICS
INSTITUTE
INVESTIGATING INTERNET-BASED POLITIC WITH E-RESEARCH TOOLS