19년 4월 1일, 서울대학교 SNCC와 공동 주최로 열린 논문 정보 수집과 연구 동향 분석 공개 세미나 발표 자료 입니다.
논문 정보를 수집할 수 있는 NetMiner 확장프로그램, Biblio Data Collector 에 대한 소개와 이를 활용한 분석 사례 소개로 구성되어 있습니다.
그리고 마지막 깜짝 발표, NetMiner 또 다른 확장프로그램 SNS Data Collector 의 업데이트 소식(인스타그램 수집)까지 보실 수 있습니다.
세미나 현장 영상 보기 >> https://www.youtube.com/channel/UCEyZjvgAc4uEIuHKRI5Jk0w
세미나 결과 보기 >> https://cyram.tistory.com
19년 4월 1일, 서울대학교 SNCC와 공동 주최로 열린 논문 정보 수집과 연구 동향 분석 공개 세미나 발표 자료 입니다.
논문 정보를 수집할 수 있는 NetMiner 확장프로그램, Biblio Data Collector 에 대한 소개와 이를 활용한 분석 사례 소개로 구성되어 있습니다.
그리고 마지막 깜짝 발표, NetMiner 또 다른 확장프로그램 SNS Data Collector 의 업데이트 소식(인스타그램 수집)까지 보실 수 있습니다.
세미나 현장 영상 보기 >> https://www.youtube.com/channel/UCEyZjvgAc4uEIuHKRI5Jk0w
세미나 결과 보기 >> https://cyram.tistory.com
News Semantic Network Analysis of Named EntitiesDaemin Park
News Semantic Network Analysis of Named Entities
- named entity recognition: person, organization from news
- tagging topics manually per sentences or articles
- semantic network analysis between persons and organizations
개체명 중심 뉴스 의미 연결망 분석
- 뉴스에서 인명, 기관명을 개체명 인식을 통해 추출
- 주제 태그를 부착
- 사람, 기관, 주제 간의 연결망 분석
- 단어 의미 연결망 한계 극복
Toward a debating machine: A news sentence network analysis algorithm based o...Daemin Park
This research suggests news sentence network analysis algorithm based on similarity and cooccurence. News contains abundant arguments with facts and quotes those are critical to represent agendas. News sentence network is a semantic network which consists of quotes as nodes. Connectivity is defined by relevance between quotes. Relevance matrix is the sum of similarity matrix calculated by cosine similarity algorithm and cooccurence matrix. This study analyzed 949 quotes from 405 news articles and visualized networks. The results verified that semantic paths were well defined to show the sequence of sub-agendas. News semantic network analysis algorithm can provide a methodology to automatically generate a massive corpus in a sentence level as a training set to develop a debating machine.
온라인 커뮤니티 상의 게시글에 대해 Louvain method와 클러스터링 기법을 적용한 내부 커뮤니티 성향 탐지 기법 Sun-young Kim
오늘날 웹 상의 SNS나 블로그, 커뮤니티를 통해 사람들은 자신의 다양한 관심사와 취향을 드러낸다. 과거에는 데이터의 규모에 비해 부족한 데이터 처리 능력으로 인해 웹 상의 자료에 대한 분석이 충분히 이루어지지 못 했 으나 대용량 데이터 처리 기술과 인프라의 발전으로 기업이나 정부 등 많은 조직들이 데이터 분석을 수행하여 의사 결정에 필요한 핵심 정보를 얻고 있다. 본 논문은 기존에 연구가 활발하게 이루어진 SNS에서의 사용자 분 석이 아닌 온라인 커뮤니티에서의 내부 커뮤니티 탐지 기법을 제안한다. 사용자간의 관계가 명확하게 정해진 SNS와 달리 커뮤니티에서의 사용자 관계를 그래프 기반과 컨텐츠 기반의 두 가지 기법으로 분석함으로써 보다 정확한 커뮤니티 탐지 결과를 얻을 수 있다. 기법의 검증을 위해 국내 커뮤니티 사이트의 데이터를 대상으로 실 험을 수행하였으며 실험 결과 사용자들의 관계 및 게시글 성향에 따라 사용자들의 군집을 분류하는데 성공하였 음을 실험으로 보인다.
Natural language processing of News (intermediate): rule based modelDaemin Park
NLP of news in news big data analysis systems such as
1) 'NewsSource Beta' (powered by Advanced Institutes of Convergence Technology, Seoul National University)
2) 'Big kinds' (powered by Korea Press Foundation)
News Media Network Analysis: Comparing Media Systems MathematicallyDaemin Park
Comparing media systems mathematically by news sources
Defining news media network by similarity and uniqueness
news media uniqueness = 1 – (Σ(Cosine Similarity of quoted sources-1)) / (number of media-1)
- 정보원 인용 패턴의 유사성을 계산하여 매체 간 유사도를 계산
- 중복되지 않는 압도적으로 많은 정보원 존재
- 순위를 고려할 경우 각 신문는 매우 다름 (순위 고려 불필요)
- 이에 따라 유사도 계산에 단순 코사인 알고리즘을 활용할 수 있음
- 유사도 값을 합산하고 역산해준 뒤 표준화하여 언론매체의 독창성(media uniqueness)을 계산:
media uniqueness = 1 – (Σ(Cosine Similarity of quoted sources-1)) / (number of media-1)
- 4대강으로 검색한 8개 중앙지 기사 약 3000건 분석
- 모든 매체가 독창적인 가운데, 그 중 한겨레가 가장 독창적이며, 경향이 정보원이 가장 많고, 세계일보가 가장 덜 독창적, 한겨레 경향이 비교적 겹침, 보수지 간에도 편차도 큼
- 반론 활성화하는 한겨레는 독자적으로 정보원 발굴, 세계일보가 공식 정보원 의존 가장 높고 다른 신문을 참조했을 가능성이 큼, 세계일보의 인적 물적 자원이 열악하거나 4대강 보도를 과소평가했을 가능성이 있음
- indexing hypothesis는 기각된다고 할 수 있음
- 매체 ranking algorithm으로 응용 가능
Automated discourse analysis with BigKinds and Semantic Network AnalyzerDaemin Park
News Big Data analysis as Automated Discourse Analysis with BigKinds and Semantic Network Analyzer
https://www.kinds.or.kr/
- News Big Data
- Word Cloud
- BigKinds
- Semantic Network Analyzer
- Appendix: Cases
고려대학교 대학원 교육정보서비스 특론 수업 4-5주 교안
고려대학교 정보대학 컴퓨터학과 강장묵 교수 강의
본 교안은 빅데이터 기술을 활용한 교육정보서비스에 대한 것임
강의는 교육정보에서 활용될 수 있는 여타 ICT 기술의 원리 중 정보공유와 API, 빅데이터 정보처리 과정과 하둡 프로그래밍의 이해, 구글 지도와 크레이그리스트의 매쉬업 사례 등을 다룸
News Semantic Network Analysis of Named EntitiesDaemin Park
News Semantic Network Analysis of Named Entities
- named entity recognition: person, organization from news
- tagging topics manually per sentences or articles
- semantic network analysis between persons and organizations
개체명 중심 뉴스 의미 연결망 분석
- 뉴스에서 인명, 기관명을 개체명 인식을 통해 추출
- 주제 태그를 부착
- 사람, 기관, 주제 간의 연결망 분석
- 단어 의미 연결망 한계 극복
Toward a debating machine: A news sentence network analysis algorithm based o...Daemin Park
This research suggests news sentence network analysis algorithm based on similarity and cooccurence. News contains abundant arguments with facts and quotes those are critical to represent agendas. News sentence network is a semantic network which consists of quotes as nodes. Connectivity is defined by relevance between quotes. Relevance matrix is the sum of similarity matrix calculated by cosine similarity algorithm and cooccurence matrix. This study analyzed 949 quotes from 405 news articles and visualized networks. The results verified that semantic paths were well defined to show the sequence of sub-agendas. News semantic network analysis algorithm can provide a methodology to automatically generate a massive corpus in a sentence level as a training set to develop a debating machine.
온라인 커뮤니티 상의 게시글에 대해 Louvain method와 클러스터링 기법을 적용한 내부 커뮤니티 성향 탐지 기법 Sun-young Kim
오늘날 웹 상의 SNS나 블로그, 커뮤니티를 통해 사람들은 자신의 다양한 관심사와 취향을 드러낸다. 과거에는 데이터의 규모에 비해 부족한 데이터 처리 능력으로 인해 웹 상의 자료에 대한 분석이 충분히 이루어지지 못 했 으나 대용량 데이터 처리 기술과 인프라의 발전으로 기업이나 정부 등 많은 조직들이 데이터 분석을 수행하여 의사 결정에 필요한 핵심 정보를 얻고 있다. 본 논문은 기존에 연구가 활발하게 이루어진 SNS에서의 사용자 분 석이 아닌 온라인 커뮤니티에서의 내부 커뮤니티 탐지 기법을 제안한다. 사용자간의 관계가 명확하게 정해진 SNS와 달리 커뮤니티에서의 사용자 관계를 그래프 기반과 컨텐츠 기반의 두 가지 기법으로 분석함으로써 보다 정확한 커뮤니티 탐지 결과를 얻을 수 있다. 기법의 검증을 위해 국내 커뮤니티 사이트의 데이터를 대상으로 실 험을 수행하였으며 실험 결과 사용자들의 관계 및 게시글 성향에 따라 사용자들의 군집을 분류하는데 성공하였 음을 실험으로 보인다.
Natural language processing of News (intermediate): rule based modelDaemin Park
NLP of news in news big data analysis systems such as
1) 'NewsSource Beta' (powered by Advanced Institutes of Convergence Technology, Seoul National University)
2) 'Big kinds' (powered by Korea Press Foundation)
News Media Network Analysis: Comparing Media Systems MathematicallyDaemin Park
Comparing media systems mathematically by news sources
Defining news media network by similarity and uniqueness
news media uniqueness = 1 – (Σ(Cosine Similarity of quoted sources-1)) / (number of media-1)
- 정보원 인용 패턴의 유사성을 계산하여 매체 간 유사도를 계산
- 중복되지 않는 압도적으로 많은 정보원 존재
- 순위를 고려할 경우 각 신문는 매우 다름 (순위 고려 불필요)
- 이에 따라 유사도 계산에 단순 코사인 알고리즘을 활용할 수 있음
- 유사도 값을 합산하고 역산해준 뒤 표준화하여 언론매체의 독창성(media uniqueness)을 계산:
media uniqueness = 1 – (Σ(Cosine Similarity of quoted sources-1)) / (number of media-1)
- 4대강으로 검색한 8개 중앙지 기사 약 3000건 분석
- 모든 매체가 독창적인 가운데, 그 중 한겨레가 가장 독창적이며, 경향이 정보원이 가장 많고, 세계일보가 가장 덜 독창적, 한겨레 경향이 비교적 겹침, 보수지 간에도 편차도 큼
- 반론 활성화하는 한겨레는 독자적으로 정보원 발굴, 세계일보가 공식 정보원 의존 가장 높고 다른 신문을 참조했을 가능성이 큼, 세계일보의 인적 물적 자원이 열악하거나 4대강 보도를 과소평가했을 가능성이 있음
- indexing hypothesis는 기각된다고 할 수 있음
- 매체 ranking algorithm으로 응용 가능
Automated discourse analysis with BigKinds and Semantic Network AnalyzerDaemin Park
News Big Data analysis as Automated Discourse Analysis with BigKinds and Semantic Network Analyzer
https://www.kinds.or.kr/
- News Big Data
- Word Cloud
- BigKinds
- Semantic Network Analyzer
- Appendix: Cases
고려대학교 대학원 교육정보서비스 특론 수업 4-5주 교안
고려대학교 정보대학 컴퓨터학과 강장묵 교수 강의
본 교안은 빅데이터 기술을 활용한 교육정보서비스에 대한 것임
강의는 교육정보에서 활용될 수 있는 여타 ICT 기술의 원리 중 정보공유와 API, 빅데이터 정보처리 과정과 하둡 프로그래밍의 이해, 구글 지도와 크레이그리스트의 매쉬업 사례 등을 다룸
인터넷의 역사부터 웹의 탄생, HTTP 와 REST 등, 우리가 현재의 웹을 이해하는데 필요한 것들만 정리 했습니다.
현업에 개신 개발자 분들은 다들 아시는 내용이겠지만, 정작 우리 주위엔 웹을 많이들 쓰고, 관련해서 일을 하면서도 웹의 내부에 대해서는 잘 모르고 있는 사람들이 많습니다.
웹의 기반기술을 제대로 아는것이, 우리가 좀더 웹을 진지하게 접근하는 것의 시작이라고 생각합니다.
인터넷의 역사부터 웹의 탄생, HTTP 와 REST 등, 우리가 현재의 웹을 이해하는데 필요한 것들만 정리 했습니다.
현업에 개신 개발자 분들은 다들 아시는 내용이겠지만, 정작 우리 주위엔 웹을 많이들 쓰고, 관련해서 일을 하면서도 웹의 내부에 대해서는 잘 모르고 있는 사람들이 많습니다.
웹의 기반기술을 제대로 아는것이, 우리가 좀더 웹을 진지하게 접근하는 것의 시작이라고 생각합니다.
본 영상은 2021-2 KMOOC-데이터엔지니어링 강의의 원본이며, 강좌 오픈 이후에는 질의 응답 채널으로 이용 예정입니다. 각 Topic에 질문 해주시면 가능한 답은 달아드리도록 하겠습니다.
강의노트 (SlideShare) - https://www.slideshare.net/ssuser4a9113
코드 (GitHub) - https://github.com/JaewookByun/data_engineering
총 11강
구성
- ArrayList 연산
- MyArrayList - 배열 기반 List interface 구현
- LinkedList 연산
- MyLinkedList - 참조 기반 List & Queue interfaces 구현
- HashSet/HashMap 연산
- Lambda Expression
- Stream - Open JDK 15에서 이용가능한 거의 대부분의 연산을 다루려고 노력함
Basic of web ref.웹을지탱하는기술_01
1. 웹 이전의 인터넷 : 전자메일, FTP, Telnet, Gopher
2. 팀버너스리에 의해 웹이 탄생, Mosaic 브라우저를 통해 사용자 증가
3. 표준화의 필요성 > IETF, W3C등
4. SOAP vs REST 분쟁
'공공정보의 개방과 API'가 의미하는 바와 정책적 함의가 무엇인지에 대하여, 동국대학교 최고위과정 중 '빅데이터와 공공정보'라는 주제로 강장묵 교수(고려대)의 강의 교안입니다.
특강형식을 빌었으나, 본 강의는 2015년 3월에 있었던 경찰본청의 '공공정보 공유' 등에 대한 3일 연속 강의의 내용을 재사용하였음을 밝힙니다.
인용을 달고 PPT를 활용하시기 바랍니다.
WATEF 2018 신년 세미나
안녕하십니까?
이번 세미나는 인적교류 및 정보교류와 더불어 유연한 관계형성을 목적으로
소규모의 사랑방 형식으로 진행하고자 하오니 많은 참석바랍니다.
□ 일 시 : 2018. 2. 2. (금) 오후 3:30~5:30
□ 장 소 : 스마트미디어센터(대구 동구 동대구로 489번지 대구무역회관 2층)
□ 발표주제
【좌장】 백승대(영남대)
【세션1】 성폭력에 대한 언론 보도 양상과 사회적 인식 탐구
- 발표자: 임연수(홍익대)
- 토론자: 석민(매일신문사), 남인용(부경대), 윤희웅(오피니언라이브)
【세션2】 지역의 미래전략에 미치는 미래준비 요인에 관한 연구
- 발표자: 송영조(한국정보화진흥원)
- 토론자: 이정미(대구경북연구원), 안중곤(대구시청), 오경묵(한국경제신문)
WATEF 2018 신년 세미나
안녕하십니까?
이번 세미나는 인적교류 및 정보교류와 더불어 유연한 관계형성을 목적으로
소규모의 사랑방 형식으로 진행하고자 하오니 많은 참석바랍니다.
□ 일 시 : 2018. 2. 2. (금) 오후 3:30~5:30
□ 장 소 : 스마트미디어센터(대구 동구 동대구로 489번지 대구무역회관 2층)
□ 발표주제
【좌장】 백승대(영남대)
【세션1】 성폭력에 대한 언론 보도 양상과 사회적 인식 탐구
- 발표자: 임연수(홍익대)
- 토론자: 석민(매일신문사), 남인용(부경대), 윤희웅(오피니언라이브)
【세션2】 지역의 미래전략에 미치는 미래준비 요인에 관한 연구
- 발표자: 송영조(한국정보화진흥원)
- 토론자: 이정미(대구경북연구원), 안중곤(대구시청), 김윤영(한국패션산업연구원)
Another Interdisciplinary Transformation: Beyond an Area-studies JournalHan Woo PARK
Journal of Contemporary Eastern Asia (ISSN 2383-9449) is a refereed biannual journal that takes a lead on a new scholarship in Asia. In the past, the JCEA was dedicated to the study of current political, social and economic trends in East and Southeast Asia. But now, the JCEA finds unique aspects of Asian scholarship by expanding its scope to (socio-technical) convergence and future (network) studies. The JCEA editors are working very hard to boost the scholarly presence of new Asian scholarship around the world and secure its reputation as an emerging world-class publishing outlet. The editors welcome manuscripts based on original research or significant reexamination of existing literature.
암호화폐에 대해 적극 규제 입장을 보이는 정부에 대해 아쉬움을 드러내며 청와대에 규제 반대 청원을 낸 영남대 사이버감성연구소 박한우 교수. 국내 빅 데이터 연구 권위자로 잘 알려진 그는 지금까지 100여 편에 달하는 관련 논문을 게재하며 빅 데이터를 통해 사회를 해석하고 있는 학자다. 게다가 빅 데이터를 활용한 여론조사 특허까지 획득하며 빅 데이터 연구의 체계를 잡아가고 있다. 그런 그가 암호화폐 규제 반대에 대한 이유와 블록체인 기술과 정부가 해야 할 일에 대해 의견을 들었다.
1. 청와대에 가상화폐 규제를 반대하는 청원을 낸 것으로 알고 있다. 가상화폐 규제에 반대 하는 이유는 무엇인가
가상화페는 오역된 단어이다. 엄격히 말하면, 암호화폐가 맞다. 세계 암호화페 시장은 기축통화인 비트코인 그리고 이더리움 등 알트코인을 포함하면 약 700여 개가 등록되어 있다. 앞으로 3,000여 개가 등록 준비 중이다. 우리나라도 미래자산으로서 비트코인 거래가 활성화되고 있다. 현재 암호화폐 시장에 특히 한국시장에 유독 과열이 심한 건 맞다고 본다. 상징적인 가격대인 1만 달러를 넘으면서 우리나라 뿐 아니라 전 세계 각국에서도 고민이 커져가고 있는 것도 사실이다. 그러나 문재인 정부가 이러한 트렌드에 제대로 부응하려면, 암호화폐 분야의 세계적 동향과 국내 현황 간 미스매치를 언급하며 정책적 지원이 필요함을 역설해야지 규제를 말할 단계가 아니다.
close
2. 가상화폐 규제 시 어떤 문제점이 발생할 것이라 예상되는가
신호등 효과가 발생할 것이다. 청색등에서 적색으로 바뀌기 전 황색등 기간에 더 많은 부작용이 생겨날 것이다. 일확천금의 마지막 기회라고 생각해서 시장이 더 불안정해질 것이며, 아노미 상태가 될 것이다. 규제의 근거로서 청소년과 주부의 무분별한 투기행태를 언급하는 것은 적폐대상인 탁상행정을 다시 보여주는 것이다. 2018년 중등 교육과정에 코딩수업이 정규과정으로 포함된다. 코딩수업에서 우리의 청소년이 꿈꾸어야 할 직업은 무엇인가? 그것은 바로 글로벌 경쟁력을 지닌 암호화폐를 개발하는 것이다. 이더리움은 러시아 프로그래머인 비탈릭 부테린이 개발했다. 고학력의 경력단절 여성들이 육아와 가사를 병행하면서 할 수 있는 무엇인가? 모바일 금융거래사로서 새로운 사회적 성장동력이 되는 것이다. 상황이 이러함에도 불구하고, 새로운 정부는 기술의 편의성과 위험성 이슈를 운운하는 구태를 드러내고 있다, 기능이 겹치거나 기술이 완성되지 못한 암호화폐는 자연도태 되게 되어있다. 정부에서도 무조건적인 투자, 투기라기보다는 위험성을 제대로 알려주면서 암호화폐의 건전한 발전을 위한 제도를 만들어 나가는 게 필요하다고 본다. 암호화폐나 블록체인이 우리 국가를 어떻게 더 나은 사회로 만들 수 있는지에 대해 새로운 정책을 만들고 그 정책에 따라 규제를 연결지어 나오는게 더 올바르지 않을까 생각한다.
close
3. 암호화폐와 블록체인 기술의 가능성에 대해 어떻게 보고있는가
미국 시카고 선물시장에서 비트코인 거래가 개시되었다. 이것이 암호화폐의 제도권 진입을 공식화하지는 않지만, 신기루처럼 허구는 아닐 수 있다는 것을 드러낸다. 2018년에는 비트코인 거래의 대중화와 캐쉬리스 모바일 지불결제의 확산될 것이다. 또한 비트코인을 이용한 개인-개인(P2P) 사이트가 생겨나면서 중고물품과 디지털콘텐츠 거래시스템 활용논의가 중요하게 등장할 것이다. 또한 블록체인의 질적 성장을 통해 탈중앙화를 가속화 시키고 국가가 분산, 투명, 협력 되는 생태계를 만들어 내는 기회를 삼을 수 있으리라 생각한다. 4차산업 혁명에서 가장 핵심이 되는 기술이 공정성과 신뢰성을 가진 연결 융합 플랫폼을 구현하는 것이라고 본다.
4. 정부는 블록체인 기술 발전을 위해 어떤 역할을 해야 한다고 생각하는가
블록체인 기술이 발전하기 위해서는 암호화폐가 반드시 필요하다. 암호화폐와 블록체인은 한 몸이라 보면 된다. 암호화폐에 심각한 규제를 가하기 시작하면 블록체인 기술을 통해 4차 산업을 육성하는 것은 불가능하다고 볼 수 있다.
비트코인 광풍의 이면에 대기업에서 운영하는 암호화폐 거래소의 사회적 책임의식 부재와 이용자 미보호가 심각한 문제로 등장하는 것이 핵심 트렌드임을 깨달아야 한다. 나아가, 소득이 있는 곳에 세금이 있다는 원칙을 지키면 된다. 거래소 개설 이후의 소득에 대해서는 세금을 부과해야 한다. 하지만 주택임대사업자처럼 일정금액 이상은 부가세를 면제하여 개미투자자들을 보호하면 된다. 이것은 문재인 정부가 추구하는 정의로운 나라와 궤를 같이 하는 것이다.
나아가 블록체인에 대한 세계적 관심이 더 높아지면서 관련 원천기술의 확보방안이 주요 이슈로 부상될 것이다. Lisk coin은 독일 베를린에 오미세고는 태국 방콕, 라이트코인은 싱가폴에 본부를 두고 있다
장성혁기자 jsh0529@msnet.co.kr
KISTI-WATEF-BK21Plus-사이버감성연구소 2017 동계세미나 자료집Han Woo PARK
WATEF 2017 동계세미나 및 정기총회 개최
1. 행사 개요
o 목 적 : 데이터와 콘텐츠 기반 과학기술의 공공성 회복방향에 대한 전문가 의견
공유
o 일 시 : 2017. 11.30(목)
o 장 소 : KISTI(한국과학기술정보연구원) 대전 본원 별관 회의실
o 참석자 : WATEF 회원 및 KISTI 관련자 등 50여명
o 주 관 : WATEF
o 주 최 : WATEF, KISTI(한국과학기술정보연구원), 영남대 BK플러스사업단 사물
인터넷 빅데이터 지능서비스 사업팀, 영남대사이버감성연구소(빅데이터
융복합센터)
http://watef.org/home/bbs/board.php?bo_table=notice&wr_id=73
학회원 여러분 위와같이 WATEF 2017 동계세미나를 KISTI 대전본원 회의실에서 개최합니다. 많은 회원분들의 참석 바랍니다.
사전등록신청은 지난번 하계세미나처럼 온라인으로 간편하게 접수 가능합니다.
https://goo.gl/forms/FPLfxGQ5ZeOdh6A63 <- 사전등록신청 링크
Global mapping of artificial intelligence in Google and Google ScholarHan Woo PARK
Omar, M., Mehmood, A., Choi, G.S., Park, H.W.@ (2017 Online First). Global mapping of artificial intelligence in Google and Google Scholar. Scientometrics.
https://link.springer.com/article/10.1007%2Fs11192-017-2534-4
#인공지능 분야의 국가별 현황과 전망을 #웹보메트릭스 #빅데이터 #구글데이터 이용해서 세계지도를 그렸습니다.
박한우 영어 이력서 Curriculum vitae 경희대 행사 제출용Han Woo PARK
Full Prof. Dr. Han Woo PARK, http://www.hanpark.net https://www.slideshare.net/hanpark
(BA-HUFS, MA-Seoul Nat'l Univ. PhD-SUNY Buffalo)
Dept of Media & Communication, Interdisciplinary Program of Digital Convergence Business, YeungNam University, 214-1, Dae-dong, Gyeongsan-si, Gyeongsangbuk-do, South Korea, Zip Code 712-749
Editor-In-Chief of Journal of Contemporary Eastern Asia, https://jceasia.org/
Guest Editors of Social Science Computer Review, Journal of Computer-Mediated Communication, Asian Journal of Communication, Scientometrics, Quality & Quantity, Technological Forecasting & Social Change
Editorial Boards of Scientometrics, Quality & Quantity, International Journal of Internet Science, Big Data & Society, CollNet Journal of Scientometrics & Information Management, Knowledge Economy, International Journal of Technology Management & Sustainable Development, Social Media & Society, Triple Helix - A Journal of University-Industry-Government Innovation and Entrepreneurship, Technological Forecasting & Social Change, Journal of Data & Information Science, Scholarly Metrics and Analytics (a specialty of Frontiers in Library and Information Science)
Director of Cyber Emotions Research Institute
President of WATEF (World Association for Triple Helix & Future Strategy Studies,
Formerly, Asia Triple Helix Society)
Formerly, Directors of World Class University Webometrics Institute and TEDxPalgong ,Visiting Scholar of Oxford Internet Institute https://www.oii.ox.ac.uk/people/han-woo-park/ Research Associate of Royal Netherland Academy (NIWI-KNAW http://virtualknowledgestudio.nl/people/former-vks-members/
Twitter network map of #ACPC2017 1st day using NodeXLHan Woo PARK
The Asian Conference for Political Communication 2017 is a biennial conference spearheaded by the Media Programme Asia of Konrad-Adenauer-Stiftung. Join fellow influencers in academia, politics and government on this special occasion. Talk about challenges on social media, discuss the odds and threats of #twiplomacy, analyze the phenomena of rising populism and watch the hottest tools for e-campaigning.
2016년 촛불집회는 과거와 달리 수도권뿐만 아니라 지방에서도 전개되었다. 그러나 서울 광화
문 광장 이외에서 진행된 촛불집회에 대한 사회적 관심은 그 중요성에 비해서 주목받지 못했다.
이 연구는 지방의 촛불집회 특히, 대통령의 정치적 고향인 대구·경북(TK) 촛불집회에 주목하였
다. 본 논문은 페이스북에 남겨진 데이터를 이용해 촛불집회에 나타난 TK지역 여론의 행위자와
댓글의 내용을 검토한다. 첫째, 페이지의 운영주체에 따라 페이스북 이용자 행위의 차이가 있는
지 살펴보았다. 둘째, 집회유형에 따른 댓글의 의견과 그 전개양상이 다른지 살펴보았다. 분석방
법으로 이용자 반응분석, 연결망분석(social network analysis), 의미망분석이 사용되었다. 연구결과,
페이스북 이용자들의 관심도, 참여율, 응집도는 전통 미디어에서 운영한 페이지보다 시민참여형
UCC(user created content) 페이지에서 높게 나타났다. 집회유형으로 보면, 촛불집회 댓글들과 비
교해 ‘박사모’ 반응에서 노인폄하 단어 등 부정적 단어들이 더 자주 출현했다. 이 연구는 페이스
북 댓글 데이터를 이용해서 기존에 자주 수행된 마케팅과 선거캠페인을 넘어서 새로운 연구방향
을 제시했다는 점에서 학술적 의미뿐만 아니라 사회적 가치가 있다.
세계산학관협력총회 http://www.watef.org 패널을 공지합니다.
토론자로 참여가능한 분도 모집합니다. 많은 관심을 부탁드려요.
2017 Triple Helix Conference Special Issue Session http://www.triplehelix-korea.org/
Theme (주제): Measuring Triple Helix Synergies and Innovations using Scientometric, Technometric, Informetric, Webometric, and Altmetric Data
9월 15일 금요일 16:45 - 18:15 장소: 대구엑스코
페이스북 라이브 생중계: 서인수 (즐거운 사물인터넷 대표)
Organizers
Mi Young Chong (Univ. of North Texas, USA) miyoungchong@my.unt.edu
Han Woo Park (Yeungnam University, South Korea)
발표자: 김도훈, Brandon Moore, 윤정원
Presenter: Leo Kim
Title: From Institution to Individual: Data-Based Reflection of Triple-Helix Operation in South Korea
Biography: Leo Kim is the CEO of Ars Praxia. He graduated from LSE (Methodology, Master) and University of Sussex (Science and Technology Studies, PhD). He has been developing the methodology of semantic network analysis and has a professional background in innovation studies and unstructured data analysis.
Presenter: Brandon Moore
Title: Improving open data accessibility: Using domain driven design and microservice architecture to create user friendly open data systems
Biography: Brandon Moore is a solutions architect for Nationstar Mortgage LLC. He has 20 years experience as a software engineer and is currently the lead architect for a new reverse mortgage platform. He is also an Information Science PhD student at the University of North Texas. His research interests are text analytics and data mining.
Presenter: Jungwon Yoon
TItle: Triple Helix Dynamics of Technological Innovation Systems in South Korea: A Comparative Analysis
Biography: Jungwon Yoon is a research fellow at Soongsil University in South Korea. She received her Ph.D. in Sociology of Technology and Science from Georgia Institute of Technology, USA. Her areas of expertise are in science and technology studies (STS), including science & technology policy, sociology of sciences, innovation studies, and technology management. Her current research focuses on dynamics of innovation systems in both South and North Korea. Her latest publications include "Triple helix dynamics of South Korea’s innovation system: a network analysis of inter-regional technological collaborations" and "Quintuple helix structure of Sino-Korean research collaboration in science."
1. 이 슬라이드는
박한우, 박세정, David Stuart, 이승욱 (2009). API를 활용한 검색
프로그램 WeboNaver의 이해와 적용 : 18대 국회의원의 웹 가
시성 분석과 신종플루 관련단어의 연관성 분석. Journal of the
Korean Data Analysis Society. 11권 6호 (B). 3427-3440.
을 기초로 연구자들이 학술적 목적으로 Naver-API 서비스를 쉽게
사용할 수 있도록 만든 매뉴얼임.
* This slide was made by Han Woo Park and his students to help
researchers and students use the WeboNaver. Please cite Park’s
works using the WeboNaver.
•이 매뉴얼을 이용할 때에는 다음과 같이 밝혀 주기바람.
박한우 편 (2014). 웹보네이버를 이용한 웹보메트릭스 네트워크 분석.
•경산: 영남대학교. http://www.slideshare.net/hanpark/webo-naver2012-0902
2. 1. Webonaver
WeboNaver 프로그램 다운
[Hanpark.net] 접속 – 카테고리 중 [Software] 클릭
- [naver]로 글 검색 후, Webonaver OpenAPI 글에 있는
첨부파일 다운로드. 확장자를 exe로 변경 후 사용가능
1. 컴퓨터프로그램 개요
가. 프로그램 명칭 : 웹보네이버2.0
나. 접수번호(접수일) : 2014-011159-1 (2014.05.19)
다. 개발자 : 박한우
라. 저작자 : 영남대학교 산학협력단
마. 등록일 : 2014.05.20
바. 등록번호 : 제C-2014-011480호
3. 웹보네이버 활용동의서
• 안녕하세요.
• Hanpark.net 의 Software 코너에 소개된 웹보메트릭스 툴들에 대해서 많은 관심을 보여주셔서
감사합니다. 저희 쪽에서 개발된 툴의 사용을 위해서 Authentication Key가 반드시 필요합니다.
인증키를 모두 공개하고 싶지만, 저희도 테스트를 하면서 사용중인지라 불가피하게 비공개하고
있습니다. 설상가상으로, 풀타임 프로그래머가 사직한 관계로 어려움이 많으니 양해바랍니다.
• 오프라인 모임에 참석하여 인증키를 받으신 분들 가운데, 동의서를 작성하지 않은
분은 아래 링크에서 작성하여 제출해 주기 바랍니다.
http://bit.ly/1i7jQAs
• 인증키를 주변인에게 전달하는 행위를 금지합니다! 연구실에서는 해당 사용자와
웹보메트릭스툴에 관해서 앞으로 어떠한 협력도 하지 않을 것입니다. 신중하게 사용해 주시기
바랍니다.
• 학술논문 이외의 기업 컨셜팅, 용역/계약 연구 (한국연구재단 포함) 등 상업적 분석사례가
많아지고 있습니다. 프로그래머를 고용하여 개발하기 바랍니다. 소프트웨어 산업이 죽고
있습니다
• Limit 버전은 20회 사용제한이 있습니다. Professional 버전은 구매해야 합니다. 구매를 원하시면
아래 주소로 연락바랍니다. 가격은 사용용도와 데이터 처리량에 따라 다릅니다.
hanpark@ynu.ac.kr parkhanwoo@hotmail.com
4. 1. Webonaver
WeboNaver 동의서 작성
URL :
https://docs.google.com/forms/d/
1NyLAnXg3mFbFQPSQNLkTtF_5Iir
BGqTsdPzyEkUiEu0/viewform
WeboNaver 사용 전 반드시
위의 URL에 방문하여
웹보매트릭스툴 사용동의서 작성
5. WeboNaver 관련 논문
• WeboNaver을 이용할 때에는 아래 참고문
헌을 반드시 적기 바랍니다. 저도 모르는
사이에 상업적 이용으로 보이는 분석사례
가 많아지고 있습니다.
• 사이버감성연구소는 지식의 사회적 확산
을 위해서 비상업적으로 사용하는 이용자
를 위해서 배포하고 있습니다.
6. WeboNaver 관련 논문
• 박한우, 박세정, David Stuart, 이승욱 (2009). API를 활용한 검색 프로그램 WeboNaver의 이해와 적용 : 18대 국회의원의 웹 가시성 분석
과 신종플루 관련단어의 연관성 분석. Journal of the Korean Data Analysis Society. 11권 6호 (B). 3427-3440.
• 박한우 (2010년 12월). e-사이언스 시대의 인문사회학 연구하기-인터넷 연구방법을 중심으로. 사회과학연구. 30권, 2호, 195-211.
• 임연수, 박한우 (2010년 2월). 10.28 재보궐 선거의 블로그 캠페인에 대한 웹계량화 분석. Journal of the Korean Data Analysis Society,
12권, 1호 (B), 539-551.
• Khan, G. F., & Park, H. W. @ (2011). Measuring the Triple Helix on the Web: Longitudinal Trends in the University-Industry-
Government Relationship in Korea. Journal of the American Society for Information Science and Technology*.16 (12), 2443-2455.
• Khan, G.F., Cho, S.E., & Park, H. W. @ (2012). A Comparison of the Daegu and Edinburgh Musical Industries: A Triple Helix Approach.
Scientometrics*. 90 (1), 85-99.
• Lim, Y. S., & Park, H. W. @ (2011). How Do Congressional Members Appear on the Web?: Tracking the Web Visibility of South
Korean Politicians. Government Information Quarterly*. 28 (4), 514-521.
• Lim, Y. S., & Park, H. W. @ (2011). How Do Congressional Members Appear on the Web?: Tracking the Web Visibility of South
Korean Politicians. Government Information Quarterly*. 28 (4), 514-521.
• Lim, Y. S., & Park, H.W. @ (2013 forthcoming). The Structural Relationship between Politicians' Web Visibility and Political Finance
Networks: A Case Study of South Korea's National Assembly Members. New Media & Society*.
• Lim, Y. S., & Park, H.W. @ (2013). The Structural Relationship between Politicians' Web Visibility and Political Finance Networks: A
Case Study of South Korea's National Assembly Members. New Media & Society*. 15(1), 93-108.
• Nam, Y., Lee, Y.-O., Park, H.W. @ (2013). Can web ecology provide a clearer understanding of people’s information behavior during
election campaigns?. Social Science Information*. 52(1), 91-109.
• Nam, Y., Lee, Y., & Park, H.W.@ (2014 Accepted). Measuring web ecology by Facebook, Twitter, Blog and online news: 2012 general
election in South Korea. Quality & Quantity*. DOI: 10.1007/s11135-014-0016-9.
• Ozel, B., & Park, H. W. @ (2012). Examining Korean political figures using co-word analysis in agreement with facial expressions in
posted self-images. COLLNET JOURNAL OF SCIENTOMETRICS & INFORMATION MANAGEMEN, 6 (1), 43-60.
• Ozel, B., & Park, H. W. @ (2012). Online Image Content Analysis of Political Figures: An Exploratory Study, Quality & Quantity*. 46
(4), 1013–1024. DOI 10.1007/s11135-011-9445-x
• Sams, S., Lim, Y. S., & Park, H. W. @ (2011). E-research applications for tracking online socio-political capital in the Asia-Pacific
region. Asian Journal of Communication*. 21 (5), 450-466.
• Vergeer, M., Lim, Y. S., & Park, H. W. (2011). Mediated relations: New methods to study online social capital. Asian Journal of
Communication*. 21 (5), 430-449.
7. WeboNaver 관련 발표
* 박한우 (2014.4.10.). 사이버 소셜여론 조사도구로서의 네이버-웹보메
트릭스와 빅데이터 분석. 한국사이버커뮤니케이션 ‘네이버와 포털’ 특
별세미나. http://www.slideshare.net/hanpark/4march2014
* Park, H.W.(2014.4.4). The coming of shadows in big data research?
Widening and narrowing scholarly divide. International Workshop on
Social Media and Culture, KAIST. http://www.slideshare.net/hanpark/big-data-
divided-24-march2014
8.
9. 1. Webonaver
WeboNaver 프로그램 소개 (ver.2014.05.07)
Save Data Type
-> 기록 방식을 선택
Data Sources
-> 검색이 되는 카테고리를 선택
OutPut Format
-> 자료가 저장될 때에 포맷을 선택
Query File
-> 검색할 단어가 들어있는 TXT를 선택
Naver API, Authentication Key
-> 가지고 있는 키를 적어 넣는다.
Run Queries
-> 검색을 실시
13. 1. Webonaver
Query File 만들기
메모장에 쿼리를 입력한 후
[다른 이름으로 저장]한다.
만약, 띄어쓰기가 포함된 쿼리를
입력할 경우, 큰따옴표(“,”)를
사용하여 단어를 한정해준다.
• 저장 시
‘인코딩’은 반드시 ‘UTF-8’
파일 제목은 ‘text’로 저장함
14. 1. Webonaver
Query File 만들기
1. [Query File]에 ‘text’ 파일을 불
러옴
2. [Naver API Key]와
[Authorification Key]를 입력함
3. 원하는 [Data Sources] 체크
4. 하단에 [Run Queries] 클릭하
여 프로그램 실행
15. 1. Webonaver
Output
1. ‘Done’ 이라는 창이 뜨면 실행 완료된 것
2. ‘Text’를 저장한 폴더에 들어가 보면
체크했던 Data Sources에 따라
많은 Output 파일 생성된 것을 볼 수 있음
16. 1. Webonaver
Output - Count
각각의 count 파일
: 각각 쿼리가 가지고 있는 검색량(게시글) 수
: 가장 끝에 있는 값이 실제 네이버에서 검색결과를 갖고 있는 값
: 쿼리 뒤에 나열된 숫자들이 차이가 난다면 이는 프로그램의 오류가 아니라
첫 숫자는 존재할 수 있는 검색량의 가능성이며,
점차 숫자가 줄어드는 것은 실제 네이버에 저장된 검색량의 오차를 줄여가는 과정임.
17. 1. Webonaver
Output - Records
각각의 Records 파일
: 실제 검색된 글과 URL 주소 확인 가능
: URL 주소는 ‘www~’형식이 아닌 ‘OpenAPI’ 형식으로 나옴.
Webonaver 프로그램의 [Manipulate] 가능을 활용해
원래의 URL 주소(www~)를 얻을 수 있다.
: 각 쿼리 당 최대 1,000개까지 저장 가능
18. 1. Webonaver
Manipulate
원래 URL 얻기
1. Records 파일을 엑셀로 연다
2. OpenAPI 형식으로 된 주소
(C열)을 복사하여 메모장에
복사
3. 메모장을 [다른 이름으로 저장]
* 저장할 때!
: 파일명은 무엇이든 상관 없음
: 인코딩은 ‘ANSI’로
21. 3. KrKwic
KrKwic이란?
1. Korean Key Words In Context
2. 커뮤니케이션 메시지의 의미가 ‘자주 사용되는 단어’
에 있다고 판단하여, 특정 텍스트에서 자주 사용되
는 단어를 찾기 위해 사용
3. 오픈 사이언스 정신에 입각한
유일한 한글 Semantic Network Analysis
4. KrKwic/KrWords, KrTitle, KrText로 나뉘어져 있음
22. 3. KrKwic
KrKwic 구성
1. KrKwic/KrWords: 단어 빈도 분석을 통해 내용의 핵
심어, 주요 이미지, 중요 이슈를 파악함
2. KrTitle: 논문, 웹사이트, 기사, 특허, 법조문 등의
제목과 요약문 또는 주관식 응답, 드라마나 영화의
대사, 조직 목표, 광고 카피, 일상 대화 같이 비교적
짧은 메시지
3. KrText: KrTitle로 처리하기에 분량이 비교적 많은
메시지를 독립적인 파일로서 취급하여 분석
24. 3. KrKwic
KrKwic 주의
1. KrKwic 프로그램 설치 시, 오류 최소화를 위해
C드라이브에 바로 설치
- 혹은 ‘dev’라는 폴더를 새로 생성하여
‘dev’ 폴더 안에서 작업을 하는 것이 좋음
2. KrKwic는 도스버전과 윈도우버전이 존재하나
비교적 안전한 도스버전 사용 권장
* 윈도우 버전은 현재 버그 수정 중이며, 소프트웨어 등
록 후에 판매함
25. 3. KrKwic
KrKwic 사용 전 동의서 작성
URL:
https://docs.google.com/forms/d/1zJ
cFVQEF0JZML0bq-
gnQNNyzc1LfD_rzbzE2nEjCh_Y/viewf
orm
KrKwic 프로그램 사용 전에 반드시
위의 URL에 접속하여
KrKwic 사용 동의서 작성해야 함
30. 3. KrKwic
KrWords
엑셀을 이용해 ‘wrdfrq.dbf’ 파일을 열면
각각 단어의 빈도수를 알 수 있음
단어 빈도 목록을 이용하여 메시지의
핵심어를 파악할 수 있음
실제 조사에서는 정제 과정을 거쳐
무의미한 단어를 최대한으로 걸러주는
작업을 거쳐야 함
34. 3. KrKwic
KrTitle
폴더로 돌아가면 프로그램 실행 후 얻어
진 파일들을 확인할 수 있다
matrix.dbf
: 메시지(사례) X 단어(변인) 행렬로,
각 칸의 값은 단어가 메시지에서
출현한 빈도 나타냄
coocc.dat와 coocc.dbf
: 단어 X 단어 공출현 빈도 행렬로,
각 칸의 값은 단어들이 메시지에서
동시에 출현한 빈도를 나타냄
cosine.dat와 cosine.dbf
: 단어 X 단어 코사인 행렬로,
각 칸의 값은 단어 간 거리를 나타냄
45. 두 검색어의 관계
두 가지 단어를 동시에 검색하여 두 단어간의 관계 알 수 있음
Webonaver로 쿼리 검색 후 바로 네트워크 그릴 수 있음
46. 두 검색어의 관계
1. 두 가지 검색어를 함께
Webonaver(최신ver)로
분석해 각종 records와
count 파일을 얻어냄
- 이는 두 브랜드의 연관관계를
알기 위함이며
- 검색어 간의 그루핑(Grouping) 가능
** 유의사항
검색어를 메모장으로 저장할 때,
인코딩은 반드시 ‘UTF-8'로!!!!
4-2. 두 검색어의
관계
47. 2. 추출한 Count 파일을
엑셀로 연다
1) 카운트 된 숫자들 중
첫 번째 숫자들만 놔두고 지움
2) 그리고 다시 저장
(저장할 때 형식은 ‘Excel통합문서’로!!!,
이름은 상관없음)
4-2. 두 검색어의
관계
두 검색어의 관계
48. 3. 저장된 자료를 UCINET6에서 불러옴
- [Data] – [Import Excel] – [DL Type Format] 클릭 후
‘DL Editor’ 창이 뜨면 [File] – [Open Excel File] 클릭하여
저장한 파일 불러오기
(혹은 위의 이미지에 표시된 단축 아이콘들을 눌러서 불러오기)
4-2. 두 검색어의
관계
두 검색어의 관계
49. 4. 열린 창의 우측에 있는
‘Data format’을
‘Edgelist1’로 설정
1) 또, ‘Output Options’에서
‘Force Symmetry’를 체크해줌
(방향성이 없는 경우에만 해당함)
5. 설정을 마친 후,
파일 저장
-> 그러면 UCINET6에 사용되는
포맷으로 저장된 것임
4-2. 두 검색어의
관계
두 검색어의 관계
50. 6. Visual Network Map을 그리기 위해
UCINET6에 있는 [Netdraw]를 열어줌
4-2. 두 검색어의
관계
두 검색어의 관계
51. 7. 위의 단축 아이콘을 차례로 눌러,
금방 저장했던 UCINET 포맷의 파일을
열어줌
4-2. 두 검색어의
관계
두 검색어의 관계
52. 각 검색어 간의 네트워크를 나타낸 Map 확인할 수 있음
* 여러 옵션을 통해 네트워크 선의 굵기 등 설정 가능
4-2. 두 검색어의
관계
두 검색어의 관계
62. 단어구름 - Tagxedo
5. 네트워크
그리기
KrKwic 프로그램으로 얻은
‘wrdfrq.dbf’ 파일을 열어
자료 복사
63. 단어구름 - Tagxedo
5. 네트워크
그리기
Tagxedo – Creator
http://www.tagxedo.com/app.html
‘Load’를 클릭하여
‘Enter Text’에 자료 붙여 넣은 후
‘Submit’를 누른다.
64. 단어구름 - Tagxedo
5. 네트워크
그리기
단어구름 완성!
좌측에 있는
Respins와 Options를
이용해 단어 구름의
모양, 색깔 설정 가능
65. 이 슬라이드는 Thelwall, Webometric Analyst Manual 을 기초로
한국 이용자들이 Webometric Analyst 를 쉽게 사용할 수 있도록
만든 매뉴얼입니다. Webometric Analyst 최근 버전을 사용했으며,
사례 또한 원제와 상이합니다.
* This slide was made by Han Woo Park and his students to help
Korean users use the Webometric Analyst
WeboNaver와
Webometrics Analyst와 연결하기
74. 또 다른 방법
6-2. 또다른 방법
Query를 저장한 파일을 이
용해 Data Sources를 추출
하는 과정에서부터 원래의
URL을 함께 얻을 수 있는
방식
1. 초반에 만들었던 Query 파일
(‘text’라고 저장한 파일)을
[Query File]에 불러옴
2. [Naver API Key]와 [Auth. Key]
를 입력함
3. 원하는 [Data Sources] 체크
4. Output Format에서
[Webometric Analyst 2.0] 체크
5. 하단에 [RunQueries] 클릭하여
프로그램 실행
75. 6-2. 원래의 URL 얻기 / 또다른 방법
6-2. 또다른 방법
폴더로 돌아가면 records 파일이
생성된 것을 알 수 있음
76. 6-2. 원래의 URL 얻기 / 또다른 방법
6-2. 또다른 방법
Records 파일을 엑셀로 열어 오류가 난 부분은 삭제해 줌
(정제과정을 거치지 않으면 제대로 된 결과를 얻을 수 없음)
77. 6-2. 원래의 URL 얻기 / 또다른 방법
6-2. 또다른 방법
정제과정을 거친 파일을 [다른 이름으로 저장]함
* 저장 시, 파일형식은 반드시 ‘탭으로 분리’로 저장
78. 정제하여 저장한 파일을 다시 메모장으로 열어준다.
그리고 인코딩을 ‘UTF-8’로 바꾸어 다시 저장한다.
원래의 URL 얻기 / 또 다른 방법
6-2. 또다른 방법
87. Prof. Han Woo PARK
CyberEmotions Research Center
Department of Media and Communincation,
YeungNam University, Korea
hanpark@ynu.ac.kr
http://www.hanpark.net
Formerly,
World Class University Webometrics Institute
WCU
WEBOMETRICS
INSTITUTE
INVESTIGATING INTERNET-BASED POLITIC WITH E-RESEARCH TOOLS