KISTI 계산과학공학센터에서 2017년 4월에 발표한 자료입니다. 오픈사이언스와 연구데이터, 빅데이터, 과학데이터, 데이터과학자에 대한 내용을 담고 있습니다.
공학, 의료영상, 자연과학 및 산업분야에서 제기되는 문제를
수리모델링-시뮬레이션-시각화과정을 통하여 예측/분석, 사용자에게 효율적인 프로그램 개발, 산업화에 이르기까지
다단계 연구를 종합적으로 수행하는 센터에서 인사이트를 가져사겼길 바랍니다.
- 4세대 연구 패러다임 변화
- 연구환경 변화
- 연구자가 원하는 콘텐트
- Open Science
- Data 정의 및 구분
- Dataset & Meta data
- Research records
- 연구 데이터 정의 및 사례
- 과학 데이터 정의 및 특징
- Data Publication
- Data Journal
- Data Paper
- Data Management Plan
- Data Repository
- Data Scientists
- 과학의 신뢰와 DMP-ProRR
KISTI 계산과학공학센터에서 2017년 4월에 발표한 자료입니다. 오픈사이언스와 연구데이터, 빅데이터, 과학데이터, 데이터과학자에 대한 내용을 담고 있습니다.
공학, 의료영상, 자연과학 및 산업분야에서 제기되는 문제를
수리모델링-시뮬레이션-시각화과정을 통하여 예측/분석, 사용자에게 효율적인 프로그램 개발, 산업화에 이르기까지
다단계 연구를 종합적으로 수행하는 센터에서 인사이트를 가져사겼길 바랍니다.
- 4세대 연구 패러다임 변화
- 연구환경 변화
- 연구자가 원하는 콘텐트
- Open Science
- Data 정의 및 구분
- Dataset & Meta data
- Research records
- 연구 데이터 정의 및 사례
- 과학 데이터 정의 및 특징
- Data Publication
- Data Journal
- Data Paper
- Data Management Plan
- Data Repository
- Data Scientists
- 과학의 신뢰와 DMP-ProRR
마이크로소프트의 회장인 빌게이츠는 4세대 연구패러다임을 주장한 짐 그레 이(Jim Gray) 생각에 대해 다음과 같이 주장했다. “데이터와 소프트웨어가 과학 을 한다고 재정의 함으로써, 과학에 대해 우리가 새로운 방법으로 사고하도록 했 다”. 이것은 연구 데이터의 중요성을 역설한 것으로 볼 수 있다. 해외 주요 선진국에서는 이러한 연구 데이터의 수집 및 저장, 관리, 보존, 출 판, 서비스를 위한 다양한 활동을 하고 있으며, 이와 관련된 전문 인력을 채용하 고 있다. 국내에서도 체계적인 연구 데이터 관리와 재사용을 보장하기 위해, 연 구데이터 통합 관리 체계를 구축 중에 있다. 본고에서는 연구 데이터와 관련된 국 내외 주요 동향을 살펴보고 도서관 현장에서 무엇을 준비해야 하는지 알아본다.
2017 한국정보관리학회 하계학술대회 튜토리얼 발표자료 part04 입니다. 데이터 관리 계획서(Data Management Plan)에 대해 전반적인 이야기를 합니다. DMP 특징과 여러가지 DMP 템플릿을 비교한 결과가 담겨있습니다. NSF에서 요구하는 DMP의 요건에 대해 살펴봅니다.
BIC STAR Library 세미나 발표자료입니다.
기하급수
과학 특성 & RDM 배경
설문으로 바라본 RDM, DMP, RDS
데이터
연구 데이터
데이터 관리 계획
RDM, RDS 사례 및 동향
Data Scientists & Data Librarian
RDS Services : BIC Star Library
2019-1차 통합포털도서관 시스템 구축 추진협의회 워크숍 발표자료 입니다. 연구 데이터와 DMP 대응을 주제로 CoreTrustSeal에 대한 내용을 발표하였습니다.
연구자들이 신뢰할 수 있는 데이터 리포지터리가 되는 방법은 여러가지가 있을 수 있습니다. 그중 하나는 데이터 리포지터리 품질을 인증해주는 기관으로 부터 인증을 받는 것일 수 있습니다.
Research Data Alliance 워킹그룹을 통해 선언된 CoreTrustSeal 단체에서 ICSU World Data System (ICSU-WDS) 인증과 Data Seal of Approval (DSA) 인증을 대체하는 데이터 리포지터리 인증기준(요구사항)을 발표하였습니다.
본 발표 자료에는 해당 인증기준(요구사항)을 분석한 내용이 담겨져 있습니다.
- 4세대 연구 패러다임 변화
- 연구환경 변화
- 연구자가 원하는 콘텐트
- Open Science
- Data 정의 및 구분
- Dataset & Meta data
- Research records
- 연구 데이터 정의 및 사례
- 과학 데이터 정의 및 특징
- Data Publication
- Data Journal
- Data Paper
- Data Management Plan
- Data Repository
- Data Scientists
- 과학의 신뢰와 DMP-ProRR
2022년 11월 4일 포항공대에서 학생들을 대상으로 진행된 강연의 자료를 업로드함.
참고자료:
- 매경프리미엄 "가짜 과학의 감정적 측면"
https://www.mk.co.kr/premium/special-report/view/2019/06/25746/
- 매경프리미엄 "가짜과학 판별법"
https://www.mk.co.kr/premium/special-report/view/2019/06/25942/
- 시사IN: 과학이 무엇인지에 대한 소개
https://www.sisain.co.kr/news/articleView.html?idxno=45490
- 과학잡지 에피 6 호
뇌과학과 교육 분야의 가짜 과학 : 신경신화 (neuromyth)” 송민령
- 과학잡지 에피 14 호
뇌과학과 인공지능은 같은 학문일까 ?” 송민령
마이크로소프트의 회장인 빌게이츠는 4세대 연구패러다임을 주장한 짐 그레 이(Jim Gray) 생각에 대해 다음과 같이 주장했다. “데이터와 소프트웨어가 과학 을 한다고 재정의 함으로써, 과학에 대해 우리가 새로운 방법으로 사고하도록 했 다”. 이것은 연구 데이터의 중요성을 역설한 것으로 볼 수 있다. 해외 주요 선진국에서는 이러한 연구 데이터의 수집 및 저장, 관리, 보존, 출 판, 서비스를 위한 다양한 활동을 하고 있으며, 이와 관련된 전문 인력을 채용하 고 있다. 국내에서도 체계적인 연구 데이터 관리와 재사용을 보장하기 위해, 연 구데이터 통합 관리 체계를 구축 중에 있다. 본고에서는 연구 데이터와 관련된 국 내외 주요 동향을 살펴보고 도서관 현장에서 무엇을 준비해야 하는지 알아본다.
2017 한국정보관리학회 하계학술대회 튜토리얼 발표자료 part04 입니다. 데이터 관리 계획서(Data Management Plan)에 대해 전반적인 이야기를 합니다. DMP 특징과 여러가지 DMP 템플릿을 비교한 결과가 담겨있습니다. NSF에서 요구하는 DMP의 요건에 대해 살펴봅니다.
BIC STAR Library 세미나 발표자료입니다.
기하급수
과학 특성 & RDM 배경
설문으로 바라본 RDM, DMP, RDS
데이터
연구 데이터
데이터 관리 계획
RDM, RDS 사례 및 동향
Data Scientists & Data Librarian
RDS Services : BIC Star Library
2019-1차 통합포털도서관 시스템 구축 추진협의회 워크숍 발표자료 입니다. 연구 데이터와 DMP 대응을 주제로 CoreTrustSeal에 대한 내용을 발표하였습니다.
연구자들이 신뢰할 수 있는 데이터 리포지터리가 되는 방법은 여러가지가 있을 수 있습니다. 그중 하나는 데이터 리포지터리 품질을 인증해주는 기관으로 부터 인증을 받는 것일 수 있습니다.
Research Data Alliance 워킹그룹을 통해 선언된 CoreTrustSeal 단체에서 ICSU World Data System (ICSU-WDS) 인증과 Data Seal of Approval (DSA) 인증을 대체하는 데이터 리포지터리 인증기준(요구사항)을 발표하였습니다.
본 발표 자료에는 해당 인증기준(요구사항)을 분석한 내용이 담겨져 있습니다.
- 4세대 연구 패러다임 변화
- 연구환경 변화
- 연구자가 원하는 콘텐트
- Open Science
- Data 정의 및 구분
- Dataset & Meta data
- Research records
- 연구 데이터 정의 및 사례
- 과학 데이터 정의 및 특징
- Data Publication
- Data Journal
- Data Paper
- Data Management Plan
- Data Repository
- Data Scientists
- 과학의 신뢰와 DMP-ProRR
2022년 11월 4일 포항공대에서 학생들을 대상으로 진행된 강연의 자료를 업로드함.
참고자료:
- 매경프리미엄 "가짜 과학의 감정적 측면"
https://www.mk.co.kr/premium/special-report/view/2019/06/25746/
- 매경프리미엄 "가짜과학 판별법"
https://www.mk.co.kr/premium/special-report/view/2019/06/25942/
- 시사IN: 과학이 무엇인지에 대한 소개
https://www.sisain.co.kr/news/articleView.html?idxno=45490
- 과학잡지 에피 6 호
뇌과학과 교육 분야의 가짜 과학 : 신경신화 (neuromyth)” 송민령
- 과학잡지 에피 14 호
뇌과학과 인공지능은 같은 학문일까 ?” 송민령
KERIS 학술정보 글로벌 동향 2019년 Vol.2
대학도서관은 학술 연구자라는 중요한 목표 이용자와 결과물에 대한 서비스 지원을 위해 노력해 옴. 오픈 사이언스는 새로운 열린 학술 연구 생태계를 대표하는 용어이며, 관련 도구는 학술 출판 생애주기 전체를 지원함. 데이터 중심의 개방 지향적 정보화 환경에서 도서관은 이전보다 적극적으로 학술 커뮤니케이션 전반에 대한 이해와 지원을 위한 서비스 시대에 대응해야함
Similar to 학술데이터 공유 플랫폼 - 김선태 (20)
Unpacking an activist toolbox: EFF's tools and tips for effective copyright a...Creative Commons Korea
Maira Sutton
Global Policy Analyst, Electronic Frontier Foundation (EFF)
Parker Higgins
Activist, Electronic Frontier Foundation (EFF)
Creative Commons Global Summit 2015, Seoul, Korea
How do we scale OER? - Matt McGregor
Global Voices and CC - Mohamed ElGohary
Helping authors who write to be read - Michael Wolfe
Introducing Embedr.eu - Maarten Zeinstra
Creative Commons Global Summit 2015, Seoul, Korea
8. • 1960년 Peter Naur ‘computer science’의 대체 용
어로 처음 사용. ‘datalogy’ 개념으로 사용
• 2015년 10월 현재 구조적 혹은 비구조적인 다양한
형식의 방대한 데이터로부터 지식과 통찰력(insights)
를 추출하는 분야와 이의 행위를 돕는 시스템과 관련
된 다양한 분야
• 데이터 과학은 규모가 큰 빅 데이터에만 특화된 것이
아님. 빅 데이터를 처리하기 위한 방법론들은 데이터
과학의 특화된 분야 중 하나일 뿐
• 데이터 과학은 비즈니스 환경에서 폭발적으로 사용되
고 있지만 많은 학자와 저널리스트들은 ‘데이터 과학’
과 ‘통계학’의 차이점이 명확하지 않기 때문에 데이터
과학이 부각되는 것을 비판 Data science (출처: https://en.wikipedia.org/wiki/Data_science)
Data Science (1/3)
8
9. 수학, 통계학
계량분석화학
정보 과학, 컴퓨터 과학
신호처리
가능성 모델
기계학습, 통계학습
데이터 마이닝
데이터베이스
데이터 엔지니어링
패턴 인식과 학습
가시화
미래분석
불확실성 모델링
데이터 웨어하우징
데이터 압축
컴퓨터 프로그래밍
인공 지능
고성능 컴퓨팅 …
농업
의료
마케팅 최적화
이상행위 감지
위기관리
마케팅 분석
공공 정책 …
기후 변화나 황사, 해
양 오염 등 범 지구적
문제 해결 노력
다양한 분야에서
문제점을 조사하고
의사결정을 지원하는데 사용
Data Science (2/3)
9
10. Data Science (3/3)
• 기후기후기후기후 데이터의데이터의데이터의데이터의 경우경우경우경우,,,, 과거에는과거에는과거에는과거에는 기후기후기후기후 분야를분야를분야를분야를 연구하는연구하는연구하는연구하는 과학과학과학과학
자들이자들이자들이자들이 주주주주 사용사용사용사용
• 오늘날에는오늘날에는오늘날에는오늘날에는 물과물과물과물과 공공용지공공용지공공용지공공용지(public land),(public land),(public land),(public land), 건강건강건강건강,,,, 해양해양해양해양 분야분야분야분야
등의등의등의등의 자원자원자원자원 관리자들이관리자들이관리자들이관리자들이 그들의그들의그들의그들의 의사결정과의사결정과의사결정과의사결정과 연구를연구를연구를연구를 위해위해위해위해 기기기기
후후후후 데이터데이터데이터데이터 접근접근접근접근 요청요청요청요청
• 정책정책정책정책 수립수립수립수립 분야에서도분야에서도분야에서도분야에서도 기후기후기후기후 변화변화변화변화 대응대응대응대응 전략을전략을전략을전략을 수립하기수립하기수립하기수립하기 위위위위
하여하여하여하여 데이터데이터데이터데이터 접근접근접근접근 필요필요필요필요
• 기하급수적으로기하급수적으로기하급수적으로기하급수적으로 발생하는발생하는발생하는발생하는 기후기후기후기후 데이터에데이터에데이터에데이터에 대한대한대한대한 물리적인물리적인물리적인물리적인
보존과보존과보존과보존과 공유에공유에공유에공유에 대한대한대한대한 이슈가이슈가이슈가이슈가 활발활발활발활발
출처: Overpeck, J. T., Meehl, G. A., Bony, S., and Easterling, D. R., “Climate Data Challenges in the 21st Century”, Science, Vol. 331, 2011.
10
12. OpenOpenOpenOpen Data (1/2)Data (1/2)Data (1/2)Data (1/2)
12
일부일부일부일부 데이터에데이터에데이터에데이터에 한해서한해서한해서한해서 저작권이나저작권이나저작권이나저작권이나 특허와특허와특허와특허와 같은같은같은같은
제한제한제한제한 조건조건조건조건 없이없이없이없이 데이터데이터데이터데이터 사용자가사용자가사용자가사용자가 원하는원하는원하는원하는 데로데로데로데로 데데데데
이터의이터의이터의이터의 재사용과재사용과재사용과재사용과 재재재재 출판이출판이출판이출판이 가능하도록가능하도록가능하도록가능하도록 하자는하자는하자는하자는
운동운동운동운동
이이이이 운동의운동의운동의운동의 사상은사상은사상은사상은 그그그그 역사가역사가역사가역사가 오래오래오래오래 됨됨됨됨
해당해당해당해당 용어의용어의용어의용어의 사용은사용은사용은사용은 인터넷과인터넷과인터넷과인터넷과 월드월드월드월드 와이드와이드와이드와이드 웹의웹의웹의웹의
도래와도래와도래와도래와 ‘‘‘‘Data.gov’, ‘Data.gov.uk’Data.gov’, ‘Data.gov.uk’Data.gov’, ‘Data.gov.uk’Data.gov’, ‘Data.gov.uk’와와와와 같같같같
은은은은 정부의정부의정부의정부의 공공데이터공공데이터공공데이터공공데이터 개방과개방과개방과개방과 발맞추어발맞추어발맞추어발맞추어 시작시작시작시작
두두두두 가지가지가지가지 측면에서측면에서측면에서측면에서 의미의미의미의미
---- 과학의과학의과학의과학의 활성화활성화활성화활성화 측면측면측면측면
---- 국가국가국가국가 데이터데이터데이터데이터 개방과개방과개방과개방과 재활용재활용재활용재활용 측면측면측면측면
‘과학 데이터(scientific data)로의 자유로운 접근’ 개념
67개국 참여 / 1957년 7월 - 1958년 12월 /
IGY(International Geophysical Year) 프로젝트 수행과정에
서 세계 데이터 센터(World Data Center) 시스템을 만드는
과정에서 공식적으로 탄생
Open Data 키워드를 사용하고 있다. 데이터 공개와 재 사용
성을 보장하기 위해서는 데이터의 체계적인 관리 필요
13. OpenOpenOpenOpen Data (2/2)Data (2/2)Data (2/2)Data (2/2)
13
오픈오픈오픈오픈 데이터는데이터는데이터는데이터는
오픈오픈오픈오픈 사이언스를사이언스를사이언스를사이언스를 가능케가능케가능케가능케 하는하는하는하는 핵심핵심핵심핵심 원칙원칙원칙원칙 중중중중 하나하나하나하나
데이터데이터데이터데이터 중심중심중심중심 연구를연구를연구를연구를 지원지원지원지원 과학의과학의과학의과학의 활성화를활성화를활성화를활성화를 가능케가능케가능케가능케 하는하는하는하는 운동운동운동운동
오픈오픈오픈오픈 데이터와데이터와데이터와데이터와 오픈오픈오픈오픈 사이언스를사이언스를사이언스를사이언스를 통해통해통해통해
다양한다양한다양한다양한 범범범범 지구적지구적지구적지구적 문제를문제를문제를문제를 해결할해결할해결할해결할 수수수수 있는있는있는있는 협동연구협동연구협동연구협동연구 가능가능가능가능
황사나황사나황사나황사나 기후기후기후기후 변화와변화와변화와변화와 같은같은같은같은 범범범범 지구적지구적지구적지구적 문제문제문제문제
해양해양해양해양 오염이나오염이나오염이나오염이나 생태계생태계생태계생태계 변화변화변화변화 등의등의등의등의 환경환경환경환경 문제는문제는문제는문제는
한한한한 분야의분야의분야의분야의 데이터데이터데이터데이터 뿐뿐뿐뿐 아니라아니라아니라아니라
기상기상기상기상,,,, 해양해양해양해양,,,, 천문천문천문천문,,,, 지리정보지리정보지리정보지리정보,,,, 생태생태생태생태 등등등등 다양한다양한다양한다양한 분야의분야의분야의분야의 데이터를데이터를데이터를데이터를
융합하여융합하여융합하여융합하여 분석함으로써분석함으로써분석함으로써분석함으로써 해결해결해결해결 가능가능가능가능
주요 선진국은
공공자금이 투입된 연구 결과물의 체계적인 관리와 재사용을 보장하기 위해서
연구 데이터(research data) 관리
이러한 저변 노력이 오픈 데이터와 오픈 사이언스 운동을 활성화 시킬 것