KISTI 계산과학공학센터에서 2017년 4월에 발표한 자료입니다. 오픈사이언스와 연구데이터, 빅데이터, 과학데이터, 데이터과학자에 대한 내용을 담고 있습니다.
공학, 의료영상, 자연과학 및 산업분야에서 제기되는 문제를
수리모델링-시뮬레이션-시각화과정을 통하여 예측/분석, 사용자에게 효율적인 프로그램 개발, 산업화에 이르기까지
다단계 연구를 종합적으로 수행하는 센터에서 인사이트를 가져사겼길 바랍니다.
2017 한국정보관리학회 하계학술대회 튜토리얼 발표자료 part04 입니다. 데이터 관리 계획서(Data Management Plan)에 대해 전반적인 이야기를 합니다. DMP 특징과 여러가지 DMP 템플릿을 비교한 결과가 담겨있습니다. NSF에서 요구하는 DMP의 요건에 대해 살펴봅니다.
BIC STAR Library 세미나 발표자료입니다.
기하급수
과학 특성 & RDM 배경
설문으로 바라본 RDM, DMP, RDS
데이터
연구 데이터
데이터 관리 계획
RDM, RDS 사례 및 동향
Data Scientists & Data Librarian
RDS Services : BIC Star Library
KISTI 계산과학공학센터에서 2017년 4월에 발표한 자료입니다. 오픈사이언스와 연구데이터, 빅데이터, 과학데이터, 데이터과학자에 대한 내용을 담고 있습니다.
공학, 의료영상, 자연과학 및 산업분야에서 제기되는 문제를
수리모델링-시뮬레이션-시각화과정을 통하여 예측/분석, 사용자에게 효율적인 프로그램 개발, 산업화에 이르기까지
다단계 연구를 종합적으로 수행하는 센터에서 인사이트를 가져사겼길 바랍니다.
2017 한국정보관리학회 하계학술대회 튜토리얼 발표자료 part04 입니다. 데이터 관리 계획서(Data Management Plan)에 대해 전반적인 이야기를 합니다. DMP 특징과 여러가지 DMP 템플릿을 비교한 결과가 담겨있습니다. NSF에서 요구하는 DMP의 요건에 대해 살펴봅니다.
BIC STAR Library 세미나 발표자료입니다.
기하급수
과학 특성 & RDM 배경
설문으로 바라본 RDM, DMP, RDS
데이터
연구 데이터
데이터 관리 계획
RDM, RDS 사례 및 동향
Data Scientists & Data Librarian
RDS Services : BIC Star Library
마이크로소프트의 회장인 빌게이츠는 4세대 연구패러다임을 주장한 짐 그레 이(Jim Gray) 생각에 대해 다음과 같이 주장했다. “데이터와 소프트웨어가 과학 을 한다고 재정의 함으로써, 과학에 대해 우리가 새로운 방법으로 사고하도록 했 다”. 이것은 연구 데이터의 중요성을 역설한 것으로 볼 수 있다. 해외 주요 선진국에서는 이러한 연구 데이터의 수집 및 저장, 관리, 보존, 출 판, 서비스를 위한 다양한 활동을 하고 있으며, 이와 관련된 전문 인력을 채용하 고 있다. 국내에서도 체계적인 연구 데이터 관리와 재사용을 보장하기 위해, 연 구데이터 통합 관리 체계를 구축 중에 있다. 본고에서는 연구 데이터와 관련된 국 내외 주요 동향을 살펴보고 도서관 현장에서 무엇을 준비해야 하는지 알아본다.
2019-1차 통합포털도서관 시스템 구축 추진협의회 워크숍 발표자료 입니다. 연구 데이터와 DMP 대응을 주제로 CoreTrustSeal에 대한 내용을 발표하였습니다.
연구자들이 신뢰할 수 있는 데이터 리포지터리가 되는 방법은 여러가지가 있을 수 있습니다. 그중 하나는 데이터 리포지터리 품질을 인증해주는 기관으로 부터 인증을 받는 것일 수 있습니다.
Research Data Alliance 워킹그룹을 통해 선언된 CoreTrustSeal 단체에서 ICSU World Data System (ICSU-WDS) 인증과 Data Seal of Approval (DSA) 인증을 대체하는 데이터 리포지터리 인증기준(요구사항)을 발표하였습니다.
본 발표 자료에는 해당 인증기준(요구사항)을 분석한 내용이 담겨져 있습니다.
- 4세대 연구 패러다임 변화
- 연구환경 변화
- 연구자가 원하는 콘텐트
- Open Science
- Data 정의 및 구분
- Dataset & Meta data
- Research records
- 연구 데이터 정의 및 사례
- 과학 데이터 정의 및 특징
- Data Publication
- Data Journal
- Data Paper
- Data Management Plan
- Data Repository
- Data Scientists
- 과학의 신뢰와 DMP-ProRR
- 4세대 연구 패러다임 변화
- 연구환경 변화
- 연구자가 원하는 콘텐트
- Open Science
- Data 정의 및 구분
- Dataset & Meta data
- Research records
- 연구 데이터 정의 및 사례
- 과학 데이터 정의 및 특징
- Data Publication
- Data Journal
- Data Paper
- Data Management Plan
- Data Repository
- Data Scientists
- 과학의 신뢰와 DMP-ProRR
[KERIS 이슈리포트] 요약 세미나 (Webinar) 자료
* 원문 링크: http://bit.ly/196LHBs
국내외 빅데이터 및 학습 분석 관련 기고서들과 동향 분석자료를 요약한 이슈리포트. UNESCO Policy Brief와 IMS Global의 백서를 중심으로 학습 분석 기술의 활용가능성과 쟁정들을 분석한 자료.
<주요>
1. 빅데이터 기술 및 산업 동향
2. 학습 분석 기술에 대한 이해
3. 학습 분석 기술 표준화 동향
4. 시사점
KERIS 학술정보 글로벌 동향 2019년 Vol.2
대학도서관은 학술 연구자라는 중요한 목표 이용자와 결과물에 대한 서비스 지원을 위해 노력해 옴. 오픈 사이언스는 새로운 열린 학술 연구 생태계를 대표하는 용어이며, 관련 도구는 학술 출판 생애주기 전체를 지원함. 데이터 중심의 개방 지향적 정보화 환경에서 도서관은 이전보다 적극적으로 학술 커뮤니케이션 전반에 대한 이해와 지원을 위한 서비스 시대에 대응해야함
마이크로소프트의 회장인 빌게이츠는 4세대 연구패러다임을 주장한 짐 그레 이(Jim Gray) 생각에 대해 다음과 같이 주장했다. “데이터와 소프트웨어가 과학 을 한다고 재정의 함으로써, 과학에 대해 우리가 새로운 방법으로 사고하도록 했 다”. 이것은 연구 데이터의 중요성을 역설한 것으로 볼 수 있다. 해외 주요 선진국에서는 이러한 연구 데이터의 수집 및 저장, 관리, 보존, 출 판, 서비스를 위한 다양한 활동을 하고 있으며, 이와 관련된 전문 인력을 채용하 고 있다. 국내에서도 체계적인 연구 데이터 관리와 재사용을 보장하기 위해, 연 구데이터 통합 관리 체계를 구축 중에 있다. 본고에서는 연구 데이터와 관련된 국 내외 주요 동향을 살펴보고 도서관 현장에서 무엇을 준비해야 하는지 알아본다.
2019-1차 통합포털도서관 시스템 구축 추진협의회 워크숍 발표자료 입니다. 연구 데이터와 DMP 대응을 주제로 CoreTrustSeal에 대한 내용을 발표하였습니다.
연구자들이 신뢰할 수 있는 데이터 리포지터리가 되는 방법은 여러가지가 있을 수 있습니다. 그중 하나는 데이터 리포지터리 품질을 인증해주는 기관으로 부터 인증을 받는 것일 수 있습니다.
Research Data Alliance 워킹그룹을 통해 선언된 CoreTrustSeal 단체에서 ICSU World Data System (ICSU-WDS) 인증과 Data Seal of Approval (DSA) 인증을 대체하는 데이터 리포지터리 인증기준(요구사항)을 발표하였습니다.
본 발표 자료에는 해당 인증기준(요구사항)을 분석한 내용이 담겨져 있습니다.
- 4세대 연구 패러다임 변화
- 연구환경 변화
- 연구자가 원하는 콘텐트
- Open Science
- Data 정의 및 구분
- Dataset & Meta data
- Research records
- 연구 데이터 정의 및 사례
- 과학 데이터 정의 및 특징
- Data Publication
- Data Journal
- Data Paper
- Data Management Plan
- Data Repository
- Data Scientists
- 과학의 신뢰와 DMP-ProRR
- 4세대 연구 패러다임 변화
- 연구환경 변화
- 연구자가 원하는 콘텐트
- Open Science
- Data 정의 및 구분
- Dataset & Meta data
- Research records
- 연구 데이터 정의 및 사례
- 과학 데이터 정의 및 특징
- Data Publication
- Data Journal
- Data Paper
- Data Management Plan
- Data Repository
- Data Scientists
- 과학의 신뢰와 DMP-ProRR
[KERIS 이슈리포트] 요약 세미나 (Webinar) 자료
* 원문 링크: http://bit.ly/196LHBs
국내외 빅데이터 및 학습 분석 관련 기고서들과 동향 분석자료를 요약한 이슈리포트. UNESCO Policy Brief와 IMS Global의 백서를 중심으로 학습 분석 기술의 활용가능성과 쟁정들을 분석한 자료.
<주요>
1. 빅데이터 기술 및 산업 동향
2. 학습 분석 기술에 대한 이해
3. 학습 분석 기술 표준화 동향
4. 시사점
KERIS 학술정보 글로벌 동향 2019년 Vol.2
대학도서관은 학술 연구자라는 중요한 목표 이용자와 결과물에 대한 서비스 지원을 위해 노력해 옴. 오픈 사이언스는 새로운 열린 학술 연구 생태계를 대표하는 용어이며, 관련 도구는 학술 출판 생애주기 전체를 지원함. 데이터 중심의 개방 지향적 정보화 환경에서 도서관은 이전보다 적극적으로 학술 커뮤니케이션 전반에 대한 이해와 지원을 위한 서비스 시대에 대응해야함
3개월 전 지인의 요청으로 금일 진행하게 된
15회 공감세미나 자료 공유 드립니다
대전제는 모든 것은 변한다는 것을 토대로 우리는 어떻게 데이터 전처리를 해야할까 하는 관점에서 작성 되었습니다
참고 문헌 링크 공유 드립니다.
의료기관 골든타임(CVR,Critical Value Report)을 위한 딥러닝의 가치
https://www.slideshare.net/jentshin/cvrcritical-value-report?qid=0ceca30e-f6ca-4fdb-8b89-e447e76cc852&v=&b=&from_search=1
임상의사 관점의 의료빅데이터 연구와 임상적용
https://www.slideshare.net/HyungJinChoi/20141028-40797212?qid=68241c11-9880-4d4d-922b-07b17b74a456&v=&b=&from_search=1
의료에서의 인공지능 정리 파일 김치원 V5
https://www.slideshare.net/ChiKim1/v5-73291156?from_m_app=android
상기 3가지 파일에서 필요한 부분을 참고 하였습니다.
감사합니다.
대형 병원의 교양 세미나에서 발표한 자료입니다.
이미 기술 지식은 충분하셨고 사례를 많이 궁금해 하셨습니다. 그래서 제 경험을 통해 얻었던 인사이트를 많이 나누었습니다. 하지만 의료현장은 플랫폼이나 기술보다는 의료기기로 접근하지 않으면 사용되기 힘들다는 생각이 들었습니다.
1. 과학데이터의 아카이빙 및 관련 자료 2010. 06. 03. 한국과학기술정보연구원(KISTI) 지식기반실 이상호 shlee@kisti.re.kr, Tel : 042-869-1765
2. 과학데이터의 정의 과학 데이터(Scientic Data, Research Data)란? 과학기술 연구활동(관찰, 모니터링, 조사, 실험, 연구 분석 등)의 산출물(수치, 공간, 도표, 문서등) 관찰(자연세계의 직접 관찰과 실험 결과의 관찰) 데이터의 내용 규정은 사용자에 의함 지진학자 지진파에 관심을 가지며 지진계에서 나온 데이터가 자신의 데이터 토목공학자 빌딩에 미치는 지진의 위험에 관심을 가지며 지진 목록이 자신의 데이터
3. 관찰 데이터와 실험 데이터 아카이빙 관점에서 관찰 데이터와 실험 데이터의 차이 관찰 데이터 특정 시간과 특정 장소에서 위성 또는 관측기구에 의해 현장에서 수집됨 관찰 데이터는 재현될 수가 없으므로 저장할 필요가 있음 실험(컴퓨터 실험 포함) 데이터 실험실의 실험 데이터는 재생산 가능하고 어떤 데이터들은 저장할 필요가 없음 대규모 실험 데이터 : 실험 규모가 크고 비용이 많이 들며 많은 연구자와 여러 프로젝트가 참여하는 실험의 결과 데이터는 당연히 저장되고 접근 가능해야 함 물리적 과학 데이터와 인간 관련 데이터 아이스 코어 샘플(기후 연구 관련), 조직 샘플(생물학), 비디오로 찍은 인간의 상호 작용, 질문 및 대답 등
4. 과학 데이터의 수집 및 이용 과정 Capture 주로 과학자에 의해 연구 현장에서 획득됨 많은 데이터가 관리되지 못하여 시간 경과에 따라 유실되고 있으며 연구자간 데이터 공유도 제한적임 현재의 과학 데이터 논의는 여기에 주로 초점이 맞추어져 있으며 많은 국가과학기술정보기관이 참여하고 있음 Curation 디지털 과학 데이터의 생명 주기를 통해 데이터의 유지, 보존, 가치 부가 등의 활동을 말함 연구 데이터의 가치를 보존하고 데이터의 중복 생성을 방지하며 레포지토리에 저장하여 연구자 커뮤니티에서 재사용 되도록 함 이 분야도 향후 국가과학기술정보기관이 참여해야 할 영역임 Analysis 과학 데이터의 분석은 과학자의 영역이며 공공기관 영역이 아님 Visualization 과학 데이터의 가시화 등도 과학자의 영역이며 공공기관의 영역이 아님
5. 과학 데이터의 생명 주기 Data Production 연구 설계의 선정, 데이터 획득을 위한 관측 기구 설치, 데이터 획득/생성, 데이터 편집/검증, 데이터 해석, 데이터 버전 백업 및 메타데이터 작성 Data Dissemination 데이터의 확산 절차와 방법의 확립, 보안/프라이버시 및 지적재산권 등을 고려한 접근 방법 조정, 데이터 포맷 및 메타데이터 Long-Term Data Management 데이터의 평가 및 선정, 리파지토리에의 저장, 신뢰성 검증, 데이터와 메타데이터의 수집 및 관리, 디지털 미디어 갱신 및 새로운 디지털 미디어에 데이터의 마이그레이션 Data Discovery and Repurposing 표준 메타데이터를 활용한 검색도구 개발 및 지원, 데이터의 코딩 조정, 데이터의 결합과 새로운 데이터 수집 방법 검토
6. 디지털 큐레이션의 생명 주기 1/3 데이터 획득 계획 수립(Conceptualise) 데이터 획득 방법 및 저장 옵션을 포함한 디지털 데이터(객체)의 생성에 대한 계획 수립 데이터 생성(Create) 디지털 데이터의 생성과 저장용 메타데이터(관리, 기술, 구조, 보존적 측면)의 작성 데이터 접근 및 사용(Access and Use) 이용자는 상시 디지털 데이터에 쉽게 접근할 수 있어야 하며 데이터에 따라 일반 공개 및 패스워드에 의한 제한 공개가 가능 검증 및 선정(Appraise and Select) 디지털 데이터의 검증을 통해 장기 큐레이션 및 보존이 필요한 데이터의 선정 문서화 된 지침서와 데이터 정책, 법적 요건 등이 첨부
7. 디지털 큐레이션의 생명 주기 2/3 폐기(Dispose) 장기 큐레이션 및 보존용으로 선정되지 않은 디지털 데이터의 폐기 안전한 폐기를 위해 문서화 된 지침서, 데이터 폐기 정책, 법적 요건등이 첨부 전송(Ingest) 아카이브, 안전한 디지털 리파지토리, 데이터센터 및 이와 유사한 곳에 디지털 데이터를 전송 문서화 된 지침서, 데이터 보관 정책, 법적 요건 등이 첨부 장기 보존(Preservation Action) 디지털 데이터 및 그 특성의 장기 보존 재평가(Reappraise) 평가 및 선정을 위한 검증 단계를 통과하지 못한 디지털 데이터의 재평가
8. 디지털 큐레이션의 생명 주기 3/3 보관(Store) 관련 표준에 의해 안전한 방법으로 데이터 보관 (접근 및 재사용)Access and Reuse 이용자에 의한 데이터에의 접근 및 재사용이 가능한지 확인 데이터에 따라 일반 공개 및 패스워드에 의한 제한 공개가 가능 전환(Transform) 다른 형태로 데이터를 마이그레이션 함으로써 기존 데이터를 새로운 디지털 데이터로 다시 전환(생성)
9. 현재의 연구개발 과정 … is lost! Data are analysed synthesised interpreted become Information … is traceable is published becomes Knowledge … is accessible Publication
10. 문제점과 해결책 문제점 시간이 경과됨에 따라 데이터의 유실이 발생함 관련 데이터의 부족으로 연구자간 연구결과의 검증이 어려움 불필요한 중복실험, 중복연구가 이루어짐 해마다 많은 연구예산이 투입되어 데이터는 생산되었으나 이것이 발굴되지 않아 어딘가에 미이용 상태로 남아 있음 해결책 생성되는 데이터의 현황 조사 (종류, 용량, 관리상태, 보유자, 품질, 표준 등) 과학 데이터센터의 설립 데이터 셋에 대한 접근을 위한 메타데이터 작성 및 유통 식별자(DOI 혹은 KOI) 부여를 통한 영구적인 데이터 관리 과학 데이터센터의 효과 원시 데이터의 인용이 가능 데이터의 활용성(가독성) 향상 데이터 셋의 재활용 및 연구자간 데이터 검증이 가능 원시 데이터의 수집 및 메타데이터 작성으로 새로운 서비스 영역 탄생 데이터의 중복 실험 방지 새로운 연구를 유발
19. DOI를 사용한 데이터 셋의 인용 DOI 시스템 학술논문과 해당 논문에 사용된 데이터를 연결하는 가장 손쉬운 방법 데이터 셋에 DOI를 부여하고 있는 기관 IUCR, ICPSR, OECD는 CrossRef을 통해 Pangaea, Mare 및 기타 몇 개의 기관들은 TIB(독일 국립과학기술도서관)를 통해 데이터 셋 G. Yancheva, N. R. Nowaczyk et at (2007), Rock magnetism and X-ray flourescence spectrometry analyses on sediment cores of the Lake HuguangMaar, Southeast China, PANGAEA Doi : 10.1594/PANGAEA.587840 학술논문 G. Yancheva, N. R. Nowaczyk et at (2007), Influence of the intertropical convergence zone on the East Asian monsoon, Nature, 445, 74-77 Doi : 10.1038/nature05431 인용
20. DataCite : 국제적 데이터 인용 기구 과학자를 지원함 DataCite의 장기 비젼은 과학자들에게 연구 데이터 셋의 소재와 확인, 그리고 연구 데이터 셋을 인용하는 방법을 제공함으로써 과학자를 돕는 것임 경과 2005년 하노버에서 TIB가 데이터 셋에 대해 DOI를부여하기 시작함 2009년 3월파리 ICSTI 회의에서 정관에 사인 2009년 12월 런던에서 DataCite Association이 설립됨 DataCite : 데이터센터 CrossRef : 출판사
21. DataCite회원 현황 국제적 파트너쉽 독일 : TechnischeInformationsbibliothek (TIB) 영국 : The British Library (BL) 프랑스 : L’Institut de I’InformationScientifique et Technique (INIST) 스위스 : Library of the ETH Zurich 덴마크 : Library of TU Delft 네덜란드 : Technical Information Center 캐나다 : Canadian institute for Scientific and Technical Information (CISTI) 호주 : National Data Service (ANDS) 미국 : California Digital Library 미국 : Purdue University
22. DataCite등록기관과 출판기관의 임무 DataCite Registration Agency 레졸루션 인프라 스트럭쳐의 유지, 관리 검색 가능한 메타데이터의 데이터베이스를 유지, 관리 장기간에 걸친 식별자 관리 최적 사례의 발굴, 공유 및 국제 협력 촉진 Publishing Agents (각국의 데이터센터, 연구소, 출판사 등) 품질 보증 콘텐트 저장과 접근 식별자 작성 메타데이터의 작성과 갱신
23. DataCite구조 국제 DOI 기구 회원 관리 기관 (TIB) DataCite 전달 Associate Stakeholder 회원 기관 회원 기관 (KISTI) 협력 회원 기관 회원 기관 회원 기관 회원 기관 데이터센터, 연구소 등 데이터센터, 연구소 등