SlideShare a Scribd company logo
1 of 68
Download to read offline
데이터 노마디즘
-4차 산업혁명 시대 인문학을 위한 다언
어/다문화 데이터 아카이브 플랫폼 구상-
2020.11.01
박춘원
- 2 -
인문학?
인간의 사상 및 문화를 대상으로 하는 학문영역.
자연을 다루는 자연과학(自然科學)에 대립되는 영역으로, 자연과학이 객관적으로 존재하는 자연현상을 다루는 데 반하여 인문학은 인간의 가치탐
구와 표현활동을 대상으로 한다. 광범위한 학문영역이 인문학에 포함되는데, 미국 국회법에 의해서 규정된 것을 따르면 언어(language)·언어학
(linguistics)·문학·역사·법률·철학·고고학·예술사·비평·예술의 이론과 실천, 그리고 인간을 내용으로 하는 학문이 이에 포함된다. 그러나 그 기준을
설정하기는 매우 어렵기 때문에 이에 대한 의견의 일치가 이루어지지 않고 있다. 예를 들면 역사와 예술이 인문학에 포함되느냐 안되느냐에 대한 이
론(異論)들이 있기도 하다.
이 용어는 키케로(Cicero)가 일종의 교육 프로그램을 작성할때 원칙으로 삼은 라틴어 「휴마니타스」(humanitas:humanity 또는 humaneness)에
서 발생되었으며, 그 후에 겔리우스(A. Gellius)가 이 용어를 일반 교양교육(general and liberal education)의 의미와 동일시하여 사용하였다. 인
문학을 중시하는 경향은 그리스와 로마를 거쳐 근세에 이르는 동안 고전교육(classical education)의 핵심이 되었고 특히 18세기의 프랑스, 19세
기의 영국과 미국의 교양교육의 기본이념이 되었다. [네이버 지식백과] 인문학 [人文學, humanities] (교육학용어사전, 1995. 6. 29., 서울
대학교 교육연구소)
인간의 조건(human condition), 즉 인간다움의 특징, 인간의 삶과 사고에 관해 탐구하는 학문. 사회과학, 자연과학과 더불어 기초 3과 학문
에 속한다. 사회과학/자연과학과 다른 점이 있다면, 사회과학과 자연과학은 인간을 둘러싼 사회계와 자연계의 현상에 대해 경험적으로 접
근하여 일반법칙을 유도하나, 인문학은 인간의 본질 그 자체에 대해 사변적이고 비판적이며 또한 분석적으로 접근한다는 것이다.
인문학에 해당하는 영단어는 Humanities 또는 Arts인데, 두 용어의 뜻은 서로 비슷하다.
굳이 따지자면 Arts가 더 오래된 표현으로, 이는 현재 인문학에 해당하는 학문들이 중세 대학에서 Ars Liberalis라고 불렸기 때문이다. 이 명
칭은 현재 인문대학을 뜻하는 영어 명칭인 Liberal Arts으로 남아있는데, 앞의 Liberal을 생략해서 그냥 Arts라고 부르기도 한다.이중
Liberalis는 '자유로운 사람의' 라는 뜻이며 Ars는 '기술' 내지는 '학문' 을 뜻한다. 즉, 본래 인문학이란 '자유로운 사람들을 위한 기술(학문)' 을
가리키는 용어이다.
반면에 Humanities는 르네상스 시기 이후 인문주의자들 사이에서 새롭게 재발굴된 용어 Humanitas에서 유래한다. 그런데 이 Humanitas 역
시 키케로가 수사학에서 연설자가 갖춰야 할 덕목으로 그가 생각했던 것, 즉 로마 시민의 교양지식을 의미하는 것이었으므로, 사실상 본래
의미는 Ars Liberalis와 다르지 않다. 단, 이쪽은 프랑스 계몽주의를 거치면서 인본주의 등의 색채가 덧입혀지기 시작한다.
과거에는 여러 학문들이 인문학에 속했는데, 처음 로마시대에 정립될 때에는 수학, 음악, 기하학, 천문학의 4학으로 출발하여, 이후 중세 대
학에 이르러 문법, 수사학, 논리학이 합쳐져 총 7개 분과학문이 운용되었다. 그러다 르네상스를 거쳐 근대에 이르러 중세의 학문 체계가 붕
괴됨에 따라 체계의 대대적 편집과 변화를 거쳐 자연과학을 필두로 다수의 분과학문들이 독립해 나갔다.[나무위키]인문학
- 3 -
인문학과 기술의 관계 – Jobs said..
- 4 -
인문학과 기술의 관계 – 제 생각에는..
인간과 자연이 변증법적으로 끊임없이 상호작용하며 생성되는 지식과 기술을 토대로 이루어지는 진화와 진보의
과정에서 생성되는 끊임없는 동적 관계 아니겠나 싶습니다..^^
<성리학적 구성주의>
"성리학의 원리에 근거하여 ‘끊임없는 상호 작용 속에 존재하는 서로 같은 것이면서 다른 것' 의 관계를 갖는 다양한 주체들의 지속적
인 상호 작용을 설명하는 이론 “(노명환, 기호학 및 ‘성리학적 구성주의’ 이론을 적용한 기록과 기록관리 행위의 본질과 사회적 역할의
이해: 레코드 컨티뉴엄의 보완에 초점을 맞추어, 역사문화연구 제57집)
- 5 -
⚫ 데이터 아카이브 플랫폼과 세계의 사상 ·문명 ·문화의 소통과 융합
-2020 .6 .7 노명환 한국외국어대학교 대학원 정보기록학과 교수
⚫ 중세 이슬람 문명과 서양의 르네상스
2020.7. 5 김정명 명지대 아랍지역학과 교수
⚫ 고대 이집트/메소포타미아/ 고대 그리스의 미술/ 이슬람 미술/ 유럽 미술: 만남과 소통 ·융합
2020.8.2 김태현 한국외국어대학교 대학원 정보 ·
기록학과 겸임교수
⚫ '유럽의 기독교와 이슬람: 스페인 중세사’
2020.9.6 이은해 한국외국어대학교 스페인사 교수
⚫ 유럽의 근대 문명과 아시아
2020.10.11 이영석 광주대 명예교수
⚫ 데이터 노마디즘-4차 산업혁명 시대 인문학을 위한 다언어/다문화 데이터 아카이브 플랫폼 구상-아카이
2020.11.1 박춘원 한국외국어대학교 대학원 정보 ·
기록학과 겸임교수
⚫ 빅데이터와 빅히스토리
2020.12.6김기봉 경기대 사학과 교수
세계 사상 문화 융합과 시맨틱 디지털 데이터 아카이브 연구회의 학제간 연구 의의
- 6 -
4차 산업 혁명
- 7 -
4차 산업 혁명과 데이터
- 8 -
4차 산업 혁명과 데이터 – 데이터는 21세기의 원유: 이유는 ?
- 9 -
4차 산업 혁명과 데이터 – 데이터는 21세기의 원유: 데이터 중심 경제 효과
- 10
4차 산업 혁명과 데이터 – Data 중심으로 ICT Paradigm 진화
ICT 패러다임 진화 중
Data centric
- 11
4차 산업 혁명과 데이터 – Data 중심으로 ICT Paradigm 진화
From IT to DT
향후 30년간 DT(Data Technology)시대
- 12
Data 개념 정의
Definition of DATA (Webster )
1: factual information (such as measurements or statistics) used as a basis for
reasoning, discussion, or calculation
the data is plentiful and easily available — H. A. Gleason, Jr.
comprehensive data on economic growth have been published — N. H. Jacoby
2: information output by a sensing device or organ that includes both useful and
irrelevant or redundant information and must be processed to be meaningful
3: information in numerical form that can be digitally transmitted or processed
⚫추론, 토론 또는 계산의 기초로 사용되는 사실적 정보 (측정 또는 통계와 같은)
-데이터가 풍부하고 쉽게 사용할 수 있습니다.
-경제 성장에 관한 포괄적 인 데이터가 발표되었습니다.
⚫유용하거나 관련이 없거나 중복 된 정보를 모두 포함하는 감지 장치 또는 기관에 의해 출력되는 정보 및
의미 있는 것으로 처리 되어야 하는 정보
⚫디지털 방식으로 전송되거나 처리 될 수 있는 숫자 형식의 정보
- 13
Data 개념 정의 – 데이터와 인문학
⚫ 데이터는 어떠한 사실, 개념,명령을 과학적인 실험이나 관측 결과로 얻은 수치 정상적인 값 등 실체
의 속성을 숫자, 문자, 기호 등으로 표현 한 것으로 정의된다 -두산백과 웹 사이트
⚫ 데이터는 사물 현상 사건 인간관계 등에 관한 관찰기록이다,…. 기록의 수단도 숫자, 문자, 기호를
넘어 그림, 동영상으로 확대되었다 – 데이터를 철학하다 P19. 23
정의에 따르면 데이터는 사물이나 현상 사건 등 관찰 대상에서 비롯된다 24
..데이터에 관한 두가지 진실에 직면하게 된다
첫째 자연현상이든 사회 현상이든 전체의 관찰은 원천적으로 불가능 하므로 관찰과 기록에 의
존하는 데이터는 어떠한 경우에도 부분일 수 밖에 없다
둘째 관찰과 기록 과정이 갖는 본질적 기능적 한계 때문에 데이터의 수집 과정에서 인간의 주
관적 관점과 선택이 개입될 수 밖에 없다 31
이 두가지 엄연한 진실을 감안하면 데이터는 어디에서 오는가 라는 질문에 대한 대답은 분명해
진다. 바로 ‘관찰자의 마음이다‘
데이터는 결코 객관적 개체가 아니며 관찰자가 주관적으로 바라보고 싶은 세상의 단면일 가능
성이 크다. 데이터가 객관적 타당성을 가질거라고 속단 한다면 당신은 데이터의 노예가 될 수
밖에 없다 30~ 31
데이터의 원천이 ‘관찰자의 마음‘ 이라는 인식은 매우 중요하다. 데이터는 사물이나 현상 사건
에 대한 주관적 관찰이라는 시각을 가지고 데이터의 해석에 주체성을 확보하는 것이야 말로 데
이터를 올바르게 인식하는 첫걸음이다. 31
장석권 교수
- 14
Data, Information, Knowledge.
- 15
DIKW model
Gene Bellinger, Durval Castro, Anthony Mills http://www.systems-thinking.org/dikw/dikw.htm , http://yjhyjh.egloos.com/39721
- 16
4차 산업 혁명시대 지식 생성 패러다임
- 17
4차 산업 혁명시대 지식 생성 패러다임
- 18
4차 산업 혁명시대 지식 생성 패러다임 – I+I 데페이즈망
- 19
4차 산업 혁명시대 지식 생성 패러다임 – W+W 새로운 컨셉 창출
Data + Nomad
- 20
Curation is the Design
4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션
- 21
Deconstruct + Sign
기존 ,개체/Contents
맥락의 해체
Re-Mix
Re-Purpose
Re-Contextualization
Re-Arrange
Re-construct
Re-build
Re-formation
선별 – 숨겨진 가치의 드러냄
넘쳐나는 정보, 콘텐츠 속에서 중요하지 않은 것 가치 없는 것을 덜어 내는 것
중요성과 가치 평가의 기준 정립이 핵심
선별/
배치
4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션
- 22
⚫좋은 큐레이션은 가치를 보존하는것에 그치지 않는다 새로운 가치를 만들어 낸다
큐레이션 272
⚫창조적 신화에 대한 믿음은 그저 신화에 불과하다는 것을 잊어서는 안된다. 창조성
은 언제나 재조합 과정을 수반하는 개념이었다. 창조성과 큐레이션의 명확한 경계는
어디에도 존재하지 않는다. 이들을 잘 조화시키는 문제만이 있을 뿐이다.
큐레이션 324
⚫개인 출판이 가능한 사회에서는 큐레이션이 매우 중요한 역할을 합니다. 실제 정보
가 단순한 데이터가 아님을 보장하는 것이지요
Xavier Damman (Storify CEO)
⚫가치 있는것을 선별하는 방법
-덜 중요한 것을 덜어내고 배제
-편집이란 덜어 내는 것이다
⚫Categorize
-제품과 제품에 포함된 부품까지 포함
-맥락과 맥락속에 포함 된 개념, 개체, 감정, 인상, 등까지 포함
-Netflix 를 보라
4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션
- 23
⚫정보의 과잉이란 없다. 제대로 된 여과과정이 이뤄지지 않았을 뿐이다
-클레이 서키
⚫창조성의 재정의
독창적인 속성 보다는 배치 작업의 속성이 더 강하다-> 여러가지 아이디어를 지금까지와는 다른 방식으로
관찰하고 통합하는것
-아더 퀘슬러
⚫큐레이션이란 개별 콘텐츠 하나 하나의 문제라기 보다 이들을 어떻게 조합 할 것인가에 대한 것이다.
특정 방식으로 배치된 콘테츠가 어떤 이야기를 전달하는지, 생성된 맥락 속에서 이들 콘텐츠가 사회 및 문
화에 대해 대해서는 어떤 입장을 취하고 있는지에 관한 것이라고 볼 수 있다
온라인 큐레이터 마리아 포포바(불가리아 출신 미국인으로 책에서 좋은 내용을 골라 큐레이션해주는 영
문 블로그 Brain Pickings의 운영자)
http://1488160907.affiliationmayo.com/1st-world-problems-compilation-2.html
4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션
- 24
4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션 Case
- 25
4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션
- 26
4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션 이들을 어떻게 조합 할 것인가
- 27
Digital Curation의 시대
https://www.dcc.ac.uk/
Research Data Alliance 2018.04. 바로셀로나 선언
- 28
Digital Curation의 이 점
Digital curation ensures the sustainability of data in the long term, however it has immediate value for data creators as well as users.
Digital curation facilitates:
• Persistent access to reliable digital data
• Improved quality of the data itself and its research context
• The use of common standards across different datasets, which in turn leads to more opportunities for cross-searching and collaboration
• Authenticity checks, improving the trustworthiness of data
• Ensuring data is valid as a formal record where appropriate, meaning it can function into the future as legal evidence
• Exploiting initial investment by ensuring that data is available for use and re-use and protecting the financial value of information
• Improved speed and range of access, data sharing and analysis opportunities, and other research benefits
Digital curation ensures long-term value by:
• Preserving data and protecting it against loss and obsolescence (particularly crucial where the data is non-reproducible or extremely valuable)
• Allowing continued access to data despite short-term funding or institutional changes
• Encouraging re-use of data
• Maximising the exploitation of digital materials cumulatively through time
• Providing information about the context and provenance of data
• The use of tools and services to migrate data, metadata, and other representation information into new formats to ensure it remains meaningful to
users
• A management infrastructure for the preservation and dissemination of data in perpetuity
https://www.dcc.ac.uk/sites/default/files/documents/resource/briefing-papers/what-is-digital-curation.pdf
- 29
DCC Digital Curation Model
https://www.dcc.ac.uk/
무한 연쇄
- 30
Curation Practice in Video –VAD(Video As Data) Model
필요
Data
확보
발췌
정리
배열
저장
↓
배포
Search
Curation
Use/
Resue
Video,
Image,
Text,
Audio/Sound
분석 & 객체 검출
Meta Data
Auto Labeling
Dynamic
Meta Data
Based
0:05~0:20
1:30~1:50
1:05~1:20
▪Computer Vision Tech
▪Image Recognition Tech
▪Text & NLP Analysis Tech
▪Sound/Audio Analysis Tech
Dynamic Meta Data Processing
Not Edit But Assemble
Topic Define
Audio
Video
Sentence ( a part of Full Text)
Image
Specific Data (Ex : Transaction Data)
Auto Assembled
Media Content
Copy Right Reserved 2017 by Alexander Park
- 31
europeandataportal.eu/en 2020.10.26일 현재
Digital Curation의 확산 토대 – 세계적 데이터 개방과 공유 추세 확산 : Europe
- 32
https://data.gov 2020.10.26일 현재
Digital Curation의 확산 토대 – 세계적 데이터 개방과 공유 추세 확산 : 미국
- 33
.
.
.
120
공공데이터 포털 자료 재정리 , https://www.data.go.kr/index.do 2020.10.26일 현재
Digital Curation의 확산 토대 – 세계적 데이터 개방과 공유 추세 확산 : 한국
- 34
발화점 : 팀 버나스 리 경 : Linked Open Data 운동 -2009. 3. 14.
https://youtu.be/OM6XIICm_qo
- 35
발화점 : 팀 버나스 리 경 : Linked Open Data 운동 –ODI
- 36
3.4 million concepts described
by 1 billion triples, including
abstracts in 11 different
languages
LOD 기반 데이터세트를 활용한 데이터 개방 및 공유 : Dbpedia 2017
- 37
LOD에 연결되는 아카이브들은 이런 속성을
⚫ 데이터들의 연계와 융합을 통한 ‘창조적 발현(창발: Emergence)’
⚫ 데이터들의 진본성, 무결성, 신뢰성, 이용가능성을 보장하는 데이터 아카이브
⚫ 데이터 아카이브 플랫폼: 연계와 융합을 통한 소통과 창조적 발현이 가능하게 함
노명환, 플랫폼으로서의 아카이브와 세계의 사상 문명 문화의 소통과 융합: 동양의 음양오행 사상과 서양의 양자역학 상보성의 원리를 중심으로 2020.6.7
- 38
데이터 개방/공유의 수준과 지향점 – 5 Star Open Data
Berners-Lee, T. (2006) https://5stardata.info/en/
- 39
But still……
EC, open_data_maturity_report_2019. 58p
- 40
LOD 에 기반한 지식 네트워크는 Rhizome Network
Tree Rhizome
Semantic
network
Is
- 41
Why Rhizome? 경계와 중심이 해체된 끝없는 연결-탈 중심, 탈주, 탈 영토화
이용자들에게 특정 룰을 요구하는 공급자 중심이 아닌
모든 참여자들의 창발성에 의해 네트웍이 형성되며 큐레
이션에 기반하여 데이터와, 정보, 지식이 공유 확산되는
무경계, 무정형, 자율에 기반한 데이터의 무한 연쇄 인드
라망 - Rhizome
- 42
Why Rhizome? 영토화 된 Silo에 속박되어 고립된 Data의 해방과 전지구적 연결
- 43
지구 규모 리좀 네트워크는 데이터세트 간 결합을 통해 끝없이 확장 : 창발성의 원천
https://www.ted.com/talks/kirby_ferguson_embrace_the_remix
- 44
4차 산업 혁명 시대 데이터 아카이브 플랫폼은? : 아카이브 2.0
관리․운영 측면에서 볼 때, 아카이브 1.0이 지리적으로 고정된 물리적 공간을 갖추고 기록 정보자원에 대한 접근을 제공하는 전통적 아카이브라면,
아카이브 2.0은 물리적 공간으로부터 자유롭게 이용자들의 참여를 지원하는 온라인 플랫폼이라 할 수 있다(Ridolfo 외 2009).
플랫폼으로서의 아카이브는 새로운 정보통신기술의 적극적 수용을 통해 기록정보자원의 투명하고 개방적인 활용을 지원한다.
특징 세부내용
1. The Web As Platform 플랫폼으로서의 웹 -인터넷 환경에서 쉽게 접근할 수 있는 가상의 공간 제공
2. Harnessing Collective Intelligence
집단 지성의 활용
-이용자의 참여유도
-이용자는콘텐츠의제공자이자활용자
-이용자들 간 네트워킹 가능
3.DataistheNextIntel Inside 데이터의 경쟁력
-웹 상의 모든 엑티비티를 데이터베이스 로 구축
-차별화 된 데이터 제공
4. Rich User Experience 풍부한 이용자 경험 제공
-웹 환경에서 다양한 디바이스를 통해 이용자의 니즈를
충족시킬수있는서비스 제공.
노지영 ,제4차산업혁명시대, 아카이브와 아키비스트의 핵심역할에대한연구:DCC 생애주기 모델을 중심으로. 2020.8 p35
- 45
아카이브 2.0 플랫폼은? – “새로운 정보 통신 기술”
탈 중심 , 경계의 해체, 큐레이션에 기반한 데이터 결합의 무한 연쇄를 통해 전 지구 범위에서 창발적 지식의 생성이 가능하기 위해서는
1. 기록의 4대 속성 진본성 authenticity, 신뢰성 reliability, 무결성 integrity, 이용 가능성 useability 을 지원
2. 언어 장벽 문제 해결
3. 자연어 처리 자동화 문제 해결
4. 언어 배후에 내재한 구조의 상이함에서 비롯되는 해석 문제 해결이 필요
- 46
아카이브 2.0 - 기록의 4대 속성 지원 기술 :Block Chain
⚫ 출범 시기: 2017년 6월 29일
⚫ 프로젝트 주관 기관: 영국 국가기록원
⚫ 예산 : 약 7억 원(국가과학기술 연구기금에서 출연)
⚫ 프로젝트 기간: 2019년 6월까지 24개월
⚫ 목적: 디지털기록의 무결성과 접근성을 혁신
⚫ 목표: 기록관리 아키텍처 개발
⚫ 의의: 공공기록의 신뢰성 확보를 위해 블록체인 기술의 적용가능성을 조사, 연구하는 최초의 사례라는 점에서 주목.
⚫ 등장 배경: 디지털 기록물의 원본성 확인 및 디지털 기록물이 신뢰 할 수 있는 관리 체계로 관리되었음을 입증해야 한
다는 TNA의 필요
⚫ 플랫폼: 아크엔젤(ARCANGEL) 시제품(prototype)은 이더리움(Ethereum)을 기반으로 개발.
⚫ 이더리움 채택 이유: 전 세계적으로 채택된 범용성, 분산원장기술 플랫폼으로서의 명성, 가상머신을 통한 데이터 저
장과 스마트계약 가능
⚫ 적용 블록체인 모형: Permissioned(Private), Permissionless (Public) 두 가지 Model 동시 추진
영국 TNA(The National Archives, 국가기록원)의 아크엔젤(ARCANGEL) 프로젝트 사례
1. 기록의 4대 속성 진본성 authenticity, 신뢰성 reliability, 무결성 integrity, 이용 가능성 useability 을 지원
- 47
아카이브 2.0 - 기록의 4대 속성 지원 기술 : Big Data 처리 기술
노지영 ,제4차산업혁명시대, 아카이브와 아키비스트의 핵심역할에대한연구:DCC 생애주기 모델을 중심으로. 2020.8 p84
1. 기록의 4대 속성 진본성 authenticity, 신뢰성 reliability, 무결성 integrity, 이용 가능성 useability 을 지원
- 48
아카이브 2.0 - 기록의 4대 속성 지원 기술 : Big Data 처리 기술
1. 기록의 4대 속성 진본성 authenticity, 신뢰성 reliability, 무결성 integrity, 이용 가능성 useability 을 지원
< Google Sheet에서 App 개발 자동화 기
능 제공 >
어제 구글 블로그에 Create time-saving
apps using AppSheet, no coding required
라는 제목의 글이 실렸습니다
(2020.10.21)
(https://blog.google/.../no-code-
application-development.../)
말 그대로 코딩 한줄없이 앱을 개발할
수 있는 기능을 구글 Docs의 Sheet에 제
공한다는 거죠.
Sheet 열어보니까 도구 메뉴 밑에
AppSheet라는 기능이 들어 있네요
Sheet로 뭔가 정리하는 Data Sheet를 만
들면 이 테이블을 토대로 필요 기능들
을 정의 할 수 있는 UI를 제공합니다
제공하는 여러 항목들에 대한 필요 내
용을 세팅하면 모바일과 태블릿용 App
이 자동으로 만들어져 나온다는 거죠
예를 들면 구글 맵을 활용 어떤 지역의
맛집 검색 앱을 만들려면 식당 이름, 메
뉴 , 가격 등 맛집앱 관련 테이블을 생성
하고 맵 주소와 매핑하면 끝나는 식입
니다
https://www.facebook.com/Ebenezel/posts/10207909370888946
- 49
아카이브 2.0 - 기록의 4대 속성 지원 기술 : Big Data 처리 기술 기반 서비스
미국 ICPSR(Inter-University Consortium for Political and Social Re-search)
ICPSR은 미국 미시간대학교(Uni versity of Michigan)에 있는 세계 최대 사회과학 조사·
통계자료(설문조사자 료, 여론조사자료, 통계 마이크로데이터, 각종 질적자료 등)
의 아카이브로 전 세계 800여 개의 학술연구기관과 컨소시엄으로 운영되고 있으며 세계 각 국에서수집된연구자료를소장하고있다.이데이터아카이브는경영,경 제, 교
육, 정치, 국제관계, 사회, 보건복지를 비롯한 19개 주제 분야별 조사 자료 및 연구자료를 지속적으로 수집하여 검색 및 열람서비스를 제공하고 원자료(raw data)를 확보
하여 연구의 검증과 통계분석 등 2차적 자료로 활 용될 수 있도록 제공하고 있다. ICPSR은 데이터베이스를 관리하고, 과학적 데이터에 관한 접근, 연구데이터 의 장기 보
존, 입증된 연구결과가 재사용이 가능하도록 큐레이션을 구축 제공한다
노지영 ,제4차산업혁명시대, 아카이브와 아키비스트의 핵심역할에대한연구:DCC 생애주기 모델을 중심으로. 2020.8 p86
1. 기록의 4대 속성 진본성 authenticity, 신뢰성 reliability, 무결성 integrity, 이용 가능성 useability 을 지원
- 50
UKDA(United Kingdom Data Archive)
UKDA는 데이터 산출, 프로세싱, 분석, 보존, 접근, 재사용의 단계를 지닌 연구데이터 생애주기 모델을 기반으로 선별한 데이터를 관리한다. 이때 연구데이터
생애주기 모델은 데이터 큐레이션(data curation), 디지털보존(dig ital preservation), 데이터 접근(data access), 고객 지원(user support), 역량 강화(capacitybuilding)
의단계를포함한다.더나아가UKDA는보다효과 적인연구데이터관리를위해데이터출판,정보거버넌스,데이터보존및 신뢰, 표준 및 프로토콜에 대한 가이드를
제공한다
노지영 ,제4차산업혁명시대, 아카이브와 아키비스트의 핵심역할에대한연구:DCC 생애주기 모델을 중심으로. 2020.8 p93
아카이브 2.0 - 기록의 4대 속성 지원 기술 : Big Data 처리 기술 기반 서비스
1. 기록의 4대 속성 진본성 authenticity, 신뢰성 reliability, 무결성 integrity, 이용 가능성 useability 을 지원
- 51
아카이브 2.0 – 통 ,번역 및 자연어 처리 자동화 지원 기술 : AI
❑ 번역기
현재 매달 5억 명 이상이 구글 번역기를 사용하고, 매일 1,400억 개의 단어가 구글 번역기를 통해 다른 나라말로 옮겨진다
2020. 10. 26일 현재 100개 이상 언어 상호 번역 가능
❑ 자연어 처리 BERT(Google) , GPT-3 (Open AI) 및 Computer Vision…
Question and Answering
- 주어진 질문에 적합하게 대답
- KoSQuAD, Visual QA etc.
Machine Translation
- 구글 번역기, 네이버 파파고 등
실시간 통역
문장 주제 찾기 또는 분류하기
- 역시나 기존 NLP에서도 해결할 수 있는 문제는 당연히 해결 가능
사람처럼 대화하기
Programming
페이지 내부 구절 색인을 통한 검색
동영상 내 Key moment 장면 검색
이외에도 Computer Vision 등 직접 정의한 다양한 문제에도 적용 가능
2. 언어 장벽 문제 해결
- 52
⚫ 페이지 내부 구절 색인을 통한 검색
아카이브 2.0 – 통, 번역 및 자연어 처리 자동화 지원 기술 : AI
https://blog.google/products/search/search-on/ , Google 2020 Search On 이벤트 발표2020.10.20
2. 언어 장벽 문제 해결
- 53
⚫ 메타데이터 자동 생성을 통한 동영상 내 Key moment 장면 검색
아카이브 2.0 – 통, 번역 및 자연어 처리 자동화 지원 기술 : AI
https://blog.google/products/search/search-on/ , Google 2020 Search On 이벤트 발표2020.10.20
3. 언어 장벽 문제 해결 – 자연어 처리 : Video Metadata 생성 자동화
- 54
https://github.com/felixbur/Speechalyzer
아카이브 2.0 – 통, 번역 및 자연어 처리 자동화 지원 기술 : AI
3. 언어 장벽 문제 해결 – 자연어 처리 : STT & 텍스트 분석
- 55
Text Labeling Open Source Tool Kit-Stanford CoreNLP
아카이브 2.0 – 통, 번역 및 자연어 처리 자동화 지원 기술 : AI
3. 언어 장벽 문제 해결 – 자연어 처리 : Text Mining
- 56
LOD 기반 데이터세트를 활용한 데이터 개방 및 공유 : 다국어 지원
- 57
LOD 기반 데이터세트를 활용한 데이터 개방 및 공유 : 다국어 지원
Interoperability involves two aspects (Ide and Pustejovsky, 2010):
How to access (read) a resource? (Structural interoper- ability)
Resources use comparable formalisms to represent and to access data (formats, protocols, query lan- guages, etc.), so that they can be
accessed in a uniform way and that their information can be integrated with each other.
How to interpret information from a resource?
(Conceptual interoperability)
Resources share a common vocabulary, so that linguistic information from one resource can be resolved against information from
another resource, e.g., grammatical descriptions can be linked to a terminology repository.
With the rise of Semantic Web and Linked Data, new representation formalisms and novel technologies have become increasingly aware of the
potential of these developments with respect to the challenges posited by the heterogeneity and multitude of linguistic resources available today.
- 58
https://cordis.europa.eu/project/id/825182
LOD 기반 데이터세트를 활용한 데이터 개방 및 공유 : 다국어 지원
- 59
https://pret-a-llod.github.io/index.html
LOD 기반 데이터세트를 활용한 데이터 개방 및 공유 : 다국어 지원
- 60
아카이브 2.0 –문화 차이에 의한 Connotation의 해석과 의미 생성
Denotation Connotation
4. 언어 배후에 내재한 구조의 상이함에서 비롯되는 해석 문제 해결이 필요
- 61
아카이브 2.0 –문화 차이에 의한 Connotation의 해석과 의미 생성
앞으로도 상당 기간
이 부분은 AI 접근이 제한적일 것이며
다양한 문화에 내재한 상징과 신화를 해석 할 수 있는
인문적 소양을 지닌 인간의 영역으로 유지 될 것
4. 언어 배후에 내재한 구조의 상이함에서 비롯되는 해석 문제 해결이 필요
프란츠 파농이라면?
프랑스 제국주의의 허구
- 62
Element Attribute 비고
물리적요소 해상도,색상(컬러/흑백,Color/BW),디지털/아날로그(Digital/Analog),화면비율(FrameRatio) AI
기술적요소
포맷및코덱(Format,Codec-AVI,MPEG,..),
차원(2D,3D,4D),가상현실(VR),증강현실(AR)
특수효과(SpecialEffect),촬영장비(Camera&Devices),녹음장비(SoundRecord)
AI
제작요소 장르(Genre),이용자(UGC,UserGeneratedContent),감독명(Director),배우명(Actor),스텝명(Staffs) AI
연출/편집
요소
컷/숏단위,연출여부,편집,앵글,카메라워크등
Cut,Shot,Sequence,Mise-en-Scene,Editing,
SceneDirection–Angle,Motivation,information,compositionframingDepthcontinuity(Movement,position,sound,
dialogue)costume,Make-up..)
AI
내용요소 Sound(Effect..).Audio(Music,Dialogue),Object(각종사물,동물,사람...),Action,Place,Emotion,Text,Image AI
서비스요소 스트리밍(Streaming),다운로드(Download),실시간(Live) AI
배포요소
배포방법및단말기
MovieTheater,TV,OTT,Device
AI
스토리전개요소
스토리,콘텐츠,내러티브,분위기,플롯등
Story,Plot,Context,Narrative,Mood
인간
메시지요소 Topic,Ism 인간
기호/상징요소
Symbol,denotation(외시),connotation(공시),signifier,signified,studium,punktum,Langue(사회적-에크르튀르),
Parol(개인적화법스타일)
인간
기타요소 별칭(A.K.A),trivia,etc, 인간
아카이브 2.0 –문화 차이에 의한 Connotation의 해석과 의미 생성 – 영상 Case
- 63
4차산업혁명기 데이터 아카이브는 끊임없는 의미 생성과 창발적 지식 창출 플랫폼
기록은 기록 관리 과정에서 지속인 맥락설정,예를 들어 메타데이터의 설정 작업을 통해 그 의미와 성격이 끊임없이 변할 수 있다. 이러한 의미에서 기록관리 과
정은 기호학에서 말하는 지속인 ‘기호작용(semiosis)'으로 이해(151)
업워드(Frank Upward)는 전자기록 시대의 기록을 ‘개념의 구성물’(records as conceptual constructs)4)로 볼 것을 그리고 레코드 컨티뉴엄을 ‘지속적인 시·
공의 구
성’(continuous time/space construct)‘5) 과정으로 이해할 것을 제안했다
왜냐하면 맥락의 변화 속에서 기록의 의미와 성격이 변한다는 측면을 기호학의 에서 유효하게 검토하고 보다 더 체계화 할 수 있기 때문이다. 업 워드 자신이 기
록관리를 사유의 측면에서 ‘의미 만들기’ (signification) 과정으로 이해했다.
인간의 사회적 행위의 산물로 서 ‘맥락 속의 개별 기록’의 성격과 의미 그리고 그것의 사회 역할을 설명하는 데도 큰 도움을 수 있을 것이다(151)
레코드 컨티뉴엄 이론은 기록을 맥락 의 변화와 더불어 그 의미와 성격이 변화하는 ‘상징 증표’ (symbolic token ), ‘논리 단체’(logical entities), ‘개념의 구성물’등으
로 본다(152)
(노명환, 기호학 및 ‘성리학적 구성주의’ 이론을 적용한 기록과 기록관리 행위의 본질과 사회적 역할의 이해: 레코드 컨티뉴엄의 보완에 초점을 맞추어 (역사문
화연구 제57집151~2))
⚫Curation 과 Record Continuum
Curation의 요체가 과잉 콘텐츠 또는 사물들을 대상으로 가치 있는 것들을 선별, 배열 /배치를 통해 끊임없이 새로운 맥락과 의미 생성을 통한 가치의 창출인 것
과 마찬가지로 Record Continuum 역시 기록을 맥락 의 변화와 더불어 그 의미와 성격이 변화하는 ‘상징 증표’ (symbolic token ), ‘논리 단체’(logical entities), ‘개념
의 구성물’등으로 보면서 사유의 측면에서 ‘의미 만들기’ (signification) 과정 으로 파악하는바 Curation의 방법론과 Record Continuum 방법론적 틀은 일맥 상통한
다고 할 수 있다
- 64
데이터 아카이브가 끊임없는 창발적 지식 창출 플랫폼으로 기능하기 위해서는?
‘시(時)’에 대한 이 같은 두 가지 설명을 통해 데이터 융합의 ‘해석과 활용의 시기’의 중요성에 대해 유추해볼 수 있다. 우선, 데이터는 물리적인 융합으로만 끝나지 않
는다. 일단이 융합이 되면 그 데이터의 의미를 해석하는 것은 인간의 몫이다. 그 의미는 바라보는 관찰자에 의해서 바뀔 수 있는데, 이는 관찰자의 배경지식과 그가
처한 사회(시기와 장소)의 영향을 받는다. 그러므로 관찰자는 데이터의 생성과 융합의 의미를 명확하게 이해하고 전체를 전면적으로 파악하기 위한 통찰력이 요구된
다. 또 데이터는 각각 유용하게 쓰일 수 있는 적기가 있다. 다량으로 쏟아지는 모든 데이터를 보관할 수 없는 만큼 시대가 필요한 또는 앞으로 필요하게 될 데이터를
선별하는 안목이 필요하다. 결국 활용되지 않으면 데이터의 가치는 떨어진다. 그래서 데이터의 가치를 발견하고 선별·보존함으로써 적기에 활용될 수 있도록 하는
것이 무엇보다 중요하다.(66)
데이터 융합의 관점에서 데이터 아카이브 구축은 어떤 의미가 있을까? 본 논문에서는 ‘넓은 의미’의 데이터의 융합을 하나의 복잡적응계(구성요소들의 다양한 정보
전달, 학습, 적응능력 등의 특징을 결합한 복잡계의 확장된 형태)로 바라보았다. 기본적으로 복잡계는 수많은 구성요소들이 유기적인 협동으로 자기조직화를 통해서,
새로운 질서인 ‘창발현상’을 일으킬 수 있는 메커니즘을 말한다. 구성요소들이 모여 있다고 하더라도 창발이 일어나지 않는다면, 그것은 단지 뒤엉킨 시스템에 불과
할 뿐이다. 따라서 데이터의 융합은 상호작용을 통해 창발 현상을 일으킬 수 있는 본질을 내포하고 있다. 창발 현상이 일어나기 위해서는 대표적으로 집합성과 꼬리
표 달기(tagging)의 속성과 메커니즘을 포괄해야 한다. 이들은 각 주체들의 집합 상호작용과 집단의 속성을 나타내는 특징을 가지고 있으며 집합체의 창발 현상을
일으킬 수 있도록 한다.(68)
데이터 아카이브는 이러한 융합의 구성요소들이 자신의 속성을 지닌 채 상호작용이 활발히 진행될 수 있는 공간이 되어야 한다. 데이터가 단순히 모여 있다고 해서
그 안에서 융합되고 의미가 만들어지는 것은 아니다. 이들 간의 상호작용이 일어날 수 있도록 열린 시스템과 구성요소들을 관리해주는 역할을 수행해야 한다.(69)
김하정 ,복잡계와 음양 이론을 통해 본 데이터 융합의 본질과 데이터 아카이브의 필요성 및 발전 방향. 2020.8 (한국외국어대학교 대학원 석사논문)
- 65
데이터 아카이브가 끊임없는 창발적 지식 창출 플랫폼으로 기능하기 위해서는?
‘시(時)’에 대한 이 같은 두 가지 설명을 통해 데이터 융합의 ‘해석과 활용의 시기’의 중요성에 대해 유추해볼 수 있다. 우선, 데이터는 물
리적인 융합으로만 끝나지 않는다. 일단이 융합이 되면 그 데이터의 의미를 해석하는 것은 인간의 몫이다. 그 의미는 바라보는 관찰자에
의해서 바뀔 수 있는데, 이는 관찰자의 배경지식과 그가 처한 사회(시기와 장소)의 영향을 받는다. 그러므로 관찰자는 데이터의 생성과
융합의 의미를 명확하게 이해하고 전체를 전면적으로 파악하기 위한 통찰력이 요구된다. 또 데이터는 각각 유용하게 쓰일 수 있는 적기
가 있다. 다량으로 쏟아지는 모든 데이터를 보관할 수 없는 만큼 시대가 필요한 또는 앞으로 필요하게 될 데이터를 선별하는 안목이 필요
하다. 결국 활용되지 않으면 데이터의 가치는 떨어진다. 그래서 데이터의 가치를 발견하고 선별·보존함으로써 적기에 활용될 수 있도록
하는 것이 무엇보다 중요하다.(66)
데이터 융합의 관점에서 데이터 아카이브 구축은 어떤 의미가 있을까? 본 논문에서는 ‘넓은 의미’의 데이터의 융합을 하나의 복잡적응계
(구성요소들의 다양한 정보전달, 학습, 적응능력 등의 특징을 결합한 복잡계의 확장된 형태)로 바라보았다. 기본적으로 복잡계는 수많은
구성요소들이 유기적인 협동으로 자기조직화를 통해서, 새로운 질서인 ‘창발현상’을 일으킬 수 있는 메커니즘을 말한다. 구성요소들이 모
여 있다고 하더라도 창발이 일어나지 않는다면, 그것은 단지 뒤엉킨 시스템에 불과할 뿐이다. 따라서 데이터의 융합은 상호작용을 통해
창발 현상을 일으킬 수 있는 본질을 내포하고 있다. 창발 현상이 일어나기 위해서는 대표적으로 집합성과 꼬리표 달기(tagging)의 속성과
메커니즘을 포괄해야 한다. 이들은 각 주체들의 집합 상호작용과 집단의 속성을 나타내는 특징을 가지고 있으며 집합체의 창발 현상을
일으킬 수 있도록 한다.(68)
데이터 아카이브는 이러한 융합의 구성요소들이 자신의 속성을 지닌 채 상호작용이 활발히 진행될 수 있는 공간이 되어야 한다. 데이터
가 단순히 모여 있다고 해서 그 안에서 융합되고 의미가 만들어지는 것은 아니다. 이들 간의 상호작용이 일어날 수 있도록 열린 시스템과
구성요소들을 관리해주는 역할을 수행해야 한다.(69)
김하정 ,복잡계와 음양 이론을 통해 본 데이터 융합의 본질과 데이터 아카이브의 필요성 및 발전 방향. 2020.8 (한국외국어대학교 대학원 석사논문)
- 66
4차 산업혁명기 데이터 아카이브는 리좀 네트워크 기반 Data Nomadism 플랫폼
4차 산업혁명 시대 데이터 아카이브는 단지 데이터를 관리하는 고정된 역할에 머무르지 않고 전 지구적 범위에서 다양한
데이터 세트를 결합하고 끊임없이 새로운 의미와 맥락을 생성하여 “창발적 지식 창출을 주도”하는 역할을 수행하며 그
과정에서 스스로를 지속적으로 변화 시켜 나가는 Data Nomadism을 실천하는 플랫폼으로 속성을 지녀야 할 것이라 생각
한다
그리고 이러한 특성을 지니는 플랫폼으로서 전 지구 범위로 구축되는 데이터 아카이브의 활용에 절대적으로 필요한 기록
의 4대 속성 관리 와 다언어 , 자연어 처리 등의 문제는 블록체인, 빅데이터, AI 등 4차산업혁명 기반 기술들로 상당부분 해
결 될 것으로 예상한다
그러나 상이한 언어의 배후에 있는 구조와 이에 기반한 다양한 문화 차이에서 비롯되는 신화영역 해석, 즉 Connotation의
해석 문제는 상당기간 해결하기 어려운 문제로 남을 것이다
따라서 이들 전 세계 데이터 아카이브를 활용해서 지식 창출을 하는 데이터 노마디스트들은 다문화 해석에 필요한 기호
학을 비롯, 다양한 인문학 소양이 필수 역량이 될 것이다
(아키비스트들은 보다 전문적 역량을 토대로 데이터 노마디스트들을 지원하는 데이터 노마디즘 실천가이면서 데이터 큐레이터로서 역할을
해야 할 것이다. 최근 정보기록학과 박사 수료생인 양월운 선생이 외대 교육선진화 센터의 프로젝트에 응모하여 선정된 "한국에서 일본의 기
록을 찾고 아카이빙 하는 방법을 통해 학생들이 자발적으로 원천자료를 찾을 수 있고, 공부하는 역량을 기를 수 있는 교수법 모형 개발” 같은
사례는 다언어, 다문화 데이터 아카이브를 활용한 데이터 노마디스트들의 지식 창출 역량 함양을 위해 전문가로서의 데이터 아키비스트가
어떻게 기여 할 수 있는지를 보여주는 좋은 사례라 할 수 있을 것이다)
또한 데이터 노마디스트들은 전세계의 Dataset이 연결되어 구축되는 리좀 네트워크 기반의 Data 를 조회하고 그 데이터
간 관계를 파악하여 새로운 정보를 생성하며, 정보들 사이의 패턴을 발견하여 새로운 지식으로 가공 활용하는 ICT 능력
을 필수적으로 지녀야 할 것이다
한국외국어대학교는 이러한 4차산업혁명기 데이터 아카이브 중심 정보,지식 생성 시대에 가장 적합한 역량을 보유한 교
육 기관이라고 생각한다. 한국외국어 대학,대학원이 데이터 노마디스트, 데이터 큐레이터 양성의 세계적 중심 요람이 되
기를 기대해 본다.
- 67
부록 : 큐레이션 Tools.
Service Name Service 유무료
AndersPink 콘텐츠를 검색하고 수집하고, 집계하고, 구성하고 공유 Freemium
BundlePost Google 알리미와 같은 RSS 피드에서 콘텐츠를 수집하는 콘텐츠 관리 플랫폼 Freemium
ContentGems 콘텐츠 탐지 엔진 Freemium
diigo 소셜 북마크 서비스, 웹 페이지의 어떤 부분을 강조 표시하고 스티커 메모를 하이라이트 Freemium
DrumUp 콘텐츠 검색 및 콘텐츠 관리 도구 Freemium
elink 개인 페이지에 구성된 링크 모음 Freemium
Feedly RSS Feed 서비스, 콘텐츠 검색, 선택 및 공유를위한 가장 인기있는 도구 중 하나 Freemium
Flipboard 콘텐츠를 검색, 치료 및 집계하는 응용 프로그램입니다. 자신 만의 개인 잡지 발행 등 Free
Flockler 팬이 나에 대해 이야기하는 내용을 포함하여 모든 콘텐츠를 결합 할 수 있게 해주는 서비스 Freemium
Hootsuite 소셜 미디어 관리 도구 Freemium
Listly 목록을 만드는 목적에 최적화 된 서비스 Freemium
nuzzel 특정 주제와 관련된 트렌드 콘텐츠를 찾을 수 있는 뉴스 큐레이션 서비스 Freemium
Paper.li 모든 웹 소스에서 선택한 컨텐츠로 온라인 신문을 작성하고 발행 Freemium
Pearltrees URL을 수집, 구성 및 공유하고 이미지 및 개인 메모를 업로드 Freemium
Pinterest Image Curation 중심 서비스 Freemium
pocket 데스크탑 브라우저 또는 모바일 응용 프로그램을 사용하여 어디서나 컨텐츠를 저장하고 정리 Freemium
PostPlanner 잠재 고객과 공유 할 유용한 콘텐츠를 찾는 데 도움이되는 도구 Freemium
Rebelmouse Content 큐레이션 후 발행 서비스 Freemium
Reddit 사용자가 가장 인기있는 콘텐츠를 강조하는 Social news platform Free
Scoop 전문가와 기업이 필요한 콘텐트를 발견하고 이를 가공하여 다시 공유하는 서비스 Freemium
slideshare PowerPoint 및 PDF 온라인 프레젠테이션을 찾을 수있는 탁월한 도구 Free
Spidwi 소셜 미디어 관리 도구입니다 Freemium
storify Facebook, Twitter 및 Instagram과 같은 소셜 미디어 채널에서 콘텐츠를 수집하여 스토리 또는 타임 라인 구성 Freemium
Tagboard Facebook,twitter 등의 소셜미디어에서 콘텐츠를 큐레이션하여 발행 Freemium
Trap.it 관심 분야에 적합하고 가장 적합한 컨텐츠를 필터링하는 컨텐츠 관리 플랫폼 Freemium
ZestDigital Marketing 관련 뉴스 큐레이션 서비스 Freemium
- 68
감사합니다 !

More Related Content

Similar to 데이터 노마디즘_4차 산업혁명 시대 인문학을 위한 다언어 다문화 데이터 아카이브 플랫폼 구상_20201101_new_수정완료.pdf

D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동
D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동
D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동Suntae Kim
 
전술적 기술 캠프 공유회 Tactical tech camp
전술적 기술 캠프 공유회 Tactical tech camp전술적 기술 캠프 공유회 Tactical tech camp
전술적 기술 캠프 공유회 Tactical tech campfabcoop 청개구리제작소
 
빅데이터전문가교육 2학기
빅데이터전문가교육 2학기빅데이터전문가교육 2학기
빅데이터전문가교육 2학기Kangwook Lee
 
웹보메트릭스01 1
웹보메트릭스01 1웹보메트릭스01 1
웹보메트릭스01 1Inho Cho
 
웹보메트릭스와 계량정보학14 2
웹보메트릭스와 계량정보학14 2웹보메트릭스와 계량정보학14 2
웹보메트릭스와 계량정보학14 2Han Woo PARK
 
Triple helix 연구소개와-아시아_트리플헬릭스_학회설립_추진현황_자료
Triple helix 연구소개와-아시아_트리플헬릭스_학회설립_추진현황_자료Triple helix 연구소개와-아시아_트리플헬릭스_학회설립_추진현황_자료
Triple helix 연구소개와-아시아_트리플헬릭스_학회설립_추진현황_자료Han Woo PARK
 
디지털인문학교육 초안 김바로
디지털인문학교육 초안 김바로디지털인문학교육 초안 김바로
디지털인문학교육 초안 김바로Baro Kim
 
Digital literacy era 디지털 숙달 시대
Digital literacy era 디지털 숙달 시대Digital literacy era 디지털 숙달 시대
Digital literacy era 디지털 숙달 시대Jahee Lee
 
NS-CUK Summer School: Jun 29th, 2023: Types of Humanities Data and Digitizati...
NS-CUK Summer School: Jun 29th, 2023: Types of Humanities Data and Digitizati...NS-CUK Summer School: Jun 29th, 2023: Types of Humanities Data and Digitizati...
NS-CUK Summer School: Jun 29th, 2023: Types of Humanities Data and Digitizati...ssuser4b1f48
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)Han Woo PARK
 
사이버컴과 네트워크분석 3주차 1
사이버컴과 네트워크분석 3주차 1사이버컴과 네트워크분석 3주차 1
사이버컴과 네트워크분석 3주차 1Han Woo PARK
 
세계 오픈액세스 주간 & 글로벌 OA 동향
세계 오픈액세스 주간 & 글로벌 OA 동향세계 오픈액세스 주간 & 글로벌 OA 동향
세계 오픈액세스 주간 & 글로벌 OA 동향Stella Hayoung Shin
 
융합사회의 정보분석의 매커니즘과 사례(11aug2010)sm
융합사회의 정보분석의 매커니즘과 사례(11aug2010)sm융합사회의 정보분석의 매커니즘과 사례(11aug2010)sm
융합사회의 정보분석의 매커니즘과 사례(11aug2010)smHan Woo PARK
 
[UDIS_6_2nd] Data Journalism_20140712
[UDIS_6_2nd] Data Journalism_20140712[UDIS_6_2nd] Data Journalism_20140712
[UDIS_6_2nd] Data Journalism_20140712Sunghun Bae
 
영남권 문화콘텐츠 소셜네트워킹_전략_(29_nov2010)
영남권 문화콘텐츠 소셜네트워킹_전략_(29_nov2010)영남권 문화콘텐츠 소셜네트워킹_전략_(29_nov2010)
영남권 문화콘텐츠 소셜네트워킹_전략_(29_nov2010)Han Woo PARK
 
소셜웹과 개인의 비영리 재능·재화 공유 문화
소셜웹과 개인의 비영리 재능·재화 공유 문화소셜웹과 개인의 비영리 재능·재화 공유 문화
소셜웹과 개인의 비영리 재능·재화 공유 문화Sungkyu Lee
 
학술데이터 공유 플랫폼_datanest_ccgs2015
학술데이터 공유 플랫폼_datanest_ccgs2015학술데이터 공유 플랫폼_datanest_ccgs2015
학술데이터 공유 플랫폼_datanest_ccgs2015Suntae Kim
 
연구 데이터와 도서관
연구 데이터와 도서관연구 데이터와 도서관
연구 데이터와 도서관Suntae Kim
 
인터넷소셜미디어개론4
인터넷소셜미디어개론4인터넷소셜미디어개론4
인터넷소셜미디어개론4Webometrics Class
 
인터넷소셜미디어개론4
인터넷소셜미디어개론4인터넷소셜미디어개론4
인터넷소셜미디어개론4Han Woo PARK
 

Similar to 데이터 노마디즘_4차 산업혁명 시대 인문학을 위한 다언어 다문화 데이터 아카이브 플랫폼 구상_20201101_new_수정완료.pdf (20)

D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동
D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동
D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동
 
전술적 기술 캠프 공유회 Tactical tech camp
전술적 기술 캠프 공유회 Tactical tech camp전술적 기술 캠프 공유회 Tactical tech camp
전술적 기술 캠프 공유회 Tactical tech camp
 
빅데이터전문가교육 2학기
빅데이터전문가교육 2학기빅데이터전문가교육 2학기
빅데이터전문가교육 2학기
 
웹보메트릭스01 1
웹보메트릭스01 1웹보메트릭스01 1
웹보메트릭스01 1
 
웹보메트릭스와 계량정보학14 2
웹보메트릭스와 계량정보학14 2웹보메트릭스와 계량정보학14 2
웹보메트릭스와 계량정보학14 2
 
Triple helix 연구소개와-아시아_트리플헬릭스_학회설립_추진현황_자료
Triple helix 연구소개와-아시아_트리플헬릭스_학회설립_추진현황_자료Triple helix 연구소개와-아시아_트리플헬릭스_학회설립_추진현황_자료
Triple helix 연구소개와-아시아_트리플헬릭스_학회설립_추진현황_자료
 
디지털인문학교육 초안 김바로
디지털인문학교육 초안 김바로디지털인문학교육 초안 김바로
디지털인문학교육 초안 김바로
 
Digital literacy era 디지털 숙달 시대
Digital literacy era 디지털 숙달 시대Digital literacy era 디지털 숙달 시대
Digital literacy era 디지털 숙달 시대
 
NS-CUK Summer School: Jun 29th, 2023: Types of Humanities Data and Digitizati...
NS-CUK Summer School: Jun 29th, 2023: Types of Humanities Data and Digitizati...NS-CUK Summer School: Jun 29th, 2023: Types of Humanities Data and Digitizati...
NS-CUK Summer School: Jun 29th, 2023: Types of Humanities Data and Digitizati...
 
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
연구업적 데이터베이스를 활용한 빅데이터 분석시스템 (16 sep2014)
 
사이버컴과 네트워크분석 3주차 1
사이버컴과 네트워크분석 3주차 1사이버컴과 네트워크분석 3주차 1
사이버컴과 네트워크분석 3주차 1
 
세계 오픈액세스 주간 & 글로벌 OA 동향
세계 오픈액세스 주간 & 글로벌 OA 동향세계 오픈액세스 주간 & 글로벌 OA 동향
세계 오픈액세스 주간 & 글로벌 OA 동향
 
융합사회의 정보분석의 매커니즘과 사례(11aug2010)sm
융합사회의 정보분석의 매커니즘과 사례(11aug2010)sm융합사회의 정보분석의 매커니즘과 사례(11aug2010)sm
융합사회의 정보분석의 매커니즘과 사례(11aug2010)sm
 
[UDIS_6_2nd] Data Journalism_20140712
[UDIS_6_2nd] Data Journalism_20140712[UDIS_6_2nd] Data Journalism_20140712
[UDIS_6_2nd] Data Journalism_20140712
 
영남권 문화콘텐츠 소셜네트워킹_전략_(29_nov2010)
영남권 문화콘텐츠 소셜네트워킹_전략_(29_nov2010)영남권 문화콘텐츠 소셜네트워킹_전략_(29_nov2010)
영남권 문화콘텐츠 소셜네트워킹_전략_(29_nov2010)
 
소셜웹과 개인의 비영리 재능·재화 공유 문화
소셜웹과 개인의 비영리 재능·재화 공유 문화소셜웹과 개인의 비영리 재능·재화 공유 문화
소셜웹과 개인의 비영리 재능·재화 공유 문화
 
학술데이터 공유 플랫폼_datanest_ccgs2015
학술데이터 공유 플랫폼_datanest_ccgs2015학술데이터 공유 플랫폼_datanest_ccgs2015
학술데이터 공유 플랫폼_datanest_ccgs2015
 
연구 데이터와 도서관
연구 데이터와 도서관연구 데이터와 도서관
연구 데이터와 도서관
 
인터넷소셜미디어개론4
인터넷소셜미디어개론4인터넷소셜미디어개론4
인터넷소셜미디어개론4
 
인터넷소셜미디어개론4
인터넷소셜미디어개론4인터넷소셜미디어개론4
인터넷소셜미디어개론4
 

데이터 노마디즘_4차 산업혁명 시대 인문학을 위한 다언어 다문화 데이터 아카이브 플랫폼 구상_20201101_new_수정완료.pdf

  • 1. 데이터 노마디즘 -4차 산업혁명 시대 인문학을 위한 다언 어/다문화 데이터 아카이브 플랫폼 구상- 2020.11.01 박춘원
  • 2. - 2 - 인문학? 인간의 사상 및 문화를 대상으로 하는 학문영역. 자연을 다루는 자연과학(自然科學)에 대립되는 영역으로, 자연과학이 객관적으로 존재하는 자연현상을 다루는 데 반하여 인문학은 인간의 가치탐 구와 표현활동을 대상으로 한다. 광범위한 학문영역이 인문학에 포함되는데, 미국 국회법에 의해서 규정된 것을 따르면 언어(language)·언어학 (linguistics)·문학·역사·법률·철학·고고학·예술사·비평·예술의 이론과 실천, 그리고 인간을 내용으로 하는 학문이 이에 포함된다. 그러나 그 기준을 설정하기는 매우 어렵기 때문에 이에 대한 의견의 일치가 이루어지지 않고 있다. 예를 들면 역사와 예술이 인문학에 포함되느냐 안되느냐에 대한 이 론(異論)들이 있기도 하다. 이 용어는 키케로(Cicero)가 일종의 교육 프로그램을 작성할때 원칙으로 삼은 라틴어 「휴마니타스」(humanitas:humanity 또는 humaneness)에 서 발생되었으며, 그 후에 겔리우스(A. Gellius)가 이 용어를 일반 교양교육(general and liberal education)의 의미와 동일시하여 사용하였다. 인 문학을 중시하는 경향은 그리스와 로마를 거쳐 근세에 이르는 동안 고전교육(classical education)의 핵심이 되었고 특히 18세기의 프랑스, 19세 기의 영국과 미국의 교양교육의 기본이념이 되었다. [네이버 지식백과] 인문학 [人文學, humanities] (교육학용어사전, 1995. 6. 29., 서울 대학교 교육연구소) 인간의 조건(human condition), 즉 인간다움의 특징, 인간의 삶과 사고에 관해 탐구하는 학문. 사회과학, 자연과학과 더불어 기초 3과 학문 에 속한다. 사회과학/자연과학과 다른 점이 있다면, 사회과학과 자연과학은 인간을 둘러싼 사회계와 자연계의 현상에 대해 경험적으로 접 근하여 일반법칙을 유도하나, 인문학은 인간의 본질 그 자체에 대해 사변적이고 비판적이며 또한 분석적으로 접근한다는 것이다. 인문학에 해당하는 영단어는 Humanities 또는 Arts인데, 두 용어의 뜻은 서로 비슷하다. 굳이 따지자면 Arts가 더 오래된 표현으로, 이는 현재 인문학에 해당하는 학문들이 중세 대학에서 Ars Liberalis라고 불렸기 때문이다. 이 명 칭은 현재 인문대학을 뜻하는 영어 명칭인 Liberal Arts으로 남아있는데, 앞의 Liberal을 생략해서 그냥 Arts라고 부르기도 한다.이중 Liberalis는 '자유로운 사람의' 라는 뜻이며 Ars는 '기술' 내지는 '학문' 을 뜻한다. 즉, 본래 인문학이란 '자유로운 사람들을 위한 기술(학문)' 을 가리키는 용어이다. 반면에 Humanities는 르네상스 시기 이후 인문주의자들 사이에서 새롭게 재발굴된 용어 Humanitas에서 유래한다. 그런데 이 Humanitas 역 시 키케로가 수사학에서 연설자가 갖춰야 할 덕목으로 그가 생각했던 것, 즉 로마 시민의 교양지식을 의미하는 것이었으므로, 사실상 본래 의미는 Ars Liberalis와 다르지 않다. 단, 이쪽은 프랑스 계몽주의를 거치면서 인본주의 등의 색채가 덧입혀지기 시작한다. 과거에는 여러 학문들이 인문학에 속했는데, 처음 로마시대에 정립될 때에는 수학, 음악, 기하학, 천문학의 4학으로 출발하여, 이후 중세 대 학에 이르러 문법, 수사학, 논리학이 합쳐져 총 7개 분과학문이 운용되었다. 그러다 르네상스를 거쳐 근대에 이르러 중세의 학문 체계가 붕 괴됨에 따라 체계의 대대적 편집과 변화를 거쳐 자연과학을 필두로 다수의 분과학문들이 독립해 나갔다.[나무위키]인문학
  • 3. - 3 - 인문학과 기술의 관계 – Jobs said..
  • 4. - 4 - 인문학과 기술의 관계 – 제 생각에는.. 인간과 자연이 변증법적으로 끊임없이 상호작용하며 생성되는 지식과 기술을 토대로 이루어지는 진화와 진보의 과정에서 생성되는 끊임없는 동적 관계 아니겠나 싶습니다..^^ <성리학적 구성주의> "성리학의 원리에 근거하여 ‘끊임없는 상호 작용 속에 존재하는 서로 같은 것이면서 다른 것' 의 관계를 갖는 다양한 주체들의 지속적 인 상호 작용을 설명하는 이론 “(노명환, 기호학 및 ‘성리학적 구성주의’ 이론을 적용한 기록과 기록관리 행위의 본질과 사회적 역할의 이해: 레코드 컨티뉴엄의 보완에 초점을 맞추어, 역사문화연구 제57집)
  • 5. - 5 - ⚫ 데이터 아카이브 플랫폼과 세계의 사상 ·문명 ·문화의 소통과 융합 -2020 .6 .7 노명환 한국외국어대학교 대학원 정보기록학과 교수 ⚫ 중세 이슬람 문명과 서양의 르네상스 2020.7. 5 김정명 명지대 아랍지역학과 교수 ⚫ 고대 이집트/메소포타미아/ 고대 그리스의 미술/ 이슬람 미술/ 유럽 미술: 만남과 소통 ·융합 2020.8.2 김태현 한국외국어대학교 대학원 정보 · 기록학과 겸임교수 ⚫ '유럽의 기독교와 이슬람: 스페인 중세사’ 2020.9.6 이은해 한국외국어대학교 스페인사 교수 ⚫ 유럽의 근대 문명과 아시아 2020.10.11 이영석 광주대 명예교수 ⚫ 데이터 노마디즘-4차 산업혁명 시대 인문학을 위한 다언어/다문화 데이터 아카이브 플랫폼 구상-아카이 2020.11.1 박춘원 한국외국어대학교 대학원 정보 · 기록학과 겸임교수 ⚫ 빅데이터와 빅히스토리 2020.12.6김기봉 경기대 사학과 교수 세계 사상 문화 융합과 시맨틱 디지털 데이터 아카이브 연구회의 학제간 연구 의의
  • 6. - 6 - 4차 산업 혁명
  • 7. - 7 - 4차 산업 혁명과 데이터
  • 8. - 8 - 4차 산업 혁명과 데이터 – 데이터는 21세기의 원유: 이유는 ?
  • 9. - 9 - 4차 산업 혁명과 데이터 – 데이터는 21세기의 원유: 데이터 중심 경제 효과
  • 10. - 10 4차 산업 혁명과 데이터 – Data 중심으로 ICT Paradigm 진화 ICT 패러다임 진화 중 Data centric
  • 11. - 11 4차 산업 혁명과 데이터 – Data 중심으로 ICT Paradigm 진화 From IT to DT 향후 30년간 DT(Data Technology)시대
  • 12. - 12 Data 개념 정의 Definition of DATA (Webster ) 1: factual information (such as measurements or statistics) used as a basis for reasoning, discussion, or calculation the data is plentiful and easily available — H. A. Gleason, Jr. comprehensive data on economic growth have been published — N. H. Jacoby 2: information output by a sensing device or organ that includes both useful and irrelevant or redundant information and must be processed to be meaningful 3: information in numerical form that can be digitally transmitted or processed ⚫추론, 토론 또는 계산의 기초로 사용되는 사실적 정보 (측정 또는 통계와 같은) -데이터가 풍부하고 쉽게 사용할 수 있습니다. -경제 성장에 관한 포괄적 인 데이터가 발표되었습니다. ⚫유용하거나 관련이 없거나 중복 된 정보를 모두 포함하는 감지 장치 또는 기관에 의해 출력되는 정보 및 의미 있는 것으로 처리 되어야 하는 정보 ⚫디지털 방식으로 전송되거나 처리 될 수 있는 숫자 형식의 정보
  • 13. - 13 Data 개념 정의 – 데이터와 인문학 ⚫ 데이터는 어떠한 사실, 개념,명령을 과학적인 실험이나 관측 결과로 얻은 수치 정상적인 값 등 실체 의 속성을 숫자, 문자, 기호 등으로 표현 한 것으로 정의된다 -두산백과 웹 사이트 ⚫ 데이터는 사물 현상 사건 인간관계 등에 관한 관찰기록이다,…. 기록의 수단도 숫자, 문자, 기호를 넘어 그림, 동영상으로 확대되었다 – 데이터를 철학하다 P19. 23 정의에 따르면 데이터는 사물이나 현상 사건 등 관찰 대상에서 비롯된다 24 ..데이터에 관한 두가지 진실에 직면하게 된다 첫째 자연현상이든 사회 현상이든 전체의 관찰은 원천적으로 불가능 하므로 관찰과 기록에 의 존하는 데이터는 어떠한 경우에도 부분일 수 밖에 없다 둘째 관찰과 기록 과정이 갖는 본질적 기능적 한계 때문에 데이터의 수집 과정에서 인간의 주 관적 관점과 선택이 개입될 수 밖에 없다 31 이 두가지 엄연한 진실을 감안하면 데이터는 어디에서 오는가 라는 질문에 대한 대답은 분명해 진다. 바로 ‘관찰자의 마음이다‘ 데이터는 결코 객관적 개체가 아니며 관찰자가 주관적으로 바라보고 싶은 세상의 단면일 가능 성이 크다. 데이터가 객관적 타당성을 가질거라고 속단 한다면 당신은 데이터의 노예가 될 수 밖에 없다 30~ 31 데이터의 원천이 ‘관찰자의 마음‘ 이라는 인식은 매우 중요하다. 데이터는 사물이나 현상 사건 에 대한 주관적 관찰이라는 시각을 가지고 데이터의 해석에 주체성을 확보하는 것이야 말로 데 이터를 올바르게 인식하는 첫걸음이다. 31 장석권 교수
  • 15. - 15 DIKW model Gene Bellinger, Durval Castro, Anthony Mills http://www.systems-thinking.org/dikw/dikw.htm , http://yjhyjh.egloos.com/39721
  • 16. - 16 4차 산업 혁명시대 지식 생성 패러다임
  • 17. - 17 4차 산업 혁명시대 지식 생성 패러다임
  • 18. - 18 4차 산업 혁명시대 지식 생성 패러다임 – I+I 데페이즈망
  • 19. - 19 4차 산업 혁명시대 지식 생성 패러다임 – W+W 새로운 컨셉 창출 Data + Nomad
  • 20. - 20 Curation is the Design 4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션
  • 21. - 21 Deconstruct + Sign 기존 ,개체/Contents 맥락의 해체 Re-Mix Re-Purpose Re-Contextualization Re-Arrange Re-construct Re-build Re-formation 선별 – 숨겨진 가치의 드러냄 넘쳐나는 정보, 콘텐츠 속에서 중요하지 않은 것 가치 없는 것을 덜어 내는 것 중요성과 가치 평가의 기준 정립이 핵심 선별/ 배치 4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션
  • 22. - 22 ⚫좋은 큐레이션은 가치를 보존하는것에 그치지 않는다 새로운 가치를 만들어 낸다 큐레이션 272 ⚫창조적 신화에 대한 믿음은 그저 신화에 불과하다는 것을 잊어서는 안된다. 창조성 은 언제나 재조합 과정을 수반하는 개념이었다. 창조성과 큐레이션의 명확한 경계는 어디에도 존재하지 않는다. 이들을 잘 조화시키는 문제만이 있을 뿐이다. 큐레이션 324 ⚫개인 출판이 가능한 사회에서는 큐레이션이 매우 중요한 역할을 합니다. 실제 정보 가 단순한 데이터가 아님을 보장하는 것이지요 Xavier Damman (Storify CEO) ⚫가치 있는것을 선별하는 방법 -덜 중요한 것을 덜어내고 배제 -편집이란 덜어 내는 것이다 ⚫Categorize -제품과 제품에 포함된 부품까지 포함 -맥락과 맥락속에 포함 된 개념, 개체, 감정, 인상, 등까지 포함 -Netflix 를 보라 4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션
  • 23. - 23 ⚫정보의 과잉이란 없다. 제대로 된 여과과정이 이뤄지지 않았을 뿐이다 -클레이 서키 ⚫창조성의 재정의 독창적인 속성 보다는 배치 작업의 속성이 더 강하다-> 여러가지 아이디어를 지금까지와는 다른 방식으로 관찰하고 통합하는것 -아더 퀘슬러 ⚫큐레이션이란 개별 콘텐츠 하나 하나의 문제라기 보다 이들을 어떻게 조합 할 것인가에 대한 것이다. 특정 방식으로 배치된 콘테츠가 어떤 이야기를 전달하는지, 생성된 맥락 속에서 이들 콘텐츠가 사회 및 문 화에 대해 대해서는 어떤 입장을 취하고 있는지에 관한 것이라고 볼 수 있다 온라인 큐레이터 마리아 포포바(불가리아 출신 미국인으로 책에서 좋은 내용을 골라 큐레이션해주는 영 문 블로그 Brain Pickings의 운영자) http://1488160907.affiliationmayo.com/1st-world-problems-compilation-2.html 4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션
  • 24. - 24 4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션 Case
  • 25. - 25 4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션
  • 26. - 26 4차 산업 혁명시대 지식 생성 패러다임 – 큐레이션 이들을 어떻게 조합 할 것인가
  • 27. - 27 Digital Curation의 시대 https://www.dcc.ac.uk/ Research Data Alliance 2018.04. 바로셀로나 선언
  • 28. - 28 Digital Curation의 이 점 Digital curation ensures the sustainability of data in the long term, however it has immediate value for data creators as well as users. Digital curation facilitates: • Persistent access to reliable digital data • Improved quality of the data itself and its research context • The use of common standards across different datasets, which in turn leads to more opportunities for cross-searching and collaboration • Authenticity checks, improving the trustworthiness of data • Ensuring data is valid as a formal record where appropriate, meaning it can function into the future as legal evidence • Exploiting initial investment by ensuring that data is available for use and re-use and protecting the financial value of information • Improved speed and range of access, data sharing and analysis opportunities, and other research benefits Digital curation ensures long-term value by: • Preserving data and protecting it against loss and obsolescence (particularly crucial where the data is non-reproducible or extremely valuable) • Allowing continued access to data despite short-term funding or institutional changes • Encouraging re-use of data • Maximising the exploitation of digital materials cumulatively through time • Providing information about the context and provenance of data • The use of tools and services to migrate data, metadata, and other representation information into new formats to ensure it remains meaningful to users • A management infrastructure for the preservation and dissemination of data in perpetuity https://www.dcc.ac.uk/sites/default/files/documents/resource/briefing-papers/what-is-digital-curation.pdf
  • 29. - 29 DCC Digital Curation Model https://www.dcc.ac.uk/ 무한 연쇄
  • 30. - 30 Curation Practice in Video –VAD(Video As Data) Model 필요 Data 확보 발췌 정리 배열 저장 ↓ 배포 Search Curation Use/ Resue Video, Image, Text, Audio/Sound 분석 & 객체 검출 Meta Data Auto Labeling Dynamic Meta Data Based 0:05~0:20 1:30~1:50 1:05~1:20 ▪Computer Vision Tech ▪Image Recognition Tech ▪Text & NLP Analysis Tech ▪Sound/Audio Analysis Tech Dynamic Meta Data Processing Not Edit But Assemble Topic Define Audio Video Sentence ( a part of Full Text) Image Specific Data (Ex : Transaction Data) Auto Assembled Media Content Copy Right Reserved 2017 by Alexander Park
  • 31. - 31 europeandataportal.eu/en 2020.10.26일 현재 Digital Curation의 확산 토대 – 세계적 데이터 개방과 공유 추세 확산 : Europe
  • 32. - 32 https://data.gov 2020.10.26일 현재 Digital Curation의 확산 토대 – 세계적 데이터 개방과 공유 추세 확산 : 미국
  • 33. - 33 . . . 120 공공데이터 포털 자료 재정리 , https://www.data.go.kr/index.do 2020.10.26일 현재 Digital Curation의 확산 토대 – 세계적 데이터 개방과 공유 추세 확산 : 한국
  • 34. - 34 발화점 : 팀 버나스 리 경 : Linked Open Data 운동 -2009. 3. 14. https://youtu.be/OM6XIICm_qo
  • 35. - 35 발화점 : 팀 버나스 리 경 : Linked Open Data 운동 –ODI
  • 36. - 36 3.4 million concepts described by 1 billion triples, including abstracts in 11 different languages LOD 기반 데이터세트를 활용한 데이터 개방 및 공유 : Dbpedia 2017
  • 37. - 37 LOD에 연결되는 아카이브들은 이런 속성을 ⚫ 데이터들의 연계와 융합을 통한 ‘창조적 발현(창발: Emergence)’ ⚫ 데이터들의 진본성, 무결성, 신뢰성, 이용가능성을 보장하는 데이터 아카이브 ⚫ 데이터 아카이브 플랫폼: 연계와 융합을 통한 소통과 창조적 발현이 가능하게 함 노명환, 플랫폼으로서의 아카이브와 세계의 사상 문명 문화의 소통과 융합: 동양의 음양오행 사상과 서양의 양자역학 상보성의 원리를 중심으로 2020.6.7
  • 38. - 38 데이터 개방/공유의 수준과 지향점 – 5 Star Open Data Berners-Lee, T. (2006) https://5stardata.info/en/
  • 39. - 39 But still…… EC, open_data_maturity_report_2019. 58p
  • 40. - 40 LOD 에 기반한 지식 네트워크는 Rhizome Network Tree Rhizome Semantic network Is
  • 41. - 41 Why Rhizome? 경계와 중심이 해체된 끝없는 연결-탈 중심, 탈주, 탈 영토화 이용자들에게 특정 룰을 요구하는 공급자 중심이 아닌 모든 참여자들의 창발성에 의해 네트웍이 형성되며 큐레 이션에 기반하여 데이터와, 정보, 지식이 공유 확산되는 무경계, 무정형, 자율에 기반한 데이터의 무한 연쇄 인드 라망 - Rhizome
  • 42. - 42 Why Rhizome? 영토화 된 Silo에 속박되어 고립된 Data의 해방과 전지구적 연결
  • 43. - 43 지구 규모 리좀 네트워크는 데이터세트 간 결합을 통해 끝없이 확장 : 창발성의 원천 https://www.ted.com/talks/kirby_ferguson_embrace_the_remix
  • 44. - 44 4차 산업 혁명 시대 데이터 아카이브 플랫폼은? : 아카이브 2.0 관리․운영 측면에서 볼 때, 아카이브 1.0이 지리적으로 고정된 물리적 공간을 갖추고 기록 정보자원에 대한 접근을 제공하는 전통적 아카이브라면, 아카이브 2.0은 물리적 공간으로부터 자유롭게 이용자들의 참여를 지원하는 온라인 플랫폼이라 할 수 있다(Ridolfo 외 2009). 플랫폼으로서의 아카이브는 새로운 정보통신기술의 적극적 수용을 통해 기록정보자원의 투명하고 개방적인 활용을 지원한다. 특징 세부내용 1. The Web As Platform 플랫폼으로서의 웹 -인터넷 환경에서 쉽게 접근할 수 있는 가상의 공간 제공 2. Harnessing Collective Intelligence 집단 지성의 활용 -이용자의 참여유도 -이용자는콘텐츠의제공자이자활용자 -이용자들 간 네트워킹 가능 3.DataistheNextIntel Inside 데이터의 경쟁력 -웹 상의 모든 엑티비티를 데이터베이스 로 구축 -차별화 된 데이터 제공 4. Rich User Experience 풍부한 이용자 경험 제공 -웹 환경에서 다양한 디바이스를 통해 이용자의 니즈를 충족시킬수있는서비스 제공. 노지영 ,제4차산업혁명시대, 아카이브와 아키비스트의 핵심역할에대한연구:DCC 생애주기 모델을 중심으로. 2020.8 p35
  • 45. - 45 아카이브 2.0 플랫폼은? – “새로운 정보 통신 기술” 탈 중심 , 경계의 해체, 큐레이션에 기반한 데이터 결합의 무한 연쇄를 통해 전 지구 범위에서 창발적 지식의 생성이 가능하기 위해서는 1. 기록의 4대 속성 진본성 authenticity, 신뢰성 reliability, 무결성 integrity, 이용 가능성 useability 을 지원 2. 언어 장벽 문제 해결 3. 자연어 처리 자동화 문제 해결 4. 언어 배후에 내재한 구조의 상이함에서 비롯되는 해석 문제 해결이 필요
  • 46. - 46 아카이브 2.0 - 기록의 4대 속성 지원 기술 :Block Chain ⚫ 출범 시기: 2017년 6월 29일 ⚫ 프로젝트 주관 기관: 영국 국가기록원 ⚫ 예산 : 약 7억 원(국가과학기술 연구기금에서 출연) ⚫ 프로젝트 기간: 2019년 6월까지 24개월 ⚫ 목적: 디지털기록의 무결성과 접근성을 혁신 ⚫ 목표: 기록관리 아키텍처 개발 ⚫ 의의: 공공기록의 신뢰성 확보를 위해 블록체인 기술의 적용가능성을 조사, 연구하는 최초의 사례라는 점에서 주목. ⚫ 등장 배경: 디지털 기록물의 원본성 확인 및 디지털 기록물이 신뢰 할 수 있는 관리 체계로 관리되었음을 입증해야 한 다는 TNA의 필요 ⚫ 플랫폼: 아크엔젤(ARCANGEL) 시제품(prototype)은 이더리움(Ethereum)을 기반으로 개발. ⚫ 이더리움 채택 이유: 전 세계적으로 채택된 범용성, 분산원장기술 플랫폼으로서의 명성, 가상머신을 통한 데이터 저 장과 스마트계약 가능 ⚫ 적용 블록체인 모형: Permissioned(Private), Permissionless (Public) 두 가지 Model 동시 추진 영국 TNA(The National Archives, 국가기록원)의 아크엔젤(ARCANGEL) 프로젝트 사례 1. 기록의 4대 속성 진본성 authenticity, 신뢰성 reliability, 무결성 integrity, 이용 가능성 useability 을 지원
  • 47. - 47 아카이브 2.0 - 기록의 4대 속성 지원 기술 : Big Data 처리 기술 노지영 ,제4차산업혁명시대, 아카이브와 아키비스트의 핵심역할에대한연구:DCC 생애주기 모델을 중심으로. 2020.8 p84 1. 기록의 4대 속성 진본성 authenticity, 신뢰성 reliability, 무결성 integrity, 이용 가능성 useability 을 지원
  • 48. - 48 아카이브 2.0 - 기록의 4대 속성 지원 기술 : Big Data 처리 기술 1. 기록의 4대 속성 진본성 authenticity, 신뢰성 reliability, 무결성 integrity, 이용 가능성 useability 을 지원 < Google Sheet에서 App 개발 자동화 기 능 제공 > 어제 구글 블로그에 Create time-saving apps using AppSheet, no coding required 라는 제목의 글이 실렸습니다 (2020.10.21) (https://blog.google/.../no-code- application-development.../) 말 그대로 코딩 한줄없이 앱을 개발할 수 있는 기능을 구글 Docs의 Sheet에 제 공한다는 거죠. Sheet 열어보니까 도구 메뉴 밑에 AppSheet라는 기능이 들어 있네요 Sheet로 뭔가 정리하는 Data Sheet를 만 들면 이 테이블을 토대로 필요 기능들 을 정의 할 수 있는 UI를 제공합니다 제공하는 여러 항목들에 대한 필요 내 용을 세팅하면 모바일과 태블릿용 App 이 자동으로 만들어져 나온다는 거죠 예를 들면 구글 맵을 활용 어떤 지역의 맛집 검색 앱을 만들려면 식당 이름, 메 뉴 , 가격 등 맛집앱 관련 테이블을 생성 하고 맵 주소와 매핑하면 끝나는 식입 니다 https://www.facebook.com/Ebenezel/posts/10207909370888946
  • 49. - 49 아카이브 2.0 - 기록의 4대 속성 지원 기술 : Big Data 처리 기술 기반 서비스 미국 ICPSR(Inter-University Consortium for Political and Social Re-search) ICPSR은 미국 미시간대학교(Uni versity of Michigan)에 있는 세계 최대 사회과학 조사· 통계자료(설문조사자 료, 여론조사자료, 통계 마이크로데이터, 각종 질적자료 등) 의 아카이브로 전 세계 800여 개의 학술연구기관과 컨소시엄으로 운영되고 있으며 세계 각 국에서수집된연구자료를소장하고있다.이데이터아카이브는경영,경 제, 교 육, 정치, 국제관계, 사회, 보건복지를 비롯한 19개 주제 분야별 조사 자료 및 연구자료를 지속적으로 수집하여 검색 및 열람서비스를 제공하고 원자료(raw data)를 확보 하여 연구의 검증과 통계분석 등 2차적 자료로 활 용될 수 있도록 제공하고 있다. ICPSR은 데이터베이스를 관리하고, 과학적 데이터에 관한 접근, 연구데이터 의 장기 보 존, 입증된 연구결과가 재사용이 가능하도록 큐레이션을 구축 제공한다 노지영 ,제4차산업혁명시대, 아카이브와 아키비스트의 핵심역할에대한연구:DCC 생애주기 모델을 중심으로. 2020.8 p86 1. 기록의 4대 속성 진본성 authenticity, 신뢰성 reliability, 무결성 integrity, 이용 가능성 useability 을 지원
  • 50. - 50 UKDA(United Kingdom Data Archive) UKDA는 데이터 산출, 프로세싱, 분석, 보존, 접근, 재사용의 단계를 지닌 연구데이터 생애주기 모델을 기반으로 선별한 데이터를 관리한다. 이때 연구데이터 생애주기 모델은 데이터 큐레이션(data curation), 디지털보존(dig ital preservation), 데이터 접근(data access), 고객 지원(user support), 역량 강화(capacitybuilding) 의단계를포함한다.더나아가UKDA는보다효과 적인연구데이터관리를위해데이터출판,정보거버넌스,데이터보존및 신뢰, 표준 및 프로토콜에 대한 가이드를 제공한다 노지영 ,제4차산업혁명시대, 아카이브와 아키비스트의 핵심역할에대한연구:DCC 생애주기 모델을 중심으로. 2020.8 p93 아카이브 2.0 - 기록의 4대 속성 지원 기술 : Big Data 처리 기술 기반 서비스 1. 기록의 4대 속성 진본성 authenticity, 신뢰성 reliability, 무결성 integrity, 이용 가능성 useability 을 지원
  • 51. - 51 아카이브 2.0 – 통 ,번역 및 자연어 처리 자동화 지원 기술 : AI ❑ 번역기 현재 매달 5억 명 이상이 구글 번역기를 사용하고, 매일 1,400억 개의 단어가 구글 번역기를 통해 다른 나라말로 옮겨진다 2020. 10. 26일 현재 100개 이상 언어 상호 번역 가능 ❑ 자연어 처리 BERT(Google) , GPT-3 (Open AI) 및 Computer Vision… Question and Answering - 주어진 질문에 적합하게 대답 - KoSQuAD, Visual QA etc. Machine Translation - 구글 번역기, 네이버 파파고 등 실시간 통역 문장 주제 찾기 또는 분류하기 - 역시나 기존 NLP에서도 해결할 수 있는 문제는 당연히 해결 가능 사람처럼 대화하기 Programming 페이지 내부 구절 색인을 통한 검색 동영상 내 Key moment 장면 검색 이외에도 Computer Vision 등 직접 정의한 다양한 문제에도 적용 가능 2. 언어 장벽 문제 해결
  • 52. - 52 ⚫ 페이지 내부 구절 색인을 통한 검색 아카이브 2.0 – 통, 번역 및 자연어 처리 자동화 지원 기술 : AI https://blog.google/products/search/search-on/ , Google 2020 Search On 이벤트 발표2020.10.20 2. 언어 장벽 문제 해결
  • 53. - 53 ⚫ 메타데이터 자동 생성을 통한 동영상 내 Key moment 장면 검색 아카이브 2.0 – 통, 번역 및 자연어 처리 자동화 지원 기술 : AI https://blog.google/products/search/search-on/ , Google 2020 Search On 이벤트 발표2020.10.20 3. 언어 장벽 문제 해결 – 자연어 처리 : Video Metadata 생성 자동화
  • 54. - 54 https://github.com/felixbur/Speechalyzer 아카이브 2.0 – 통, 번역 및 자연어 처리 자동화 지원 기술 : AI 3. 언어 장벽 문제 해결 – 자연어 처리 : STT & 텍스트 분석
  • 55. - 55 Text Labeling Open Source Tool Kit-Stanford CoreNLP 아카이브 2.0 – 통, 번역 및 자연어 처리 자동화 지원 기술 : AI 3. 언어 장벽 문제 해결 – 자연어 처리 : Text Mining
  • 56. - 56 LOD 기반 데이터세트를 활용한 데이터 개방 및 공유 : 다국어 지원
  • 57. - 57 LOD 기반 데이터세트를 활용한 데이터 개방 및 공유 : 다국어 지원 Interoperability involves two aspects (Ide and Pustejovsky, 2010): How to access (read) a resource? (Structural interoper- ability) Resources use comparable formalisms to represent and to access data (formats, protocols, query lan- guages, etc.), so that they can be accessed in a uniform way and that their information can be integrated with each other. How to interpret information from a resource? (Conceptual interoperability) Resources share a common vocabulary, so that linguistic information from one resource can be resolved against information from another resource, e.g., grammatical descriptions can be linked to a terminology repository. With the rise of Semantic Web and Linked Data, new representation formalisms and novel technologies have become increasingly aware of the potential of these developments with respect to the challenges posited by the heterogeneity and multitude of linguistic resources available today.
  • 58. - 58 https://cordis.europa.eu/project/id/825182 LOD 기반 데이터세트를 활용한 데이터 개방 및 공유 : 다국어 지원
  • 59. - 59 https://pret-a-llod.github.io/index.html LOD 기반 데이터세트를 활용한 데이터 개방 및 공유 : 다국어 지원
  • 60. - 60 아카이브 2.0 –문화 차이에 의한 Connotation의 해석과 의미 생성 Denotation Connotation 4. 언어 배후에 내재한 구조의 상이함에서 비롯되는 해석 문제 해결이 필요
  • 61. - 61 아카이브 2.0 –문화 차이에 의한 Connotation의 해석과 의미 생성 앞으로도 상당 기간 이 부분은 AI 접근이 제한적일 것이며 다양한 문화에 내재한 상징과 신화를 해석 할 수 있는 인문적 소양을 지닌 인간의 영역으로 유지 될 것 4. 언어 배후에 내재한 구조의 상이함에서 비롯되는 해석 문제 해결이 필요 프란츠 파농이라면? 프랑스 제국주의의 허구
  • 62. - 62 Element Attribute 비고 물리적요소 해상도,색상(컬러/흑백,Color/BW),디지털/아날로그(Digital/Analog),화면비율(FrameRatio) AI 기술적요소 포맷및코덱(Format,Codec-AVI,MPEG,..), 차원(2D,3D,4D),가상현실(VR),증강현실(AR) 특수효과(SpecialEffect),촬영장비(Camera&Devices),녹음장비(SoundRecord) AI 제작요소 장르(Genre),이용자(UGC,UserGeneratedContent),감독명(Director),배우명(Actor),스텝명(Staffs) AI 연출/편집 요소 컷/숏단위,연출여부,편집,앵글,카메라워크등 Cut,Shot,Sequence,Mise-en-Scene,Editing, SceneDirection–Angle,Motivation,information,compositionframingDepthcontinuity(Movement,position,sound, dialogue)costume,Make-up..) AI 내용요소 Sound(Effect..).Audio(Music,Dialogue),Object(각종사물,동물,사람...),Action,Place,Emotion,Text,Image AI 서비스요소 스트리밍(Streaming),다운로드(Download),실시간(Live) AI 배포요소 배포방법및단말기 MovieTheater,TV,OTT,Device AI 스토리전개요소 스토리,콘텐츠,내러티브,분위기,플롯등 Story,Plot,Context,Narrative,Mood 인간 메시지요소 Topic,Ism 인간 기호/상징요소 Symbol,denotation(외시),connotation(공시),signifier,signified,studium,punktum,Langue(사회적-에크르튀르), Parol(개인적화법스타일) 인간 기타요소 별칭(A.K.A),trivia,etc, 인간 아카이브 2.0 –문화 차이에 의한 Connotation의 해석과 의미 생성 – 영상 Case
  • 63. - 63 4차산업혁명기 데이터 아카이브는 끊임없는 의미 생성과 창발적 지식 창출 플랫폼 기록은 기록 관리 과정에서 지속인 맥락설정,예를 들어 메타데이터의 설정 작업을 통해 그 의미와 성격이 끊임없이 변할 수 있다. 이러한 의미에서 기록관리 과 정은 기호학에서 말하는 지속인 ‘기호작용(semiosis)'으로 이해(151) 업워드(Frank Upward)는 전자기록 시대의 기록을 ‘개념의 구성물’(records as conceptual constructs)4)로 볼 것을 그리고 레코드 컨티뉴엄을 ‘지속적인 시· 공의 구 성’(continuous time/space construct)‘5) 과정으로 이해할 것을 제안했다 왜냐하면 맥락의 변화 속에서 기록의 의미와 성격이 변한다는 측면을 기호학의 에서 유효하게 검토하고 보다 더 체계화 할 수 있기 때문이다. 업 워드 자신이 기 록관리를 사유의 측면에서 ‘의미 만들기’ (signification) 과정으로 이해했다. 인간의 사회적 행위의 산물로 서 ‘맥락 속의 개별 기록’의 성격과 의미 그리고 그것의 사회 역할을 설명하는 데도 큰 도움을 수 있을 것이다(151) 레코드 컨티뉴엄 이론은 기록을 맥락 의 변화와 더불어 그 의미와 성격이 변화하는 ‘상징 증표’ (symbolic token ), ‘논리 단체’(logical entities), ‘개념의 구성물’등으 로 본다(152) (노명환, 기호학 및 ‘성리학적 구성주의’ 이론을 적용한 기록과 기록관리 행위의 본질과 사회적 역할의 이해: 레코드 컨티뉴엄의 보완에 초점을 맞추어 (역사문 화연구 제57집151~2)) ⚫Curation 과 Record Continuum Curation의 요체가 과잉 콘텐츠 또는 사물들을 대상으로 가치 있는 것들을 선별, 배열 /배치를 통해 끊임없이 새로운 맥락과 의미 생성을 통한 가치의 창출인 것 과 마찬가지로 Record Continuum 역시 기록을 맥락 의 변화와 더불어 그 의미와 성격이 변화하는 ‘상징 증표’ (symbolic token ), ‘논리 단체’(logical entities), ‘개념 의 구성물’등으로 보면서 사유의 측면에서 ‘의미 만들기’ (signification) 과정 으로 파악하는바 Curation의 방법론과 Record Continuum 방법론적 틀은 일맥 상통한 다고 할 수 있다
  • 64. - 64 데이터 아카이브가 끊임없는 창발적 지식 창출 플랫폼으로 기능하기 위해서는? ‘시(時)’에 대한 이 같은 두 가지 설명을 통해 데이터 융합의 ‘해석과 활용의 시기’의 중요성에 대해 유추해볼 수 있다. 우선, 데이터는 물리적인 융합으로만 끝나지 않 는다. 일단이 융합이 되면 그 데이터의 의미를 해석하는 것은 인간의 몫이다. 그 의미는 바라보는 관찰자에 의해서 바뀔 수 있는데, 이는 관찰자의 배경지식과 그가 처한 사회(시기와 장소)의 영향을 받는다. 그러므로 관찰자는 데이터의 생성과 융합의 의미를 명확하게 이해하고 전체를 전면적으로 파악하기 위한 통찰력이 요구된 다. 또 데이터는 각각 유용하게 쓰일 수 있는 적기가 있다. 다량으로 쏟아지는 모든 데이터를 보관할 수 없는 만큼 시대가 필요한 또는 앞으로 필요하게 될 데이터를 선별하는 안목이 필요하다. 결국 활용되지 않으면 데이터의 가치는 떨어진다. 그래서 데이터의 가치를 발견하고 선별·보존함으로써 적기에 활용될 수 있도록 하는 것이 무엇보다 중요하다.(66) 데이터 융합의 관점에서 데이터 아카이브 구축은 어떤 의미가 있을까? 본 논문에서는 ‘넓은 의미’의 데이터의 융합을 하나의 복잡적응계(구성요소들의 다양한 정보 전달, 학습, 적응능력 등의 특징을 결합한 복잡계의 확장된 형태)로 바라보았다. 기본적으로 복잡계는 수많은 구성요소들이 유기적인 협동으로 자기조직화를 통해서, 새로운 질서인 ‘창발현상’을 일으킬 수 있는 메커니즘을 말한다. 구성요소들이 모여 있다고 하더라도 창발이 일어나지 않는다면, 그것은 단지 뒤엉킨 시스템에 불과 할 뿐이다. 따라서 데이터의 융합은 상호작용을 통해 창발 현상을 일으킬 수 있는 본질을 내포하고 있다. 창발 현상이 일어나기 위해서는 대표적으로 집합성과 꼬리 표 달기(tagging)의 속성과 메커니즘을 포괄해야 한다. 이들은 각 주체들의 집합 상호작용과 집단의 속성을 나타내는 특징을 가지고 있으며 집합체의 창발 현상을 일으킬 수 있도록 한다.(68) 데이터 아카이브는 이러한 융합의 구성요소들이 자신의 속성을 지닌 채 상호작용이 활발히 진행될 수 있는 공간이 되어야 한다. 데이터가 단순히 모여 있다고 해서 그 안에서 융합되고 의미가 만들어지는 것은 아니다. 이들 간의 상호작용이 일어날 수 있도록 열린 시스템과 구성요소들을 관리해주는 역할을 수행해야 한다.(69) 김하정 ,복잡계와 음양 이론을 통해 본 데이터 융합의 본질과 데이터 아카이브의 필요성 및 발전 방향. 2020.8 (한국외국어대학교 대학원 석사논문)
  • 65. - 65 데이터 아카이브가 끊임없는 창발적 지식 창출 플랫폼으로 기능하기 위해서는? ‘시(時)’에 대한 이 같은 두 가지 설명을 통해 데이터 융합의 ‘해석과 활용의 시기’의 중요성에 대해 유추해볼 수 있다. 우선, 데이터는 물 리적인 융합으로만 끝나지 않는다. 일단이 융합이 되면 그 데이터의 의미를 해석하는 것은 인간의 몫이다. 그 의미는 바라보는 관찰자에 의해서 바뀔 수 있는데, 이는 관찰자의 배경지식과 그가 처한 사회(시기와 장소)의 영향을 받는다. 그러므로 관찰자는 데이터의 생성과 융합의 의미를 명확하게 이해하고 전체를 전면적으로 파악하기 위한 통찰력이 요구된다. 또 데이터는 각각 유용하게 쓰일 수 있는 적기 가 있다. 다량으로 쏟아지는 모든 데이터를 보관할 수 없는 만큼 시대가 필요한 또는 앞으로 필요하게 될 데이터를 선별하는 안목이 필요 하다. 결국 활용되지 않으면 데이터의 가치는 떨어진다. 그래서 데이터의 가치를 발견하고 선별·보존함으로써 적기에 활용될 수 있도록 하는 것이 무엇보다 중요하다.(66) 데이터 융합의 관점에서 데이터 아카이브 구축은 어떤 의미가 있을까? 본 논문에서는 ‘넓은 의미’의 데이터의 융합을 하나의 복잡적응계 (구성요소들의 다양한 정보전달, 학습, 적응능력 등의 특징을 결합한 복잡계의 확장된 형태)로 바라보았다. 기본적으로 복잡계는 수많은 구성요소들이 유기적인 협동으로 자기조직화를 통해서, 새로운 질서인 ‘창발현상’을 일으킬 수 있는 메커니즘을 말한다. 구성요소들이 모 여 있다고 하더라도 창발이 일어나지 않는다면, 그것은 단지 뒤엉킨 시스템에 불과할 뿐이다. 따라서 데이터의 융합은 상호작용을 통해 창발 현상을 일으킬 수 있는 본질을 내포하고 있다. 창발 현상이 일어나기 위해서는 대표적으로 집합성과 꼬리표 달기(tagging)의 속성과 메커니즘을 포괄해야 한다. 이들은 각 주체들의 집합 상호작용과 집단의 속성을 나타내는 특징을 가지고 있으며 집합체의 창발 현상을 일으킬 수 있도록 한다.(68) 데이터 아카이브는 이러한 융합의 구성요소들이 자신의 속성을 지닌 채 상호작용이 활발히 진행될 수 있는 공간이 되어야 한다. 데이터 가 단순히 모여 있다고 해서 그 안에서 융합되고 의미가 만들어지는 것은 아니다. 이들 간의 상호작용이 일어날 수 있도록 열린 시스템과 구성요소들을 관리해주는 역할을 수행해야 한다.(69) 김하정 ,복잡계와 음양 이론을 통해 본 데이터 융합의 본질과 데이터 아카이브의 필요성 및 발전 방향. 2020.8 (한국외국어대학교 대학원 석사논문)
  • 66. - 66 4차 산업혁명기 데이터 아카이브는 리좀 네트워크 기반 Data Nomadism 플랫폼 4차 산업혁명 시대 데이터 아카이브는 단지 데이터를 관리하는 고정된 역할에 머무르지 않고 전 지구적 범위에서 다양한 데이터 세트를 결합하고 끊임없이 새로운 의미와 맥락을 생성하여 “창발적 지식 창출을 주도”하는 역할을 수행하며 그 과정에서 스스로를 지속적으로 변화 시켜 나가는 Data Nomadism을 실천하는 플랫폼으로 속성을 지녀야 할 것이라 생각 한다 그리고 이러한 특성을 지니는 플랫폼으로서 전 지구 범위로 구축되는 데이터 아카이브의 활용에 절대적으로 필요한 기록 의 4대 속성 관리 와 다언어 , 자연어 처리 등의 문제는 블록체인, 빅데이터, AI 등 4차산업혁명 기반 기술들로 상당부분 해 결 될 것으로 예상한다 그러나 상이한 언어의 배후에 있는 구조와 이에 기반한 다양한 문화 차이에서 비롯되는 신화영역 해석, 즉 Connotation의 해석 문제는 상당기간 해결하기 어려운 문제로 남을 것이다 따라서 이들 전 세계 데이터 아카이브를 활용해서 지식 창출을 하는 데이터 노마디스트들은 다문화 해석에 필요한 기호 학을 비롯, 다양한 인문학 소양이 필수 역량이 될 것이다 (아키비스트들은 보다 전문적 역량을 토대로 데이터 노마디스트들을 지원하는 데이터 노마디즘 실천가이면서 데이터 큐레이터로서 역할을 해야 할 것이다. 최근 정보기록학과 박사 수료생인 양월운 선생이 외대 교육선진화 센터의 프로젝트에 응모하여 선정된 "한국에서 일본의 기 록을 찾고 아카이빙 하는 방법을 통해 학생들이 자발적으로 원천자료를 찾을 수 있고, 공부하는 역량을 기를 수 있는 교수법 모형 개발” 같은 사례는 다언어, 다문화 데이터 아카이브를 활용한 데이터 노마디스트들의 지식 창출 역량 함양을 위해 전문가로서의 데이터 아키비스트가 어떻게 기여 할 수 있는지를 보여주는 좋은 사례라 할 수 있을 것이다) 또한 데이터 노마디스트들은 전세계의 Dataset이 연결되어 구축되는 리좀 네트워크 기반의 Data 를 조회하고 그 데이터 간 관계를 파악하여 새로운 정보를 생성하며, 정보들 사이의 패턴을 발견하여 새로운 지식으로 가공 활용하는 ICT 능력 을 필수적으로 지녀야 할 것이다 한국외국어대학교는 이러한 4차산업혁명기 데이터 아카이브 중심 정보,지식 생성 시대에 가장 적합한 역량을 보유한 교 육 기관이라고 생각한다. 한국외국어 대학,대학원이 데이터 노마디스트, 데이터 큐레이터 양성의 세계적 중심 요람이 되 기를 기대해 본다.
  • 67. - 67 부록 : 큐레이션 Tools. Service Name Service 유무료 AndersPink 콘텐츠를 검색하고 수집하고, 집계하고, 구성하고 공유 Freemium BundlePost Google 알리미와 같은 RSS 피드에서 콘텐츠를 수집하는 콘텐츠 관리 플랫폼 Freemium ContentGems 콘텐츠 탐지 엔진 Freemium diigo 소셜 북마크 서비스, 웹 페이지의 어떤 부분을 강조 표시하고 스티커 메모를 하이라이트 Freemium DrumUp 콘텐츠 검색 및 콘텐츠 관리 도구 Freemium elink 개인 페이지에 구성된 링크 모음 Freemium Feedly RSS Feed 서비스, 콘텐츠 검색, 선택 및 공유를위한 가장 인기있는 도구 중 하나 Freemium Flipboard 콘텐츠를 검색, 치료 및 집계하는 응용 프로그램입니다. 자신 만의 개인 잡지 발행 등 Free Flockler 팬이 나에 대해 이야기하는 내용을 포함하여 모든 콘텐츠를 결합 할 수 있게 해주는 서비스 Freemium Hootsuite 소셜 미디어 관리 도구 Freemium Listly 목록을 만드는 목적에 최적화 된 서비스 Freemium nuzzel 특정 주제와 관련된 트렌드 콘텐츠를 찾을 수 있는 뉴스 큐레이션 서비스 Freemium Paper.li 모든 웹 소스에서 선택한 컨텐츠로 온라인 신문을 작성하고 발행 Freemium Pearltrees URL을 수집, 구성 및 공유하고 이미지 및 개인 메모를 업로드 Freemium Pinterest Image Curation 중심 서비스 Freemium pocket 데스크탑 브라우저 또는 모바일 응용 프로그램을 사용하여 어디서나 컨텐츠를 저장하고 정리 Freemium PostPlanner 잠재 고객과 공유 할 유용한 콘텐츠를 찾는 데 도움이되는 도구 Freemium Rebelmouse Content 큐레이션 후 발행 서비스 Freemium Reddit 사용자가 가장 인기있는 콘텐츠를 강조하는 Social news platform Free Scoop 전문가와 기업이 필요한 콘텐트를 발견하고 이를 가공하여 다시 공유하는 서비스 Freemium slideshare PowerPoint 및 PDF 온라인 프레젠테이션을 찾을 수있는 탁월한 도구 Free Spidwi 소셜 미디어 관리 도구입니다 Freemium storify Facebook, Twitter 및 Instagram과 같은 소셜 미디어 채널에서 콘텐츠를 수집하여 스토리 또는 타임 라인 구성 Freemium Tagboard Facebook,twitter 등의 소셜미디어에서 콘텐츠를 큐레이션하여 발행 Freemium Trap.it 관심 분야에 적합하고 가장 적합한 컨텐츠를 필터링하는 컨텐츠 관리 플랫폼 Freemium ZestDigital Marketing 관련 뉴스 큐레이션 서비스 Freemium