超高層物理学を試験環境とした学術情報基盤の考察
Consideration of the scholarly information
infrastructure on upper atmospheric research field as a
test bed
Yukinobu KOYAMA
orcid:0000-0001-5363-3870
Transdisciplinary Research Integration Center
/National Institute of Informatics,
Research Organization Information and Systems.
1
Self Introduction
 2015〜 新領域融合研究センター
 2009〜2015 京大・理・地磁気センター IUGONET
(DB + etc.)
 2007〜2009 NAOJ・ALMA
(Software Integration, Test & Support)
 2006〜2007 京大・エネ科・Energy Economics
(DB + Linear Programming Model)
 1998〜2000〜2006 NAIST・Phys. Phys.+HPC
From this Apr.
大学共同利用機関法人
 人間文化研究機構
 自然科学研究機構
 高エネルギー加速器研究機構
 情報・システム研究機構
 国立極地研究所
 国立遺伝学研究所
 統計数理研究所
 国立情報学研究所
4
手法に焦点。
Big Data時代、Data-intensive
Scienceを迎える前の、2004年の法
人化の時点でこのように組織した。
研究対象に焦点。
THE FOURTH PARADIGM
 2009年10月
 Tony Hey編
 Jim Gray, Peter Foxらにって、
実験、理論、数値計算につづく、
第4のパラダイムである、Data-
intensive scienceの到来が示
唆されている。
5
世界最古!?のデータ中心科学
 ティコ・ブラーエ(デンマーク、1546-1601): 肉眼で星のデータ
ベースを作成。
 ヨハネス・ケプラー(ドイツ、1571-1630): ブラーエの星のデータ
ベースから、ケプラーの法則(1609)を導く。
(手法) 仮説→ティコのVOを調査→blablabla
 ハンス・リッペルスハイ(オランダ): 1608年に望遠鏡を発明。
 ガリレオ・ガリレイ(イタリア): 1609に望遠鏡を宇宙に向ける。
6
本編
7
Origin of Journal Culture
 Royal society of London
philosophical transactions
started to published in 1665.
 Basically, the format is not
changed for 350 years!
 Imcompleteness:
 Data Citation,
 Metadata of Datasets,
 Description of the derivation
process,
 Sharing problem of data
visualization and analysis
software.
8
R. Boyle, doi:10.1098/rstl.1665.0007
Introduction 1
Number of articles and quantity of data
9
NISTEP, 2013
http:-reports/idc-digital-universe-2014.pdf
Total storage capacity in 2013: 4.4ZB
(kilo, mega, giga, tera, peta, exa, zetta, yotta)
It's increased 40 percent a year.
[Q] Articles & Data is increasing suddenly.
Papers which have no reproducibility are generating.
Is the current scholarly communication infrastructure enough?
Unable to validate the relevant
preclinical research for almost
two-thirds [Wadman, 2013]
サイエンスは国家公務員
がやるもの?
To simplify the issue
 We consider Upper Atmospheric Research field to stay
away from
 Ethical, Legal, Social Issues.
10
http://www.nipr.ac.jp/jare/now/20150901.h
ml
Overview of Scholarly
informations
12
Japan Link Center (JaLC)
 JaLC is the 9th registration agency of DOI in the world.
 Koyama is a member of External Committee of JaLC.
 JaLC started to mint DOI into Research Data in 2014
JaLC会員であるNICTで走って
いる、DOI登録仲介システム
 日本のWDS/WDCメンバー用。
 Drupalベース。
 プロトタイプは小山作。
 その後、業者にお任せ。
13
Japanese Usecase
Landing Page of DOI
 Our WDS/WDC group in
Japan minted a DOI to
mesospheric wind velocity
data observed by NICT.
 This is the first case in “ DOI
REGISTRATION
EXPERIMENTAL PROJECT
TO RESEARCH DATA” by
JaLC.
 This DOI have already refered
from JGR paper.
(doi:10.1002/2014JD022647)
doi:10.17591/55838dbd6c0ad 14
Ecosystem of
scholarly communications
15
https://theresearchwhisperer.wordpress.com/2013/04/23/data-citation/
Overview of Scholarly
informations
Upper Atmospheric
Domain Specific Metadata Database
(IUGONET Metadata DB)
http://search.iugonet.org/
(Customized Dspace 1.7.2)
Instantiation
Insert into DB
17
Data Handling
in Upper Atmospheric Research
 Upper Atmospheric Field
 Variety issues in Big Data.
 Data Format is not unified.
 To unify it is too difficult.
 Data Analysis absorb the difference of data format.
18W3 CSV on the web working group.
5 Stars OPEN DATA
⭐️
make your stuff available on the Web (whatever
format) under an open
license.
⭐️⭐️
make it available as structured data
(e.g., Excel instead of image scan of a table).
⭐️⭐️⭐️
make it avaibalbe in a non-proprietary open
format (e.g., CSV as well as of Excel).
⭐️⭐️⭐️⭐️
use URIs to denote things, so that people
can point at your stuff.
⭐️⭐️⭐️⭐️⭐️
link your data to other data to provide
context.
19
Upper Atmopsheric Domain Specific
Data Visualization & Analysis Software
(SPEDAS)
 IDL is needed:
$2,500/license in Japan.
 Can’t use CLI on free VM.
 IDL: Popular soft. in Astro.
 However, SPEDAS conflicts with SolarSoft
in Astronomy because of name space.
 Confliction because of no name space.
 Not enough for Big Data Analysis to
use many core because of limitation
of number of licenses.
 For domain researcher mainly.
 Not good choice for neighbor field scientist,
Data Scientist, scientist in
Development Country, Citizens?
20
SPEDAS
ドメイン研究者であっても、直面する問題。
 name space問題
 solar softとコンフリクト
 Many core問題
 ライセンスに縛られて、many coreを用いた解析ができない。
21
The Open Definition
by opendefinition.org
 Open means anyone can freely access, use, modify,
and share for any purpose.
 Open data and content can be freely used, modified,
and shared by anyone for any purpose.
 Open Format:
 Specifically, data should be machine-readable, available
in bulk, and provided in an open format, at the very least,
can be processed with at least one free/libre/open-source
software tool.
22
Basic Concept
23
Deployment Diagram
24
Class Diagram
25
GeoToos
by
OSGeo
OpenCV
Inherit
Dst
Index
JavaFX-based iUgonet Data
Analysis Software
1984/10/1 Dst Index
26
The byte code runs
on multi platform.
SolarisWindows 10
Linux(SL7)
Mac OS X
(El Capitan)
Possibility of the JudaFX
(Data-intensive Sci. by using many cores)
Possibility of the JudasFX
(Distributed Computing by using BOINC)
It is essential for numerical models which has so many parameters.
追記
 ドメイン研究者以外にも、隣接分野の研究者、データサイエ
ンティスト、開発途上国の研究者、一般市民。
 JavaFX + JAXB + IUGONET Metadataにより、メタデータ
を解釈。(Rendering Hintなど)
 JavaFX + Jython + (JyNI + scipy)
今行っていること
 (海外からの引き合いもあるので)
 IDLで作成してしまった、小山作の電離圏電気伝導度モデル
のJudasFXへの移植を行っている。
 EISCATの可視化、解析動作確認。
 SuperDARNの可視化、解析動作確認。
31
Conclusion
 We summarized ideal scholarly information
infrastructure.
 We indicated the current achievement situation
in upper atmospheric research field.
 We suggest the importance of free data analysis
software.
 Building the 100% free Data Visualization and Analyze
software which is called “JudasFX”.
32
RDAのご案内
 2016/03/01-03: Research Data Allianceが、東京(一ツ橋
会館)で開かれます。
 2/29 にプレイベントがあります。
 九大の方のイベントと重なる可能性もありますが、お手すき
の方は、ぜひ参加することをお勧めします。
 キーワード: オープンサイエンス、データ中心科学、
CODATA、WDS、データ出版、データ引用、provenance
33

20151028koyama