SlideShare a Scribd company logo
1 of 29
機械学習における外れ値検出と
確率的潜在意味解析を用いたモデル構築
国際公共経済学会 第五回春季大会
2017年3月11日 於 金沢星稜大学
慶應義塾大学SFC研究所 小野塚 亮
1. 研究テーマ
2. 先行研究
① メインストリームの形成
② メインストリームの変化
③ 新奇なものとは
④ 外れ値とイノベーション
⑤ 玉石混交を見分ける
Contents
3. モデル
① ここまでの議論のモデル化
② 確率的潜在意味解析の学習
③ 新奇性を計測する
④ メインストリームと新奇性を定義
4. 仮説の提示
研究テーマ 先行研究 モデル 手法 結果 結論
3
普
及
度
時間t*(現在)
t*(現在)の主流
将来の主流
 問い「将来のメインストリームとなる知識は誰が発見するのか?」
 青い曲線: 現在(t*)は新奇(novel)であり周辺的な知識だが、
「将来のメインストリームを形成する力がある」という意味で革新的な知識
 対象:学術論文という形式で蓄積される知識
 社会的感染により形成され累積的優位により維持される
 社会的感染
 累積的優位
研究テーマ 先行研究 モデル 手法 結果 結論
4
皆が良いとっているものを良いとする選択が
ネットワークを媒介して爆発的に広がること
あるものが他よりも人気になると、
なおさらそれは人気を集めやすくなるということ
Watts, D. J. 2011. Everything is Obvious: *Once You Knew The Answer. Crown
Business. ( 青木創訳. 2012. 『偶然の科学』. 早川書房.)
研究テーマ 先行研究 モデル 手法 結果 結論
5
メインストリームを守る性質 新奇な革新の発生
VS.
“この種の変化が、このような小さな規模で常に起こっているからこそ、累積
的変化に相対するものとしての革命的変化について理解することが、まさに
必要なのである。” (Kuhn, 1996)
Buchanan, M. UBIQUITY. Weidenfeld & Nicolson. (水谷淳 訳 2009.『歴史は「べ
き乗則」で動く』. 早川書房.)
Kuhn, T. 1996. The Structure of Scientific Revolutions. Chicago: University of
Chicago Press. (中山茂 訳. 1971.『科学革命の構造』. みすず書房.)
メインストリームに相対する新奇なものの出現と変化を捉える
研究テーマ 先行研究 モデル 手法 結果 結論
6
井手剛・杉山将. 2015. 『異常検知と変化検知』. 講談社.
x*
x
 ある量 x の分布において、生じる確率が小さいもの
 平均値に近いほど x は起きやすくなる
 平均値から外れて裾に向かうほど x は起きづらくなる
 生じる確率がある閾値以上に小さい x を「外れ値」と呼ぶ
xmean
確
率
 「イノベーションは外れ値から生まれる」と論じられてきた
 しかし、定量的な証拠は得られていない
 新奇なもの、とりわけ外れ値は玉石混交である
 これらを見分けるロジックを持つキュレーターの役割
 学術論文の場合には、査読者、ジャーナル、研究室といった単位
 本研究ではジャーナルの役割に注目
研究テーマ 先行研究 モデル 手法 結果 結論
7
Välikangas, L. & Gibbert, M. 2015. Strategic Innovation: The Definitive Guide
to Outlier Strategies. Old Tappan: Pearson Education Inc.
Hawkins, D. M. (1980). Identification of Outliers. London: Chapman and Hall.
研究テーマ 先行研究 モデル 手法 結果 結論
8
 確率的潜在意味解析を用いる
 文章と単語に対して、あるトピック(ジャンル)に属する確率を与える
 トピック:ある文章に含まれる単語の組み合わせから創発する意味
奥村学, 佐藤一誠. 2015. 『トピックモデルによる統計的潜在意味解析』. コロナ社.
▼「スポーツ」「音楽」というトピックが明示されてなくても
単語の組み合わせ(共起関係)から理解できる。
研究テーマ 先行研究 モデル 手法 結果 結論
9
 論文を生成する<代表的な執筆者>を作ることを考える
 尤度(<代表的な執筆者>が学習データと同じ論文を生成する確率)が
最大になるようにパラメーターを最適化する
 パラメーターは、P(トピック)、P(単語|トピック)、P(文章|トピック)
論
文
論
文
論
文
学
習
論
文
論
文
論
文
論
文
論
文
生成
論文生成器
<代表的な執筆者>
パラメーター
Hofmann, T. 2001. Unsupervised Learning by Probabilistic Latent Semantic
Analysis. Machine Learning, 42, 177–196.
学
習
デ
ー
タ ①P(文章)で文章を選ぶ
②P(トピック|文章)でトピックを選ぶ
③P(単語|トピック)で単語を選ぶ
研究テーマ 先行研究 モデル 手法 結果 結論
10
 異常検知を用い<代表的な執筆者>がそれぞれの論文を生成する確率
を算出する
 以下は同様の技術を用いて<代表的な交差点の状況>を作ることで、交差点で
発生する異常な状況を常時監視するデモ映像
Varadarajan, J., & Odobez, J.-M. 2009. Topic Models for Scene Analysis and Abnormality
Detection. In the ICCV Visual Surveillance (ICCV-VS) workshop. Japan: Kyoto.
動画 : https://youtu.be/w0Hs5vzcgfU?list=LLBe5jFiqhze7oKUgExU97UQ
異常度
異常判定
研究テーマ 先行研究 モデル 手法 結果 結論
11
 新奇性(novelty)
 モデルが計測する各論文の異常度の偏差(異常度は、各論文の負の対数尤度)
 メインストリーム
 異常度の平均値±1標準偏差
 革新性(かつて周辺的だったものがメインストリーム化すること)
 偏差(新奇性)の変化度合い
異常度
頻
度
平均値
±1標準偏差
論文iの異常度
論文iの偏差 新奇性
メインストリーム
この変化が革新性
(周辺→メインストリーム)
研究テーマ 先行研究 モデル 手法 結果 結論
12
 ここまでの流れ
 問い「新奇な知識の革新性を発見するのは誰か?」
 キュレーターの役割に注目
 確率的潜在意味解析と異常検知を用い新奇性を指標化
 仮説の提示
 革新的な新奇性の発見に長けたキュレーターは、
一般的な評価指標とは異なる影響力を持つ
① 使用したデータ
② 2つのモデルを作成
③ 比較の方法
Contents
 分析対象:学術論文という形式で蓄積される知識
 “information systems”を検索ワードにScopusから取得した、
2008年から2011年に出版された学術論文14,311本を用いた*
研究テーマ 先行研究 モデル 手法 結果 結論
14*Data provided by Scopus.com
2008~09年
6,703本
2010~11年
7,608本
1. タイトル
2. アブストラクト
3. キーワード
4. 被引用回数(~2016年)
5. 掲載ジャーナル
6. ジャーナル指標 SNIP
Source Normalized
Impact per Paper
20,432語
×
6,703文章
語彙数×文章数 行列
34,618語
×
7,608文章
各論文から素性を抽出
後
半
論
文
群
前
半
論
文
群
研究テーマ 先行研究 モデル 手法 結果 結論
15
前半モデル
20,432語
×
6,703文章
34,618語
×
7,608文章
後半モデル
34,618語
×
7,608文章
未知の予想
既知の解釈
2010~11年
2008~09年
後
半
論
文
群
前
半
論
文
群
後
半
論
文
群
 前半モデルと後半モデルを作成
 両方に後半論文群を解釈させ、未知の予想と既知の解釈を作る
研究テーマ 先行研究 モデル 手法 結果 結論
前半モデル
後半モデル
未知の予想
実際の解釈
後
半
論
文
群
トピック
分布
トピック
分布
Ⅰ各モデルの主要な
トピックを比較する
Ⅱ予想と実際の異常
度を比較する
10回以上出現
したもののみ
ジャーナル
ごとに集計
Ⅲジャーナルごと
に比較する
研究テーマ 先行研究 モデル 手法 結果 結論
17
Onozuka, R., Yamazaki, T., & Kokuryo, J. (2016). Redefiners of Discipline Borders: A Bayesian Detection Method for Conceptual Changes in Scientific
Knowledge. In Proceedings of the International Conference on Information Systems - Digital Innovation at the Crossroads, ICIS 2016, Dublin, Ireland,
December 11-14, 2016.
 未知の論文の新奇性をモデルに評価させる
新奇性は
16.6
 概念
 新奇性
 ジャーナルの評価
 メインストリーム
 人気
 革新性
18
 指標
 異常度の偏差
 SNIP
 異常度の平均値±1標準偏差
 被引用回数
 異常度の偏差の変化(差)
研究テーマ 先行研究 モデル 手法 結果 結論
かつては新奇だったが
メインストリームを形成
新奇性が高かったものが後に低くなった
場合、負の値をとる
① 主要トピックの変化
② 異常度の分布の比較
③ 異常度と被引用回数
④ 異常度の変化
⑤ ジャーナルごとに集計
⑥ SNIPとの関係
⑦ 被引用回数の多いジャーナル
Contents
研究テーマ 先行研究 モデル 手法 結果 結論
20
前半モデル 後半モデル
研究テーマ 先行研究 モデル 手法 結果 結論
2121
順位の変化だけでなく、新しいキーワードが付け加わる形で発展している
研究テーマ 先行研究 モデル 手法 結果 結論
平均値 15.49
標準偏差 0.51
平均値 15.65
標準偏差 0.47
新奇性の指標として異常度を用いている
2つの平均値は5%水準で有意な差があった
外れ値76本 外れ値70本
研究テーマ 先行研究 モデル 手法 結果 結論
23
異常度(0.1刻み)
被
引
用
回
数
(
区
間
ご
と
の
平
均
)
r = -0.627
p < 0.01
異常度の平均値±1SDの範囲内で最も被引用回数が高くなる
この範囲をメインストリームと考える
研究テーマ 先行研究 モデル 手法 結果 結論
24
前半モデル(予想)
平均値
後
半
モ
デ
ル
(
実
際
)
平
均
値
Ⅰ
(3,132本)
Ⅱ
(543本)
Ⅲ
(3,415本)
Ⅳ
(518本)
第Ⅳ象限(右下)
という異常度を持つ論文群
予想では周辺的な論文
実際はメインストリーム
という意味で革新的
では平均値より大きい
では平均値より小さい
高 → 低
高 → 高低 → 高
低 → 低
研究テーマ 先行研究 モデル 手法 結果 結論
25
r = -0.318
p < 0.01
異常度の偏差の変化(ジャーナル毎)
被
引
用
回
数
(
対
数
)
(
ジ
ャ
ー
ナ
ル
毎
)
第Ⅳ象限に属する変化をしている論文を
多く収録しているジャーナルほど、被引用回数が高い
研究テーマ 先行研究 モデル 手法 結果 結論
26
r = -0.107
p > 0.10 (n.s.)
SNIP
異
常
度
の
偏
差
の
変
化
(
ジ
ャ
ー
ナ
ル
毎
)
異常度の偏差の変化は、ジャーナルの評価指標であるSNIP
(インパクトファクターに分野間の補正を加えたもの)とは無関係
新奇な知識の革新性を発見する能力はSNIPでは測られていない
研究テーマ 先行研究 モデル 手法 結果 結論
メ
イ
ン
ス
ト
リ
ー
ム
を
堅
持
す
る
ジ
ャ
ー
ナ
ル
と
、
次
の
メ
イ
ン
ス
ト
リ
ー
ム
を
狙
う
ジ
ャ
ー
ナ
ル
に
分
か
れ
る
偏差の変化
1. 革新的な新奇性の発見に長けたキュレーターの存在
 ジャーナルごとの異常度の偏差の変化と被引用回数に
有意な相関があったことから
2. 彼らは一般的な評価指標とは異なる影響力を持つ
 革新性の指標であるジャーナルごとの異常度の偏差の変化と、
一般的な評価指標であるSNIPとの相関がなかったことから
 SNIPは短期、革新性は長期の影響力
研究テーマ 先行研究 モデル 手法 結果 結論
28
「革新的な新奇性の発見に長けたキュレーターは
一般的な評価指標とは異なる影響力を持つ」仮説に対して
 被引用回数の多いジャーナルのうちで、革新性の高いジャーナ
ルと低いジャーナルの違いを明らかにする
 特徴的なジャーナルについてのケーススタディ
 革新的な新奇性を発見する際に用いるロジックを明らかにする
 ジャーナル以外のキュレーターについて調査
 キュレーターとイノベーションについての理論的検討
 他分野への応用可能性の検討
研究テーマ 先行研究 モデル 手法 結果 考察
29
以上になります。
ご清聴ありがとうございました。
上記にかんするご意見・ご助言お待ちしております。

More Related Content

Viewers also liked

PLANT RESIDENT MICROORGANISM IN DISEASE MANAGEMNT
PLANT RESIDENT MICROORGANISM IN DISEASE MANAGEMNTPLANT RESIDENT MICROORGANISM IN DISEASE MANAGEMNT
PLANT RESIDENT MICROORGANISM IN DISEASE MANAGEMNTajjit kumar
 
Interlandagen 2017 tobbe
Interlandagen 2017   tobbeInterlandagen 2017   tobbe
Interlandagen 2017 tobbeTorbjorn Eklov
 
13 Dr Ahmed Esawy imaging oral board of spine imaging part III
13 Dr Ahmed Esawy imaging oral board of spine imaging part III13 Dr Ahmed Esawy imaging oral board of spine imaging part III
13 Dr Ahmed Esawy imaging oral board of spine imaging part IIIAHMED ESAWY
 
A very easy explanation to understanding machine learning (Supervised & Unsup...
A very easy explanation to understanding machine learning (Supervised & Unsup...A very easy explanation to understanding machine learning (Supervised & Unsup...
A very easy explanation to understanding machine learning (Supervised & Unsup...Ryo Onozuka
 
Ứng dụng công nghệ mạ chrome thiết kế quảng cáo
Ứng dụng công nghệ mạ chrome thiết kế quảng cáoỨng dụng công nghệ mạ chrome thiết kế quảng cáo
Ứng dụng công nghệ mạ chrome thiết kế quảng cáonghiemnvan
 
«Вредоносные браузерные расширения и борьба с ними», Александра Сватикова (Од...
«Вредоносные браузерные расширения и борьба с ними», Александра Сватикова (Од...«Вредоносные браузерные расширения и борьба с ними», Александра Сватикова (Од...
«Вредоносные браузерные расширения и борьба с ними», Александра Сватикова (Од...OWASP Russia
 
«Android Activity Hijacking», Евгений Блашко, Юрий Шабалин (АО «Сбербанк-Тех...
«Android Activity Hijacking»,  Евгений Блашко, Юрий Шабалин (АО «Сбербанк-Тех...«Android Activity Hijacking»,  Евгений Блашко, Юрий Шабалин (АО «Сбербанк-Тех...
«Android Activity Hijacking», Евгений Блашко, Юрий Шабалин (АО «Сбербанк-Тех...OWASP Russia
 
Caricatures
CaricaturesCaricatures
CaricaturesMaya
 
3Com 3C389
3Com 3C3893Com 3C389
3Com 3C389savomir
 
3Com 655001001
3Com 6550010013Com 655001001
3Com 655001001savomir
 

Viewers also liked (14)

Presentacion electiva
Presentacion electivaPresentacion electiva
Presentacion electiva
 
PLANT RESIDENT MICROORGANISM IN DISEASE MANAGEMNT
PLANT RESIDENT MICROORGANISM IN DISEASE MANAGEMNTPLANT RESIDENT MICROORGANISM IN DISEASE MANAGEMNT
PLANT RESIDENT MICROORGANISM IN DISEASE MANAGEMNT
 
Interlandagen 2017 tobbe
Interlandagen 2017   tobbeInterlandagen 2017   tobbe
Interlandagen 2017 tobbe
 
13 Dr Ahmed Esawy imaging oral board of spine imaging part III
13 Dr Ahmed Esawy imaging oral board of spine imaging part III13 Dr Ahmed Esawy imaging oral board of spine imaging part III
13 Dr Ahmed Esawy imaging oral board of spine imaging part III
 
What’s new in VS 2017?
What’s new in VS 2017?What’s new in VS 2017?
What’s new in VS 2017?
 
A very easy explanation to understanding machine learning (Supervised & Unsup...
A very easy explanation to understanding machine learning (Supervised & Unsup...A very easy explanation to understanding machine learning (Supervised & Unsup...
A very easy explanation to understanding machine learning (Supervised & Unsup...
 
Ứng dụng công nghệ mạ chrome thiết kế quảng cáo
Ứng dụng công nghệ mạ chrome thiết kế quảng cáoỨng dụng công nghệ mạ chrome thiết kế quảng cáo
Ứng dụng công nghệ mạ chrome thiết kế quảng cáo
 
«Вредоносные браузерные расширения и борьба с ними», Александра Сватикова (Од...
«Вредоносные браузерные расширения и борьба с ними», Александра Сватикова (Од...«Вредоносные браузерные расширения и борьба с ними», Александра Сватикова (Од...
«Вредоносные браузерные расширения и борьба с ними», Александра Сватикова (Од...
 
«Android Activity Hijacking», Евгений Блашко, Юрий Шабалин (АО «Сбербанк-Тех...
«Android Activity Hijacking»,  Евгений Блашко, Юрий Шабалин (АО «Сбербанк-Тех...«Android Activity Hijacking»,  Евгений Блашко, Юрий Шабалин (АО «Сбербанк-Тех...
«Android Activity Hijacking», Евгений Блашко, Юрий Шабалин (АО «Сбербанк-Тех...
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Caricatures
CaricaturesCaricatures
Caricatures
 
3Com 3C389
3Com 3C3893Com 3C389
3Com 3C389
 
3Com 655001001
3Com 6550010013Com 655001001
3Com 655001001
 
Case studies presentation
Case studies presentationCase studies presentation
Case studies presentation
 

Similar to 新奇な知識が持つイノベーションの潜在性の計測と予測に向けて

SEMを用いた縦断データの解析 潜在曲線モデル
SEMを用いた縦断データの解析 潜在曲線モデルSEMを用いた縦断データの解析 潜在曲線モデル
SEMを用いた縦断データの解析 潜在曲線モデルMasaru Tokuoka
 
まずはオープンデータから!──高めよう信用性,広めよう二次分析──【※Docswellにも同じものを上げています】
まずはオープンデータから!──高めよう信用性,広めよう二次分析──【※Docswellにも同じものを上げています】まずはオープンデータから!──高めよう信用性,広めよう二次分析──【※Docswellにも同じものを上げています】
まずはオープンデータから!──高めよう信用性,広めよう二次分析──【※Docswellにも同じものを上げています】Hiroyuki Muto
 
【完成版】研究会議発表資料
【完成版】研究会議発表資料【完成版】研究会議発表資料
【完成版】研究会議発表資料SW1993
 
[DL Hacks]Deep Learning with Differential Privacy Martin Abadi et al
[DL Hacks]Deep Learning with  Differential Privacy Martin Abadi et al[DL Hacks]Deep Learning with  Differential Privacy Martin Abadi et al
[DL Hacks]Deep Learning with Differential Privacy Martin Abadi et alDeep Learning JP
 
リスク可視化の基本的方法
リスク可視化の基本的方法リスク可視化の基本的方法
リスク可視化の基本的方法Takayuki Itoh
 
Papaer Introduction "Personalized Entity Recommendation: A Heterogeneous Inf...
Papaer Introduction "Personalized Entity Recommendation: A Heterogeneous Inf...Papaer Introduction "Personalized Entity Recommendation: A Heterogeneous Inf...
Papaer Introduction "Personalized Entity Recommendation: A Heterogeneous Inf...Kotaro Yamazaki
 
20150703 学術情報ソリューションセミナー(東京会場)
20150703 学術情報ソリューションセミナー(東京会場)20150703 学術情報ソリューションセミナー(東京会場)
20150703 学術情報ソリューションセミナー(東京会場)Yasuyuki Minamiyama
 

Similar to 新奇な知識が持つイノベーションの潜在性の計測と予測に向けて (8)

SEMを用いた縦断データの解析 潜在曲線モデル
SEMを用いた縦断データの解析 潜在曲線モデルSEMを用いた縦断データの解析 潜在曲線モデル
SEMを用いた縦断データの解析 潜在曲線モデル
 
まずはオープンデータから!──高めよう信用性,広めよう二次分析──【※Docswellにも同じものを上げています】
まずはオープンデータから!──高めよう信用性,広めよう二次分析──【※Docswellにも同じものを上げています】まずはオープンデータから!──高めよう信用性,広めよう二次分析──【※Docswellにも同じものを上げています】
まずはオープンデータから!──高めよう信用性,広めよう二次分析──【※Docswellにも同じものを上げています】
 
【完成版】研究会議発表資料
【完成版】研究会議発表資料【完成版】研究会議発表資料
【完成版】研究会議発表資料
 
[DL Hacks]Deep Learning with Differential Privacy Martin Abadi et al
[DL Hacks]Deep Learning with  Differential Privacy Martin Abadi et al[DL Hacks]Deep Learning with  Differential Privacy Martin Abadi et al
[DL Hacks]Deep Learning with Differential Privacy Martin Abadi et al
 
リスク可視化の基本的方法
リスク可視化の基本的方法リスク可視化の基本的方法
リスク可視化の基本的方法
 
Papaer Introduction "Personalized Entity Recommendation: A Heterogeneous Inf...
Papaer Introduction "Personalized Entity Recommendation: A Heterogeneous Inf...Papaer Introduction "Personalized Entity Recommendation: A Heterogeneous Inf...
Papaer Introduction "Personalized Entity Recommendation: A Heterogeneous Inf...
 
研究支援と評価
研究支援と評価研究支援と評価
研究支援と評価
 
20150703 学術情報ソリューションセミナー(東京会場)
20150703 学術情報ソリューションセミナー(東京会場)20150703 学術情報ソリューションセミナー(東京会場)
20150703 学術情報ソリューションセミナー(東京会場)
 

Recently uploaded

202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)
202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)
202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)KayaSuetake1
 
ストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdf
ストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdfストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdf
ストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdfmasakisaito12
 
UP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチ
UP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチUP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチ
UP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチユニパー株式会社
 
ストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdf
ストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdfストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdf
ストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdfmasakisaito12
 
株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店
株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店
株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店ssuserfb441f
 
20240427 zaim academy counseling lesson .pdf
20240427 zaim academy counseling lesson .pdf20240427 zaim academy counseling lesson .pdf
20240427 zaim academy counseling lesson .pdfssuser80a51f
 
Service-introduction-materials-misorae-leadership
Service-introduction-materials-misorae-leadershipService-introduction-materials-misorae-leadership
Service-introduction-materials-misorae-leadershipYasuyoshi Minehisa
 
シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料
シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料
シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料シンフォニティ 株式会社
 

Recently uploaded (8)

202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)
202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)
202405_VISIONARYJAPAN_engineerteam_entrancebook(ver2.1)
 
ストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdf
ストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdfストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdf
ストックマーク株式会社がお客様へご提供しているAnews概要資料のご共有.pdf
 
UP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチ
UP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチUP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチ
UP103シリーズ パワーコメット ユニパー スライドレールタイプ 瓦揚げ機 ウインチ
 
ストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdf
ストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdfストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdf
ストックマーク株式会社がご提供しているAnews(エーニュース)概要紹介.pdf
 
株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店
株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店
株式会社MAVEL会社概要_アフィリエイト広告_運用型広告_LTVを予測しLOIを最適化する広告代理店
 
20240427 zaim academy counseling lesson .pdf
20240427 zaim academy counseling lesson .pdf20240427 zaim academy counseling lesson .pdf
20240427 zaim academy counseling lesson .pdf
 
Service-introduction-materials-misorae-leadership
Service-introduction-materials-misorae-leadershipService-introduction-materials-misorae-leadership
Service-introduction-materials-misorae-leadership
 
シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料
シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料
シンフォニティ株式会社(SYMPHONITY , Inc.) 会社説明・人材採用資料
 

新奇な知識が持つイノベーションの潜在性の計測と予測に向けて

  • 2. 1. 研究テーマ 2. 先行研究 ① メインストリームの形成 ② メインストリームの変化 ③ 新奇なものとは ④ 外れ値とイノベーション ⑤ 玉石混交を見分ける Contents 3. モデル ① ここまでの議論のモデル化 ② 確率的潜在意味解析の学習 ③ 新奇性を計測する ④ メインストリームと新奇性を定義 4. 仮説の提示
  • 3. 研究テーマ 先行研究 モデル 手法 結果 結論 3 普 及 度 時間t*(現在) t*(現在)の主流 将来の主流  問い「将来のメインストリームとなる知識は誰が発見するのか?」  青い曲線: 現在(t*)は新奇(novel)であり周辺的な知識だが、 「将来のメインストリームを形成する力がある」という意味で革新的な知識  対象:学術論文という形式で蓄積される知識
  • 4.  社会的感染により形成され累積的優位により維持される  社会的感染  累積的優位 研究テーマ 先行研究 モデル 手法 結果 結論 4 皆が良いとっているものを良いとする選択が ネットワークを媒介して爆発的に広がること あるものが他よりも人気になると、 なおさらそれは人気を集めやすくなるということ Watts, D. J. 2011. Everything is Obvious: *Once You Knew The Answer. Crown Business. ( 青木創訳. 2012. 『偶然の科学』. 早川書房.)
  • 5. 研究テーマ 先行研究 モデル 手法 結果 結論 5 メインストリームを守る性質 新奇な革新の発生 VS. “この種の変化が、このような小さな規模で常に起こっているからこそ、累積 的変化に相対するものとしての革命的変化について理解することが、まさに 必要なのである。” (Kuhn, 1996) Buchanan, M. UBIQUITY. Weidenfeld & Nicolson. (水谷淳 訳 2009.『歴史は「べ き乗則」で動く』. 早川書房.) Kuhn, T. 1996. The Structure of Scientific Revolutions. Chicago: University of Chicago Press. (中山茂 訳. 1971.『科学革命の構造』. みすず書房.) メインストリームに相対する新奇なものの出現と変化を捉える
  • 6. 研究テーマ 先行研究 モデル 手法 結果 結論 6 井手剛・杉山将. 2015. 『異常検知と変化検知』. 講談社. x* x  ある量 x の分布において、生じる確率が小さいもの  平均値に近いほど x は起きやすくなる  平均値から外れて裾に向かうほど x は起きづらくなる  生じる確率がある閾値以上に小さい x を「外れ値」と呼ぶ xmean 確 率
  • 7.  「イノベーションは外れ値から生まれる」と論じられてきた  しかし、定量的な証拠は得られていない  新奇なもの、とりわけ外れ値は玉石混交である  これらを見分けるロジックを持つキュレーターの役割  学術論文の場合には、査読者、ジャーナル、研究室といった単位  本研究ではジャーナルの役割に注目 研究テーマ 先行研究 モデル 手法 結果 結論 7 Välikangas, L. & Gibbert, M. 2015. Strategic Innovation: The Definitive Guide to Outlier Strategies. Old Tappan: Pearson Education Inc. Hawkins, D. M. (1980). Identification of Outliers. London: Chapman and Hall.
  • 8. 研究テーマ 先行研究 モデル 手法 結果 結論 8  確率的潜在意味解析を用いる  文章と単語に対して、あるトピック(ジャンル)に属する確率を与える  トピック:ある文章に含まれる単語の組み合わせから創発する意味 奥村学, 佐藤一誠. 2015. 『トピックモデルによる統計的潜在意味解析』. コロナ社. ▼「スポーツ」「音楽」というトピックが明示されてなくても 単語の組み合わせ(共起関係)から理解できる。
  • 9. 研究テーマ 先行研究 モデル 手法 結果 結論 9  論文を生成する<代表的な執筆者>を作ることを考える  尤度(<代表的な執筆者>が学習データと同じ論文を生成する確率)が 最大になるようにパラメーターを最適化する  パラメーターは、P(トピック)、P(単語|トピック)、P(文章|トピック) 論 文 論 文 論 文 学 習 論 文 論 文 論 文 論 文 論 文 生成 論文生成器 <代表的な執筆者> パラメーター Hofmann, T. 2001. Unsupervised Learning by Probabilistic Latent Semantic Analysis. Machine Learning, 42, 177–196. 学 習 デ ー タ ①P(文章)で文章を選ぶ ②P(トピック|文章)でトピックを選ぶ ③P(単語|トピック)で単語を選ぶ
  • 10. 研究テーマ 先行研究 モデル 手法 結果 結論 10  異常検知を用い<代表的な執筆者>がそれぞれの論文を生成する確率 を算出する  以下は同様の技術を用いて<代表的な交差点の状況>を作ることで、交差点で 発生する異常な状況を常時監視するデモ映像 Varadarajan, J., & Odobez, J.-M. 2009. Topic Models for Scene Analysis and Abnormality Detection. In the ICCV Visual Surveillance (ICCV-VS) workshop. Japan: Kyoto. 動画 : https://youtu.be/w0Hs5vzcgfU?list=LLBe5jFiqhze7oKUgExU97UQ 異常度 異常判定
  • 11. 研究テーマ 先行研究 モデル 手法 結果 結論 11  新奇性(novelty)  モデルが計測する各論文の異常度の偏差(異常度は、各論文の負の対数尤度)  メインストリーム  異常度の平均値±1標準偏差  革新性(かつて周辺的だったものがメインストリーム化すること)  偏差(新奇性)の変化度合い 異常度 頻 度 平均値 ±1標準偏差 論文iの異常度 論文iの偏差 新奇性 メインストリーム この変化が革新性 (周辺→メインストリーム)
  • 12. 研究テーマ 先行研究 モデル 手法 結果 結論 12  ここまでの流れ  問い「新奇な知識の革新性を発見するのは誰か?」  キュレーターの役割に注目  確率的潜在意味解析と異常検知を用い新奇性を指標化  仮説の提示  革新的な新奇性の発見に長けたキュレーターは、 一般的な評価指標とは異なる影響力を持つ
  • 14.  分析対象:学術論文という形式で蓄積される知識  “information systems”を検索ワードにScopusから取得した、 2008年から2011年に出版された学術論文14,311本を用いた* 研究テーマ 先行研究 モデル 手法 結果 結論 14*Data provided by Scopus.com 2008~09年 6,703本 2010~11年 7,608本 1. タイトル 2. アブストラクト 3. キーワード 4. 被引用回数(~2016年) 5. 掲載ジャーナル 6. ジャーナル指標 SNIP Source Normalized Impact per Paper 20,432語 × 6,703文章 語彙数×文章数 行列 34,618語 × 7,608文章 各論文から素性を抽出 後 半 論 文 群 前 半 論 文 群
  • 15. 研究テーマ 先行研究 モデル 手法 結果 結論 15 前半モデル 20,432語 × 6,703文章 34,618語 × 7,608文章 後半モデル 34,618語 × 7,608文章 未知の予想 既知の解釈 2010~11年 2008~09年 後 半 論 文 群 前 半 論 文 群 後 半 論 文 群  前半モデルと後半モデルを作成  両方に後半論文群を解釈させ、未知の予想と既知の解釈を作る
  • 16. 研究テーマ 先行研究 モデル 手法 結果 結論 前半モデル 後半モデル 未知の予想 実際の解釈 後 半 論 文 群 トピック 分布 トピック 分布 Ⅰ各モデルの主要な トピックを比較する Ⅱ予想と実際の異常 度を比較する 10回以上出現 したもののみ ジャーナル ごとに集計 Ⅲジャーナルごと に比較する
  • 17. 研究テーマ 先行研究 モデル 手法 結果 結論 17 Onozuka, R., Yamazaki, T., & Kokuryo, J. (2016). Redefiners of Discipline Borders: A Bayesian Detection Method for Conceptual Changes in Scientific Knowledge. In Proceedings of the International Conference on Information Systems - Digital Innovation at the Crossroads, ICIS 2016, Dublin, Ireland, December 11-14, 2016.  未知の論文の新奇性をモデルに評価させる 新奇性は 16.6
  • 18.  概念  新奇性  ジャーナルの評価  メインストリーム  人気  革新性 18  指標  異常度の偏差  SNIP  異常度の平均値±1標準偏差  被引用回数  異常度の偏差の変化(差) 研究テーマ 先行研究 モデル 手法 結果 結論 かつては新奇だったが メインストリームを形成 新奇性が高かったものが後に低くなった 場合、負の値をとる
  • 19. ① 主要トピックの変化 ② 異常度の分布の比較 ③ 異常度と被引用回数 ④ 異常度の変化 ⑤ ジャーナルごとに集計 ⑥ SNIPとの関係 ⑦ 被引用回数の多いジャーナル Contents
  • 20. 研究テーマ 先行研究 モデル 手法 結果 結論 20 前半モデル 後半モデル
  • 21. 研究テーマ 先行研究 モデル 手法 結果 結論 2121 順位の変化だけでなく、新しいキーワードが付け加わる形で発展している
  • 22. 研究テーマ 先行研究 モデル 手法 結果 結論 平均値 15.49 標準偏差 0.51 平均値 15.65 標準偏差 0.47 新奇性の指標として異常度を用いている 2つの平均値は5%水準で有意な差があった 外れ値76本 外れ値70本
  • 23. 研究テーマ 先行研究 モデル 手法 結果 結論 23 異常度(0.1刻み) 被 引 用 回 数 ( 区 間 ご と の 平 均 ) r = -0.627 p < 0.01 異常度の平均値±1SDの範囲内で最も被引用回数が高くなる この範囲をメインストリームと考える
  • 24. 研究テーマ 先行研究 モデル 手法 結果 結論 24 前半モデル(予想) 平均値 後 半 モ デ ル ( 実 際 ) 平 均 値 Ⅰ (3,132本) Ⅱ (543本) Ⅲ (3,415本) Ⅳ (518本) 第Ⅳ象限(右下) という異常度を持つ論文群 予想では周辺的な論文 実際はメインストリーム という意味で革新的 では平均値より大きい では平均値より小さい 高 → 低 高 → 高低 → 高 低 → 低
  • 25. 研究テーマ 先行研究 モデル 手法 結果 結論 25 r = -0.318 p < 0.01 異常度の偏差の変化(ジャーナル毎) 被 引 用 回 数 ( 対 数 ) ( ジ ャ ー ナ ル 毎 ) 第Ⅳ象限に属する変化をしている論文を 多く収録しているジャーナルほど、被引用回数が高い
  • 26. 研究テーマ 先行研究 モデル 手法 結果 結論 26 r = -0.107 p > 0.10 (n.s.) SNIP 異 常 度 の 偏 差 の 変 化 ( ジ ャ ー ナ ル 毎 ) 異常度の偏差の変化は、ジャーナルの評価指標であるSNIP (インパクトファクターに分野間の補正を加えたもの)とは無関係 新奇な知識の革新性を発見する能力はSNIPでは測られていない
  • 27. 研究テーマ 先行研究 モデル 手法 結果 結論 メ イ ン ス ト リ ー ム を 堅 持 す る ジ ャ ー ナ ル と 、 次 の メ イ ン ス ト リ ー ム を 狙 う ジ ャ ー ナ ル に 分 か れ る 偏差の変化
  • 28. 1. 革新的な新奇性の発見に長けたキュレーターの存在  ジャーナルごとの異常度の偏差の変化と被引用回数に 有意な相関があったことから 2. 彼らは一般的な評価指標とは異なる影響力を持つ  革新性の指標であるジャーナルごとの異常度の偏差の変化と、 一般的な評価指標であるSNIPとの相関がなかったことから  SNIPは短期、革新性は長期の影響力 研究テーマ 先行研究 モデル 手法 結果 結論 28 「革新的な新奇性の発見に長けたキュレーターは 一般的な評価指標とは異なる影響力を持つ」仮説に対して
  • 29.  被引用回数の多いジャーナルのうちで、革新性の高いジャーナ ルと低いジャーナルの違いを明らかにする  特徴的なジャーナルについてのケーススタディ  革新的な新奇性を発見する際に用いるロジックを明らかにする  ジャーナル以外のキュレーターについて調査  キュレーターとイノベーションについての理論的検討  他分野への応用可能性の検討 研究テーマ 先行研究 モデル 手法 結果 考察 29 以上になります。 ご清聴ありがとうございました。 上記にかんするご意見・ご助言お待ちしております。

Editor's Notes

  1. まず、導入といたしまして、研究テーマ、先行研究、モデルの概要についてお話した上で、本研究の仮説を提示いたします。
  2. 本研究のテーマは「新奇な知識の革新性」を発見することです。 そのために「将来のメインストリームとなる知識は誰が発見するのか?」という問いを立てました。 メインストリームというものは時間が経つとともに移り変わっていくものだと思います。 このオレンジ色の曲線は現在のメインストリームとなっている知識の普及度が時間とともにどう移り変わるかを模式化したものです。 ここで、青色で表される、別の知識についてご注目ください。 これは、現在の時点では新奇で周辺的な知識ですが、しかし後にはメインストリームとなる知識を表しています。 本研究では、このような「周辺からメインストリームへ」という動きをする知識を「革新性の高い知識」と考えます。 そして、このような革新性の高い知識をどのように発見できるだろうか、という問題を、学術論文という形式で蓄積される知識を対象に研究しました。
  3. 先ほど、「周辺からメインストリームへ」という動きを革新性と考えると申し上げましたが、 この動きを理解するためにまず、メインストリームがどのように形成され、維持されるのかをみていきます。 メインストリームは社会的感染により形成され、累積的優位によって維持されます。 これは、メインストリームは、(1)皆が良いと言っている知識を良いものだとして選択する行動がネットワークを通じて爆発的に広がることで形成され、 (2)ある知識が他よりも人気になると、「人気である」というだけで、より人気を集めやすくなるという声質によって維持される、ということです。
  4. その要因を、マーク・ブキャナンは好奇心による新奇な革新の発生であると述べています。 この新奇な革新はディープラーニングのような大きな革新である必要はなく、25人程度のグールプ内で起きる驚きといった小さな規模で『常に起きつづける』からこそ、メインストリームの累積的優位に対抗できると述べています。 そこで本研究では、まず、メインストリームに相対するものとして、「新奇なもの」の出現と変化に焦点を当てました。
  5. ここで、「新奇なもの」とは何か、ということですが、ここで「夫に目」の方の新規を用いていないのは、「目新しく珍しいものであり、よいものも悪いものも含まれる」という意味合いを出したいためです。 本研究では、「新奇なもの」を外れ値検知、異常検知の定義を借りて、「ある分布で起こる確率が低いもの」とし、確率の対数にマイナス1を掛けたものとして定義します。 また、「外れ値」はここで一定の閾値以上に新奇なもの、という意味で用います。
  6. さて、本研究では、これら「新奇なもの」、「外れ値」と革新性の関係を考えたいわけですが、ここでイノベーション論の研究成果を参照したいと思います。 ヴァリカンガスとギルバートによる著書の中に、外れ値とイノベーション論の学説史がまとめてありまして、そこを参照する限り、 「イノベーションは外れ値から生まれる」という仮説は古くから論じられているものの、定量的な証拠はみつかっていないということでした。 また、先ほども申しましたとおり、新奇なものは玉石混交であることから、それを見分けることのできるキュレーターの役割が強調されていました。 もし、玉石混交を見分けることに長けたキュレーターというものが存在し、そして、彼らのロジックを明らかにできれば、というのが本研究の目的です。 そこで次のスライドからは、ここまでの話を定量的に明らかにするためのモデル化の説明を行います。
  7. 本研究で用いるモデルは、機械学習の一分野である生成モデルの1つである確率的潜在意味解析です。これはトピックモデルという名でも知られています。 確率的潜在意味解析では、文章と単語の組み合わせのパターンからモデルを作っていくのですが、そこにトピックと言われる潜在変数を噛ませます。 トピックとは、ある文章に含まれる単語の組み合わせから創発する意味のことです。 例えば下の2つのワードクラウドを見ていただくと、それぞれただの単語の寄せ集めですが、「スポーツ」と「音楽」というトピックのものであるということが分かると思います。
  8. ある文章と単語の集合から妥当なトピックを作っていくわけですが、その学習は「論文生成器」もしくは<代表的な執筆者>をつくると考えていただくとイメージしやすいと思います。 この<代表的な執筆者>は新しい論文を生成するときに、1.文章確率で文章を選び、次に、文章の単語数回、2.文章の下でのトピック確率でトピックを選び、3.トピックの下での単語確率で単語を選ぶ、というアルゴリズムで動きます。 このようにして生成される論文が、学習データとして与えた論文と同じものになる確率を尤度と呼びますが、これを最大化するように、EMアルゴリズムを用いてパラメーターを最適化します。 通常、このようにして作られた<代表的な執筆者>は、その頭のなかにあるトピック分布を調べたり、文章や単語のトピック確率を用いてクラスタリングすることに用いられますが、 本研究では、このような用途に加えて、<代表的な執筆者>を用いて新奇性を計測することを行います。
  9. もし、とても新奇な外れ値のような論文があったときに、それを<代表的な執筆者>が生成する確率はとても低いと考えられます。 このように、あるデータを<代表的な執筆者>が生成する確率の低さを、異常度と呼び、負の対数尤度と定義されます。 このモデルをつくるにあたり、本研究が参考にした論文があり、それは「交差点での異常発生をリアルタイムで検出する」というものです。 左側が実際の交差点の映像で、右側が異常度の推移となっています。この異常度が赤い領域に入ったときには交差点で異常事態が発生しています。 動画を再生しますので、ご覧ください。 このモデルでは、30分間の交差点の映像から<典型的、代表的な交差点の状態>を作っています。 そこから生成される確率がとても低いものが異常な状態となるのですが、ちょうどこのように、異常度が閾値以上に高まったときに、停止位置違反が発生しています。 本研究は、これを同じ仕組みで新奇性を計測しています。
  10. では、この新奇性の指標である異常度を用いて、これまでに出てきた概念を指標化したいと思います。 まず、新奇性についでは、ある論文が典型的な状態からどちら方向にどのくらい離れているかを表したいため、異常度の偏差を用います。 次に、メインストリームは、異常度の平均値プラスマイナス1標準偏差を用います。これは先ほどの例でいえば、「通常の交差点の状態」に相当します。 そして、革新性については、「周辺からメインストリームへ」という動き、新奇性が高かったものが後に低くなるという動きを表現したいので。 異常度の偏差の差を指標とします。
  11. さて、ここまで、新奇な知識の革新性を発見するのは誰か、という問に対してモデルを構築してきました。 その上で、本研究の仮説を、「革新的な新奇性の発見に長けたキュレーターは、一般的な評価指標とは異なる影響力を持つ」とします。
  12. では、この仮説を示すための方法についてお話いたします。
  13. まず、使用したデータは、Scopusから取得した、information systemsにかんする論文です。 ここでこの領域を選んだのは、私にとってもっとも定性的に評価できそうな領域だからです。 そして、論文をこのように前半と後半に分け、そこから、この6つの素性を抽出しました。 なお、SNIPは、インパクトファクターをベースに分野間補正を加えた、Scopusの提供するジャーナルの評価指標です。 そして、1から3をbag-of-wordsにして、このような行列を作りました。
  14. ここで、2008〜2009年の論文群から作成したモデルを前半モデル、2010年〜2011年の論文群から作成したモデルを後半モデルとしました。 この2つのモデルはそれぞれ異なった期間の<代表的な執筆者>です。 そこに、前半モデルの<代表的な執筆者>にとっては未来の論文群である2010年〜2011年の後半論文群の新奇性を予想させます。 そして、後半モデルの<代表的な執筆者>にとっては既知の論文群である後半論文群から、実際の新奇性を解釈させます。
  15. この予想と実際という2つの解釈を利用して、3つの比較を行いました。 まず、それぞれの<代表的な執筆者>の考えるメインストリームがどのようなトピックなのかを調べました。 次に、予想と実際の新奇性を比較しました。 そして、異常度や被引用回数、SNIPをジャーナルごとに集計した上で比較を行いました。
  16. これは補足なのですが、このモデルを作ることで、いままさに執筆途中の論文であってもそれがメインストリームに属するかどうかを判定できます。 たとえばこれは私が昨年末に国際会議で発表したペーパーなのですが、これをモデルに評価させると、新奇性は16.6と高めに出ました。
  17. ここで再度、使用した指標を整理すると、このようになっております。
  18. では、結果をご説明していきます。
  19. まず、前半モデルと後半モデルそれぞれの考えるメインストリームのトピックです。 ここで挙げられている単語は、トピックと共起性の高い上位6単語です。 共起性とは、このトピックの下でこの単語が出現する確率を示します。 出現回数とは、各文章の下でこのトピックが出現する確率が最も高い文章の数です。 トピックの列には、この単語群の組み合わせから創発する意味を私が考え記入しました。
  20. この解釈ですが、まず、サプライチェーンマネジメントは1位から2位に移動しています。 これは「メインストリームは移り変わる」というだけでなく、coordinationやsharingなどの単語が新たに出現しているように、トピックの発展も捉えることができます。 また、後半モデルで1位になっているファジー論理は、真偽値にあいまいさを取り入れた論理ですが、これがこの領域で広く応用された時期と一致しています。 また、情報検索は新たにwebという語を取り入れる形で発展しています。eラーニングについてはトップ3からは漏れています。
  21. 異常度の分布は概ね釣り鐘状をしていますが、右側に歪みがあります。 ここには、外れ値論文がそれぞれ76本、70本ありました。 それぞれ平均値は垂直な実線で表されており、15.49と15.65と近いように思えますが、平均値のt検定の結果、有意な差がありました。 また、点線で挟まれた区間は平均値プラスマイナス1標準偏差のエリアで、本研究でメインストリームと考えているエリアです。 異常度が最も低いところではなく、この領域に最も論文が集まっていることから、最適な新奇性、とでも呼べるものがあるのかもしれません。
  22. 続いて、異常度を0.1刻みにしてその区間内の論文の被引用回数の平均を取っていったものがこのグラフです。 これを見ると、メインストリームに相当する区間で最も平均被引用回数が高くなっていることがわかります。 ここから、学術のメインストリームにおいても累積的優位は存在し、被引用回数を集めやすいことがわかります。
  23. 続いて、異常度は各論文でどのように変化しているのか、ということを表したのがこのグラフです。 銀河系のようになっていますが、この紫の各点は1つの論文を表します。 これをみると、異常度が予想では平均より低かったものが実際でも低い、予想では高かったものが、実際も高いというケースが80%以上を占めることがわかります。 しかし、本研究が革新性として注目しているのは右下の領域に属する518本の論文群です。 これらは、予想では新奇性が平均値より高かったが、実際は新奇性が平均値以下になったグループで、「周辺からメインストリームへ」という動きをしているグループです。
  24. では、先ほどの論文群をジャーナル単位にまとめるとどうなるでしょうか。ここでジャーナルはキュレーターとしての役割を考えています。 横軸の異常度の偏差の変化は、マイナス方向に行くほど、「周辺からメインストリームへ」という動きをしています。 そして、ジャーナルが「周辺からメインストリームへ」という動きをしている論文を集めることと、ジャーナルの平均被引用回数の間に-0.318の有意な相関があることがわかりました。
  25. 続いて、Scopusの提供するジャーナルの評価指標と革新性の関係ですが、この2つの間には相関がありませんでした。 これは「周辺からメインストリームへ」という動きは、インパクトファクターなどのジャーナル評価指標では測れない、ということを意味しています。
  26. 次にこれは、被引用回数の多いジャーナルの一覧です。 ここで、偏差の変化の列が赤くなっているのものが「周辺からメインストリームへ」という動きをしている論文を多く集めているジャーナルです。 これをみると、被引用回数の多いジャーナルの中でも、メインストリームを維持していこうとするジャーナルと、新しいものを取り入れていこうとするジャーナルとがあることがわかります。
  27. 以上から、革新的な新奇性の発見に長けたキュレーターは一般的な評価指標とは異なる影響力を持つ」という仮説に対して、以下の2つがいえます。 1つめは、革新的な新奇性の発見に長けたキュレーターは存在するということです。 これは、ジャーナルごとの革新性と被引用回数の間に有意な相関がみられたことから確かめられました。 2つめは、それらのキュレーターは、一般的な評価指標とは異なる影響力を持つ、ということです。 これは、革新性とSNIPの間に相関がなかったことから確かめられました。 SNIPは過去3年のデータのみを用いるのに対し、今回使用した被引用回数は5年以上のデータを用いていることから、 SNIPは短期、革新性は長期の影響力を測ることができる、と考えられます。
  28. 今後の課題といたしましては、この3つを考えております。 1つめは、被引用回数の多いジャーナルのうちで、革新性の高いジャーナルとそうでないジャーナルの違いを明らかにすることです。 特徴的なジャーナルについてのケーススタディを通じて、革新的な新奇性を発見する際に用いるロジックを明らかにしていきたいと考えています。 2つめは、今回はキュレーターとしてジャーナルのみを考えましたが、それ以外のキュレーターについて調査することです。 また、キュレーターとイノベーションについて、理論的な検討が不十分であったため、そこも詰めていきたいと考えております。 最後に、他分野への応用可能性を検討していきたいと考えております。もし、この発表をお聞きになって、この手法でなにかできるのでは、と思われるところがございましたら、どうかお声掛けください! それでは、発表は以上になります。ご指導ご鞭撻のほど、よろしくお願いいたします。 ご清聴ありがとうございました。