オープンソース
ソフトウェア技術の
傾向分析
第14回情報科学技術フォーラム
中央大学 飯尾 淳
2015年9月15日 @ 松山
FIT2015, 15/09/2015 Copyright © Jun Iio 2
発表の内容
●
背景と目的
●
分析の対象
●
分析手順の詳細
●
分析結果
●
考察とまとめ
FIT2015, 15/09/2015 Copyright © Jun Iio 3
背景と目的
●
Open Source Software (OSS)
– サーバだけでなく,モバイル機器,組み込み,IoT
など,あらゆる分野で活用
– サイバーワールドを語るにも不可欠の要素技術
●
「技術」よりは,コミュニティのあり方やライセンス,
コードシェアリングなど,「技術」以外に妙味がある…
●
そうはいっても,技術の変遷にトレンドが
– 80年代 … Free Software Foundation (FSF)
– 90年代後半 … Open Source Initiative (OSI)
– 00年代 … サーバシステムからクラウドへ
– 10年台 … クラウド + IoT?
FIT2015, 15/09/2015 Copyright © Jun Iio 4
背景と目的(続き)
●
OSS研究の動向
– ソフトウェア工学領域の研究
– 社会科学研究者によるコミュニティ研究
●
人的ネットワーク分析など
– SNSやCGMなど
●
開発者が参加する勉強会からトレンド分析
– J. Iio, “Technology Trends Indicated in “The IT Study
Meeting Calendar”,” Proc. WSSM2014, 590–595, 2014.
– その他,学際領域的研究例
●
ライセンスに関する法学的研究
●
経済効果など経済学,経営学の領域における研究
●
サイバーワールドを支える人材に着目
FIT2015, 15/09/2015 Copyright © Jun Iio 5
分析の対象
●
仮説:
「OSSに関するコミュニティや技術者の発する情報
を分析することで,同分野の技術動向を浮かび上が
らせることができる」
●
対象のイベント
– 「オープンソースカンファレンス(OSC)」
●
2004年から,全国各地で開催
●
2015年3月開催分までを対象に(約100回,152件)
– 規模感:
●
1,000人〜 (東京開催)
●
〜1,00人 (地方開催)
FIT2015, 15/09/2015 Copyright © Jun Iio 6
オープンソースカンファレンス
FIT2015, 15/09/2015 Copyright © Jun Iio 7
プログラム例
FIT2015, 15/09/2015 Copyright © Jun Iio 8
分析の手順
1. 発表タイトルの取得
– OSC過去のタイムテーブルからダウンロード
– <a>タグをキーとしてタイトルを半自動で取得
2. データのクリーニング
– 発表以外のコマ削除,言葉のゆらぎ修正,複数コマ
の統合など
3. 英単語の抽出
– 英単語トレンドの分析用として
4. 日本語単語の抽出
– 日単語トレンドの分析用として
FIT2015, 15/09/2015 Copyright © Jun Iio 9
バッチ処理例
FIT2015, 15/09/2015 Copyright © Jun Iio 10
英文キーワードの抽出結果
FIT2015, 15/09/2015 Copyright © Jun Iio 11
和文キーワードのクラスタリング
●
出現頻度空間
– 横軸に各イベント,
– 縦軸に和文キーワード
●
クラスタリング
– 同空間におけるキー
ワード間の距離を用い
てクラスタリングを実
施
– キーワードの関連性か
ら,デンドログラムを
構成
FIT2015, 15/09/2015 Copyright © Jun Iio 12
英文キーワードのトレンド
●
注目すべき点
– Linux, OSS, Webといった基本的なキーワー
ド,DB関連,CMSなどが頻出,人気は高い
– OpenStack, CloudStackなど,クラウド関連技術
が後半に登場
FIT2015, 15/09/2015 Copyright © Jun Iio 13
和文キーワードのトレンド
●
注目すべき点
– 傾向は英文キーワードと同様
– 紹介,入門,開発,最新,技術など,一般名詞も
– 「クラウド」という単語が後半に登場
●
その具体例が,英文キーワードのOpenStackなど
FIT2015, 15/09/2015 Copyright © Jun Iio 14
まとめ
●
10年来続けられてきたOSCというOSS関連イ
ベントの発表タイトルに着目
●
タイトルに含まれるキーワード分析によ
り,OSS業界のトレンドを確認
●
ざっくりした傾向を確認することができた
●
課題
– イベントの性質上,若干のノイズが含まれる(某
OSの例など)
– 今回は日本国内に特化した分析,海外との比較は?

オープンソースソフトウェア技術の傾向分析

  • 1.
  • 2.
    FIT2015, 15/09/2015 Copyright© Jun Iio 2 発表の内容 ● 背景と目的 ● 分析の対象 ● 分析手順の詳細 ● 分析結果 ● 考察とまとめ
  • 3.
    FIT2015, 15/09/2015 Copyright© Jun Iio 3 背景と目的 ● Open Source Software (OSS) – サーバだけでなく,モバイル機器,組み込み,IoT など,あらゆる分野で活用 – サイバーワールドを語るにも不可欠の要素技術 ● 「技術」よりは,コミュニティのあり方やライセンス, コードシェアリングなど,「技術」以外に妙味がある… ● そうはいっても,技術の変遷にトレンドが – 80年代 … Free Software Foundation (FSF) – 90年代後半 … Open Source Initiative (OSI) – 00年代 … サーバシステムからクラウドへ – 10年台 … クラウド + IoT?
  • 4.
    FIT2015, 15/09/2015 Copyright© Jun Iio 4 背景と目的(続き) ● OSS研究の動向 – ソフトウェア工学領域の研究 – 社会科学研究者によるコミュニティ研究 ● 人的ネットワーク分析など – SNSやCGMなど ● 開発者が参加する勉強会からトレンド分析 – J. Iio, “Technology Trends Indicated in “The IT Study Meeting Calendar”,” Proc. WSSM2014, 590–595, 2014. – その他,学際領域的研究例 ● ライセンスに関する法学的研究 ● 経済効果など経済学,経営学の領域における研究 ● サイバーワールドを支える人材に着目
  • 5.
    FIT2015, 15/09/2015 Copyright© Jun Iio 5 分析の対象 ● 仮説: 「OSSに関するコミュニティや技術者の発する情報 を分析することで,同分野の技術動向を浮かび上が らせることができる」 ● 対象のイベント – 「オープンソースカンファレンス(OSC)」 ● 2004年から,全国各地で開催 ● 2015年3月開催分までを対象に(約100回,152件) – 規模感: ● 1,000人〜 (東京開催) ● 〜1,00人 (地方開催)
  • 6.
    FIT2015, 15/09/2015 Copyright© Jun Iio 6 オープンソースカンファレンス
  • 7.
    FIT2015, 15/09/2015 Copyright© Jun Iio 7 プログラム例
  • 8.
    FIT2015, 15/09/2015 Copyright© Jun Iio 8 分析の手順 1. 発表タイトルの取得 – OSC過去のタイムテーブルからダウンロード – <a>タグをキーとしてタイトルを半自動で取得 2. データのクリーニング – 発表以外のコマ削除,言葉のゆらぎ修正,複数コマ の統合など 3. 英単語の抽出 – 英単語トレンドの分析用として 4. 日本語単語の抽出 – 日単語トレンドの分析用として
  • 9.
    FIT2015, 15/09/2015 Copyright© Jun Iio 9 バッチ処理例
  • 10.
    FIT2015, 15/09/2015 Copyright© Jun Iio 10 英文キーワードの抽出結果
  • 11.
    FIT2015, 15/09/2015 Copyright© Jun Iio 11 和文キーワードのクラスタリング ● 出現頻度空間 – 横軸に各イベント, – 縦軸に和文キーワード ● クラスタリング – 同空間におけるキー ワード間の距離を用い てクラスタリングを実 施 – キーワードの関連性か ら,デンドログラムを 構成
  • 12.
    FIT2015, 15/09/2015 Copyright© Jun Iio 12 英文キーワードのトレンド ● 注目すべき点 – Linux, OSS, Webといった基本的なキーワー ド,DB関連,CMSなどが頻出,人気は高い – OpenStack, CloudStackなど,クラウド関連技術 が後半に登場
  • 13.
    FIT2015, 15/09/2015 Copyright© Jun Iio 13 和文キーワードのトレンド ● 注目すべき点 – 傾向は英文キーワードと同様 – 紹介,入門,開発,最新,技術など,一般名詞も – 「クラウド」という単語が後半に登場 ● その具体例が,英文キーワードのOpenStackなど
  • 14.
    FIT2015, 15/09/2015 Copyright© Jun Iio 14 まとめ ● 10年来続けられてきたOSCというOSS関連イ ベントの発表タイトルに着目 ● タイトルに含まれるキーワード分析によ り,OSS業界のトレンドを確認 ● ざっくりした傾向を確認することができた ● 課題 – イベントの性質上,若干のノイズが含まれる(某 OSの例など) – 今回は日本国内に特化した分析,海外との比較は?