SlideShare a Scribd company logo
1 of 15
自由なデータ



Software Freedom Day2012
         野首貴嗣
       knok@fsij.org
「自由なデータ」の定義
●   この発表の中での「自由なデータ」
●   自由ソフトウェアの定義を参考に
    –   いかなる目的に対しても、プログラムを実行する権
        利
    –   プログラムがどのように動作しているか研究 し、
        必要に応じて改造する自由
    –   身近な人を助けられるよう、コピーを再配布する自
        由
    –   改変した版を他に配布する自由
定義してみる
●   目的を問わず利用する自由
    –   「利用」の定義が難しいのであまり考えない
●   調査し、改変する自由
    –   「ソースコード」にあたるものはデータによって
        さまざま
●   コピーの再配布の自由
●   改変物の再配布の自由
自由なデータのライセンス例
●   GPL
    –   あまりデータには向かない
●   GFDL (GNU Free Document License)
    –   invaliant sectionがある
●   Creative Commons
    –   複数のバリエーションがある
●   Open Database License
    –   OpenStreetMapの新しいライセンス(2012/9/12より)
日本語の処理と自由なデータ
●   表示に必要なフォント
    –   ビットマップ
    –   アウトライン
●   辞書
    –   日本語入力
    –   自然言語処理
ビットマップフォント
●   昔のPCはROM内蔵
●   ソフトウェアでフォントをレンダリング
    –   a12k12 (public domain)
        ●   X-Window に同梱
    –   M+ font (ほぼpublic domain)
        ●   見易さ、デザインにこだわったフォント
アウトラインフォント
●   PCの処理能力向上によって需要が拡大
    –   東風フォント
        ●   ライセンス問題により配布停止
        ●   さざなみフォントという代替フォントが開発された
    –   M+ Outline font
        ●   5つのウェイトを持つ日本語アウトラインフォント
        ●   現在第1水準まで
        ●   組み合わせた派生フォントが何種かある
            –   VL-Gothic font (M+/さざなみ)
日本語入力
●   辞書が必須
    –   SKKJISYO (GPL)
        ●   SKK用の辞書
    –   Pubdic+ (ほぼpublic domain)
        ●   Wnn/FreeWnnの辞書
    –   cannadic/改 (pubdic+由来の単語を含む)
        ●   Canna, Anthyの辞書
    –   ipadic (ICOTライセンス)
        ●   mozcの辞書
自然言語処理
●   ipadic
    –   ChaSen
    –   MeCab
●   juman dic (MIT style)
    –   juman
自由ソフトウェアの弱い領域
●   スペル、文法チェッカー
●   日本語入力
    –   手書き入力
        ●   Tomoe
●   音声合成
    –   Open JTalk
●   OCR
    –   tesseract
    –   nhocr
困難な要因
●   データ量
●   専門性の高さ
●   統一性
●   データ形式の問題
●   法的な問題
プロプライエタリデータの問題
●   データ形式が非公開
    –   参考にすることも改造することも困難
    –   特許になっているデータ形式もある
●   言葉狩り
    –   「不適切」「差別的」とカテゴライズされる単語
●   データ改変、追加が難しい
    –   適切な品詞で単語を追加できるか
    –   適切なスコア(頻度情報)を指定できるか
自由なデータを増やすには
●   データ流通の拠点が必要
    –   Youtube
    –   niconico
    –   pixiv
    –   instagram
    –   flickr
    –   Wikipedia
         ●   … などのようなサイト
必要な機能
●   著作権者の明確化
●   ライセンスの明確化
    –   flickrはCreativeCommonsが選択できる
●   一次著作物と二次著作物の関係性の明記
    –   niconicoにはコンテンツツリーがある
●   コンテンツの評価機能
●   専門知識を持つ編集者的存在
著名なプロジェクト
●   Project Gutenberg
●   青空文庫
●   Internet Archive
●   Wikipedia
●   OpenStreetMap

More Related Content

Viewers also liked

Heterogeneous Particle based Simulation (SIGGRAPH ASIA 2011)
Heterogeneous Particle based Simulation (SIGGRAPH ASIA 2011)Heterogeneous Particle based Simulation (SIGGRAPH ASIA 2011)
Heterogeneous Particle based Simulation (SIGGRAPH ASIA 2011)Takahiro Harada
 
Foveated Ray Tracing for VR on Multiple GPUs
Foveated Ray Tracing for VR on Multiple GPUsFoveated Ray Tracing for VR on Multiple GPUs
Foveated Ray Tracing for VR on Multiple GPUsTakahiro Harada
 
Introducing Firerender for 3DS Max
Introducing Firerender for 3DS MaxIntroducing Firerender for 3DS Max
Introducing Firerender for 3DS MaxTakahiro Harada
 
A 2.5D Culling for Forward+ (SIGGRAPH ASIA 2012)
A 2.5D Culling for Forward+ (SIGGRAPH ASIA 2012)A 2.5D Culling for Forward+ (SIGGRAPH ASIA 2012)
A 2.5D Culling for Forward+ (SIGGRAPH ASIA 2012)Takahiro Harada
 
ぼくのかんがえた Itamae/Serverspec 構成フレームワーク 〜 Kondate 〜
ぼくのかんがえた Itamae/Serverspec 構成フレームワーク 〜 Kondate 〜ぼくのかんがえた Itamae/Serverspec 構成フレームワーク 〜 Kondate 〜
ぼくのかんがえた Itamae/Serverspec 構成フレームワーク 〜 Kondate 〜Naotoshi Seo
 
Physics Tutorial, GPU Physics (GDC2010)
Physics Tutorial, GPU Physics (GDC2010)Physics Tutorial, GPU Physics (GDC2010)
Physics Tutorial, GPU Physics (GDC2010)Takahiro Harada
 
Introduction to Monte Carlo Ray Tracing (CEDEC 2013)
Introduction to Monte Carlo Ray Tracing (CEDEC 2013)Introduction to Monte Carlo Ray Tracing (CEDEC 2013)
Introduction to Monte Carlo Ray Tracing (CEDEC 2013)Takahiro Harada
 
[2016 GDC] Multiplatform GPU Ray-Tracing Solutions With FireRender and FireRays
[2016 GDC] Multiplatform GPU Ray-Tracing Solutions With FireRender and FireRays[2016 GDC] Multiplatform GPU Ray-Tracing Solutions With FireRender and FireRays
[2016 GDC] Multiplatform GPU Ray-Tracing Solutions With FireRender and FireRaysTakahiro Harada
 
Introduction to Bidirectional Path Tracing (BDPT) & Implementation using Open...
Introduction to Bidirectional Path Tracing (BDPT) & Implementation using Open...Introduction to Bidirectional Path Tracing (BDPT) & Implementation using Open...
Introduction to Bidirectional Path Tracing (BDPT) & Implementation using Open...Takahiro Harada
 
確率的ライトカリング 理論と実装 (CEDEC2016)
確率的ライトカリング 理論と実装 (CEDEC2016)確率的ライトカリング 理論と実装 (CEDEC2016)
確率的ライトカリング 理論と実装 (CEDEC2016)Takahiro Harada
 
Introduction to Monte Carlo Ray Tracing, OpenCL Implementation (CEDEC 2014)
Introduction to Monte Carlo Ray Tracing, OpenCL Implementation (CEDEC 2014)Introduction to Monte Carlo Ray Tracing, OpenCL Implementation (CEDEC 2014)
Introduction to Monte Carlo Ray Tracing, OpenCL Implementation (CEDEC 2014)Takahiro Harada
 
Forward+ (EUROGRAPHICS 2012)
Forward+ (EUROGRAPHICS 2012)Forward+ (EUROGRAPHICS 2012)
Forward+ (EUROGRAPHICS 2012)Takahiro Harada
 
Sphinx拡張 探訪 2014 #sphinxjp
Sphinx拡張 探訪 2014 #sphinxjpSphinx拡張 探訪 2014 #sphinxjp
Sphinx拡張 探訪 2014 #sphinxjpTakeshi Komiya
 
Component basedgameenginedesign
Component basedgameenginedesign Component basedgameenginedesign
Component basedgameenginedesign DADA246
 
Deep dream 機械が見た夢
Deep dream   機械が見た夢Deep dream   機械が見た夢
Deep dream 機械が見た夢Harumitsu Nobuta
 
論文輪読資料「FaceNet: A Unified Embedding for Face Recognition and Clustering」
論文輪読資料「FaceNet: A Unified Embedding for Face Recognition and Clustering」論文輪読資料「FaceNet: A Unified Embedding for Face Recognition and Clustering」
論文輪読資料「FaceNet: A Unified Embedding for Face Recognition and Clustering」Kaoru Nasuno
 
ゲーム開発とデザインパターン
ゲーム開発とデザインパターンゲーム開発とデザインパターン
ゲーム開発とデザインパターンTakashi Komada
 
[2017 GDC] Radeon ProRender and Radeon Rays in a Gaming Rendering Workflow
[2017 GDC] Radeon ProRender and Radeon Rays in a Gaming Rendering Workflow[2017 GDC] Radeon ProRender and Radeon Rays in a Gaming Rendering Workflow
[2017 GDC] Radeon ProRender and Radeon Rays in a Gaming Rendering WorkflowTakahiro Harada
 
スタートアップの 3 分ピッチテンプレート
スタートアップの 3 分ピッチテンプレートスタートアップの 3 分ピッチテンプレート
スタートアップの 3 分ピッチテンプレートTakaaki Umada
 

Viewers also liked (20)

Heterogeneous Particle based Simulation (SIGGRAPH ASIA 2011)
Heterogeneous Particle based Simulation (SIGGRAPH ASIA 2011)Heterogeneous Particle based Simulation (SIGGRAPH ASIA 2011)
Heterogeneous Particle based Simulation (SIGGRAPH ASIA 2011)
 
Foveated Ray Tracing for VR on Multiple GPUs
Foveated Ray Tracing for VR on Multiple GPUsFoveated Ray Tracing for VR on Multiple GPUs
Foveated Ray Tracing for VR on Multiple GPUs
 
Introducing Firerender for 3DS Max
Introducing Firerender for 3DS MaxIntroducing Firerender for 3DS Max
Introducing Firerender for 3DS Max
 
A 2.5D Culling for Forward+ (SIGGRAPH ASIA 2012)
A 2.5D Culling for Forward+ (SIGGRAPH ASIA 2012)A 2.5D Culling for Forward+ (SIGGRAPH ASIA 2012)
A 2.5D Culling for Forward+ (SIGGRAPH ASIA 2012)
 
ぼくのかんがえた Itamae/Serverspec 構成フレームワーク 〜 Kondate 〜
ぼくのかんがえた Itamae/Serverspec 構成フレームワーク 〜 Kondate 〜ぼくのかんがえた Itamae/Serverspec 構成フレームワーク 〜 Kondate 〜
ぼくのかんがえた Itamae/Serverspec 構成フレームワーク 〜 Kondate 〜
 
Physics Tutorial, GPU Physics (GDC2010)
Physics Tutorial, GPU Physics (GDC2010)Physics Tutorial, GPU Physics (GDC2010)
Physics Tutorial, GPU Physics (GDC2010)
 
Introduction to Monte Carlo Ray Tracing (CEDEC 2013)
Introduction to Monte Carlo Ray Tracing (CEDEC 2013)Introduction to Monte Carlo Ray Tracing (CEDEC 2013)
Introduction to Monte Carlo Ray Tracing (CEDEC 2013)
 
[2016 GDC] Multiplatform GPU Ray-Tracing Solutions With FireRender and FireRays
[2016 GDC] Multiplatform GPU Ray-Tracing Solutions With FireRender and FireRays[2016 GDC] Multiplatform GPU Ray-Tracing Solutions With FireRender and FireRays
[2016 GDC] Multiplatform GPU Ray-Tracing Solutions With FireRender and FireRays
 
Introduction to Bidirectional Path Tracing (BDPT) & Implementation using Open...
Introduction to Bidirectional Path Tracing (BDPT) & Implementation using Open...Introduction to Bidirectional Path Tracing (BDPT) & Implementation using Open...
Introduction to Bidirectional Path Tracing (BDPT) & Implementation using Open...
 
確率的ライトカリング 理論と実装 (CEDEC2016)
確率的ライトカリング 理論と実装 (CEDEC2016)確率的ライトカリング 理論と実装 (CEDEC2016)
確率的ライトカリング 理論と実装 (CEDEC2016)
 
Introduction to Monte Carlo Ray Tracing, OpenCL Implementation (CEDEC 2014)
Introduction to Monte Carlo Ray Tracing, OpenCL Implementation (CEDEC 2014)Introduction to Monte Carlo Ray Tracing, OpenCL Implementation (CEDEC 2014)
Introduction to Monte Carlo Ray Tracing, OpenCL Implementation (CEDEC 2014)
 
Forward+ (EUROGRAPHICS 2012)
Forward+ (EUROGRAPHICS 2012)Forward+ (EUROGRAPHICS 2012)
Forward+ (EUROGRAPHICS 2012)
 
Sphinx拡張 探訪 2014 #sphinxjp
Sphinx拡張 探訪 2014 #sphinxjpSphinx拡張 探訪 2014 #sphinxjp
Sphinx拡張 探訪 2014 #sphinxjp
 
Component basedgameenginedesign
Component basedgameenginedesign Component basedgameenginedesign
Component basedgameenginedesign
 
Deep dream 機械が見た夢
Deep dream   機械が見た夢Deep dream   機械が見た夢
Deep dream 機械が見た夢
 
GPU最適化入門
GPU最適化入門GPU最適化入門
GPU最適化入門
 
論文輪読資料「FaceNet: A Unified Embedding for Face Recognition and Clustering」
論文輪読資料「FaceNet: A Unified Embedding for Face Recognition and Clustering」論文輪読資料「FaceNet: A Unified Embedding for Face Recognition and Clustering」
論文輪読資料「FaceNet: A Unified Embedding for Face Recognition and Clustering」
 
ゲーム開発とデザインパターン
ゲーム開発とデザインパターンゲーム開発とデザインパターン
ゲーム開発とデザインパターン
 
[2017 GDC] Radeon ProRender and Radeon Rays in a Gaming Rendering Workflow
[2017 GDC] Radeon ProRender and Radeon Rays in a Gaming Rendering Workflow[2017 GDC] Radeon ProRender and Radeon Rays in a Gaming Rendering Workflow
[2017 GDC] Radeon ProRender and Radeon Rays in a Gaming Rendering Workflow
 
スタートアップの 3 分ピッチテンプレート
スタートアップの 3 分ピッチテンプレートスタートアップの 3 分ピッチテンプレート
スタートアップの 3 分ピッチテンプレート
 

Similar to 自由なデータ

オープンソースのスクリーンリーダーNVDAとLibreOffice
オープンソースのスクリーンリーダーNVDAとLibreOfficeオープンソースのスクリーンリーダーNVDAとLibreOffice
オープンソースのスクリーンリーダーNVDAとLibreOfficeTakuya Nishimoto
 
2011年10月21日
2011年10月21日2011年10月21日
2011年10月21日nukaemon
 
iii_SGMI #5 "OOP & Design Patterns"
iii_SGMI #5 "OOP & Design Patterns"iii_SGMI #5 "OOP & Design Patterns"
iii_SGMI #5 "OOP & Design Patterns"Ryohei Suzuki
 
OpenDocument interoperability test workshop after story
OpenDocument interoperability test workshop after storyOpenDocument interoperability test workshop after story
OpenDocument interoperability test workshop after storyMakoto Takizawa
 
たぶん45分くらいでわかる、オープンソースの世界
たぶん45分くらいでわかる、オープンソースの世界たぶん45分くらいでわかる、オープンソースの世界
たぶん45分くらいでわかる、オープンソースの世界Yutaka Kachi
 
eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」
eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」
eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」ericsagnes
 
つながるデータShare
つながるデータShareつながるデータShare
つながるデータShareSeiji Koide
 
LibreOffice for NPO 20121104
LibreOffice for NPO 20121104LibreOffice for NPO 20121104
LibreOffice for NPO 20121104hyogontech
 
"オープン"を文化に ~インターネットがつくる新しいデータの世界~
"オープン"を文化に ~インターネットがつくる新しいデータの世界~"オープン"を文化に ~インターネットがつくる新しいデータの世界~
"オープン"を文化に ~インターネットがつくる新しいデータの世界~National Institute of Informatics (NII)
 
ライセンスを理解してますか?知っておきたいWordPressとGPLライセンス
ライセンスを理解してますか?知っておきたいWordPressとGPLライセンスライセンスを理解してますか?知っておきたいWordPressとGPLライセンス
ライセンスを理解してますか?知っておきたいWordPressとGPLライセンスJun Nogata
 
講義資料におけるマルチユースなリンクをEPUBとLODで実現するシステムの試作
講義資料におけるマルチユースなリンクをEPUBとLODで実現するシステムの試作講義資料におけるマルチユースなリンクをEPUBとLODで実現するシステムの試作
講義資料におけるマルチユースなリンクをEPUBとLODで実現するシステムの試作yamahige
 
ドキュメントの話、しませんか? #428rk01
ドキュメントの話、しませんか? #428rk01ドキュメントの話、しませんか? #428rk01
ドキュメントの話、しませんか? #428rk01Takeshi Komiya
 
PHPにおけるRIA事情と開発
PHPにおけるRIA事情と開発PHPにおけるRIA事情と開発
PHPにおけるRIA事情と開発konekto
 
たまにはライセンスの話をしよう 20110211
たまにはライセンスの話をしよう 20110211たまにはライセンスの話をしよう 20110211
たまにはライセンスの話をしよう 20110211Yutaka Kachi
 
Ocs2013 tokyo spring_plone
Ocs2013 tokyo spring_ploneOcs2013 tokyo spring_plone
Ocs2013 tokyo spring_ploneManabu Terada
 
ユーザ・デザイナーから見たPlone CMSのアピールポイント
ユーザ・デザイナーから見たPlone CMSのアピールポイントユーザ・デザイナーから見たPlone CMSのアピールポイント
ユーザ・デザイナーから見たPlone CMSのアピールポイントMasaki NIWA
 

Similar to 自由なデータ (20)

オープンソースのスクリーンリーダーNVDAとLibreOffice
オープンソースのスクリーンリーダーNVDAとLibreOfficeオープンソースのスクリーンリーダーNVDAとLibreOffice
オープンソースのスクリーンリーダーNVDAとLibreOffice
 
2011年10月21日
2011年10月21日2011年10月21日
2011年10月21日
 
iii_SGMI #5 "OOP & Design Patterns"
iii_SGMI #5 "OOP & Design Patterns"iii_SGMI #5 "OOP & Design Patterns"
iii_SGMI #5 "OOP & Design Patterns"
 
OpenDocument interoperability test workshop after story
OpenDocument interoperability test workshop after storyOpenDocument interoperability test workshop after story
OpenDocument interoperability test workshop after story
 
たぶん45分くらいでわかる、オープンソースの世界
たぶん45分くらいでわかる、オープンソースの世界たぶん45分くらいでわかる、オープンソースの世界
たぶん45分くらいでわかる、オープンソースの世界
 
eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」
eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」
eZ Publish勉強会2013年3月「eZ Publishの構築を簡単に!」
 
つながるデータShare
つながるデータShareつながるデータShare
つながるデータShare
 
Nishimotz pycon2011jan
Nishimotz pycon2011janNishimotz pycon2011jan
Nishimotz pycon2011jan
 
LibreOffice for NPO 20121104
LibreOffice for NPO 20121104LibreOffice for NPO 20121104
LibreOffice for NPO 20121104
 
"オープン"を文化に ~インターネットがつくる新しいデータの世界~
"オープン"を文化に ~インターネットがつくる新しいデータの世界~"オープン"を文化に ~インターネットがつくる新しいデータの世界~
"オープン"を文化に ~インターネットがつくる新しいデータの世界~
 
Nishimotz osc2011oct-v2
Nishimotz osc2011oct-v2Nishimotz osc2011oct-v2
Nishimotz osc2011oct-v2
 
ライセンスを理解してますか?知っておきたいWordPressとGPLライセンス
ライセンスを理解してますか?知っておきたいWordPressとGPLライセンスライセンスを理解してますか?知っておきたいWordPressとGPLライセンス
ライセンスを理解してますか?知っておきたいWordPressとGPLライセンス
 
講義資料におけるマルチユースなリンクをEPUBとLODで実現するシステムの試作
講義資料におけるマルチユースなリンクをEPUBとLODで実現するシステムの試作講義資料におけるマルチユースなリンクをEPUBとLODで実現するシステムの試作
講義資料におけるマルチユースなリンクをEPUBとLODで実現するシステムの試作
 
ドキュメントの話、しませんか? #428rk01
ドキュメントの話、しませんか? #428rk01ドキュメントの話、しませんか? #428rk01
ドキュメントの話、しませんか? #428rk01
 
最新UE4タイトルでのローカライズ事例 (UE4 Localization Deep Dive)
最新UE4タイトルでのローカライズ事例 (UE4 Localization Deep Dive)最新UE4タイトルでのローカライズ事例 (UE4 Localization Deep Dive)
最新UE4タイトルでのローカライズ事例 (UE4 Localization Deep Dive)
 
PHPにおけるRIA事情と開発
PHPにおけるRIA事情と開発PHPにおけるRIA事情と開発
PHPにおけるRIA事情と開発
 
たまにはライセンスの話をしよう 20110211
たまにはライセンスの話をしよう 20110211たまにはライセンスの話をしよう 20110211
たまにはライセンスの話をしよう 20110211
 
Ocs2013 tokyo spring_plone
Ocs2013 tokyo spring_ploneOcs2013 tokyo spring_plone
Ocs2013 tokyo spring_plone
 
ユーザ・デザイナーから見たPlone CMSのアピールポイント
ユーザ・デザイナーから見たPlone CMSのアピールポイントユーザ・デザイナーから見たPlone CMSのアピールポイント
ユーザ・デザイナーから見たPlone CMSのアピールポイント
 
計算機理論入門07
計算機理論入門07計算機理論入門07
計算機理論入門07
 

Recently uploaded

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイルLoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイルCRI Japan, Inc.
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアルLoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアルCRI Japan, Inc.
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 

Recently uploaded (11)

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイルLoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
LoRaWAN無位置ロープ型水漏れセンサー WL03A-LB/LSカタログ ファイル
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアルLoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
LoRaWAN無位置ロープ式水漏れセンサーWL03A 日本語マニュアル
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 

自由なデータ

  • 1. 自由なデータ Software Freedom Day2012 野首貴嗣 knok@fsij.org
  • 2. 「自由なデータ」の定義 ● この発表の中での「自由なデータ」 ● 自由ソフトウェアの定義を参考に – いかなる目的に対しても、プログラムを実行する権 利 – プログラムがどのように動作しているか研究 し、 必要に応じて改造する自由 – 身近な人を助けられるよう、コピーを再配布する自 由 – 改変した版を他に配布する自由
  • 3. 定義してみる ● 目的を問わず利用する自由 – 「利用」の定義が難しいのであまり考えない ● 調査し、改変する自由 – 「ソースコード」にあたるものはデータによって さまざま ● コピーの再配布の自由 ● 改変物の再配布の自由
  • 4. 自由なデータのライセンス例 ● GPL – あまりデータには向かない ● GFDL (GNU Free Document License) – invaliant sectionがある ● Creative Commons – 複数のバリエーションがある ● Open Database License – OpenStreetMapの新しいライセンス(2012/9/12より)
  • 5. 日本語の処理と自由なデータ ● 表示に必要なフォント – ビットマップ – アウトライン ● 辞書 – 日本語入力 – 自然言語処理
  • 6. ビットマップフォント ● 昔のPCはROM内蔵 ● ソフトウェアでフォントをレンダリング – a12k12 (public domain) ● X-Window に同梱 – M+ font (ほぼpublic domain) ● 見易さ、デザインにこだわったフォント
  • 7. アウトラインフォント ● PCの処理能力向上によって需要が拡大 – 東風フォント ● ライセンス問題により配布停止 ● さざなみフォントという代替フォントが開発された – M+ Outline font ● 5つのウェイトを持つ日本語アウトラインフォント ● 現在第1水準まで ● 組み合わせた派生フォントが何種かある – VL-Gothic font (M+/さざなみ)
  • 8. 日本語入力 ● 辞書が必須 – SKKJISYO (GPL) ● SKK用の辞書 – Pubdic+ (ほぼpublic domain) ● Wnn/FreeWnnの辞書 – cannadic/改 (pubdic+由来の単語を含む) ● Canna, Anthyの辞書 – ipadic (ICOTライセンス) ● mozcの辞書
  • 9. 自然言語処理 ● ipadic – ChaSen – MeCab ● juman dic (MIT style) – juman
  • 10. 自由ソフトウェアの弱い領域 ● スペル、文法チェッカー ● 日本語入力 – 手書き入力 ● Tomoe ● 音声合成 – Open JTalk ● OCR – tesseract – nhocr
  • 11. 困難な要因 ● データ量 ● 専門性の高さ ● 統一性 ● データ形式の問題 ● 法的な問題
  • 12. プロプライエタリデータの問題 ● データ形式が非公開 – 参考にすることも改造することも困難 – 特許になっているデータ形式もある ● 言葉狩り – 「不適切」「差別的」とカテゴライズされる単語 ● データ改変、追加が難しい – 適切な品詞で単語を追加できるか – 適切なスコア(頻度情報)を指定できるか
  • 13. 自由なデータを増やすには ● データ流通の拠点が必要 – Youtube – niconico – pixiv – instagram – flickr – Wikipedia ● … などのようなサイト
  • 14. 必要な機能 ● 著作権者の明確化 ● ライセンスの明確化 – flickrはCreativeCommonsが選択できる ● 一次著作物と二次著作物の関係性の明記 – niconicoにはコンテンツツリーがある ● コンテンツの評価機能 ● 専門知識を持つ編集者的存在
  • 15. 著名なプロジェクト ● Project Gutenberg ● 青空文庫 ● Internet Archive ● Wikipedia ● OpenStreetMap