*本資料の内容 (添付文書、リンク先などを含む) は de:code 2020 における公開日時点のものであり、予告なく変更される場合があります。
#decode20 #D01
AI・機械学習で新たに創出される
データとアノテーションビジネス
田丸 健三郎
日本マイクロソフト株式会社 業務執行役 NTO
柴野 相雄
TMI総合法律事務所 パートナー弁護士
本セッションについて
対象者
課題
ゴール
• AI開発者、AIを使用したシステムの購入者、学習用データの販売者
• AIとデータを取り巻く法的課題と責任について理解を深めます。
• AIとデータを取り巻く法的課題と対策、データ統制の重要性を理解。
セッションアジェンダ
• 重要性を増すデータの知的財産と法的責任
• 有識者により進む調査研究の最新状況
• 政府で検討が進むデータの保証とAIシステム
不透明さが増す
AIの活用
人と認知AIの為の
エンジニアリング
プラクティス
信頼性と
説明責任
公平性と
バイアス
人とAIの
相互作用とコ
ラボレーション
信頼性と
安全性
慎重な
AI活用
AI Ethics and Effects in Engineering and Research
確認すべき4つの事項
システムの
目的
1
実現可能
範囲
2
品質と
信頼性
3
注意を要す
るカテゴリ
4
注意を要するカテゴリ
社会的に重要なサービスの拒否
危害を与えるリスク
個人の自由
8
知的財産・契約
形を変えデータが永続するAIで
は従来と異なる取引、契約の考
え方が必要です。スマートコントラ
クトを用いた柔軟なデータ取引の
実現を目指します。
AI研究
コンソーシアムが取り組むデータ
収集・流通を通して、国内の大
学・研究機関等と連携し社会課
題の解決に資するAI研究を加
速していきます。
データ収集・活用
領域を問わず様々なデータをコ
ンソーシアムが提供するデータ基
盤を通じて提供するとともに、AI
による社会課題の解決に貢献し
ます。
データ基盤
様々な契約条件、基準、セ
キュリティ要件に対応した柔軟な
データ流通基盤を提供し、重要
性を増すデータ統制に対応しま
す。
9
知的財産 製造物責任 倫理・公平性
変化する価値 統合データ活用
10
de:code 2020
*本情報の内容 (添付文書、リンク先などを含む) は 公開日時点のものであり、予告なく変更される場合があります。
AI・機械学習で新たに創出される
データとアノテーションビジネス
柴野 相雄
TMI総合法律事務所 パートナー弁護士
慶應義塾大学法科大学院非常勤教員
• アノテーション作業、クレンジング作業
どのような権利が
発生
• 著作権
• 著作者 著作者人格権と著作権
いかなる方式の履行も
不要
AIベンダー、エンジニアが注意するべき法的事項
• 著作者 創作
• 著作物 創作的に表現
著作物 創作
著作物の創作と言えるか?
プログラムの著作物
• プログラム
表現したもの
• 但し、10条3項に注意。
その著作物を作成するために
用いるプログラム言語、規約及び解法に及ばない。
プログラム言語
規約
解法 プログラムにおける電子計算機に対する指令の組合せの方法をいう。
著作物の例示
次に掲げる場合その他の当該著作物に表現された思想又は感情を
自ら享受し又は他人に享受させることを目的としない場合
必要と認められる限度
• いずれの方法によるかを問わず、利用することができる。
著作権者
の利益を不当に害することとなる場合
著作権法30条の4
著作物の録音、録画その他の利用に係る技術の開発又は実用
化のための試験の用に供する場合
情報解析
の用に供
する場合
前二号に掲げる場合のほか
その他の利用
に供する場合
著作権法30条の4 続き
限定提供データ 業として特定の者に
提供する情報 電磁的方法
相当量蓄積 管理されている技術上又は営業上の
情報 秘密として管理されているものを除く。
「限定提供データ」としての保護
• 契約
• 契約 権利、義務というルール
• 信用できる特定のプラットフォーム上で、一定のルールに従って、
アノテーションデータ、クレンジングデータを流通させることが重要。
特別法による保護以外に保護する方法
de:code 2020
*本情報の内容 (添付文書、リンク先などを含む) は 公開日時点のものであり、予告なく変更される場合があります。
AI・機械学習で新たに創出される
データとアノテーションビジネス
田丸 健三郎
日本マイクロソフト株式会社 業務執行役 NTO
ソフトウェアを組み込んだ製造物については、本法の対象 と解される場合がありう
る。
ソフトウェアの不具合が当該製造物自体の欠陥
因果関係が認められるとき
損害賠償責任が生ずる
21
警告・説明表示欠陥
22
警告・説明表示欠陥原因?
23
身元確認 保証
24
1 2 3 4
データ量と品質
分布、ドメイン、品質保証とその
レベルより異なるデータの価値
25
順位 2018年 2019年
1 マジ卍 り
2 すこ パリピ
3 彼ピッピ タピる
4 バズる とりま
5 ワンチャン あね
6 パリピ それな
7 ズッ友 フロリダ
8 草 おけまる
9 ぷちょへんざ 乙
10 好きピ 草
バイドゥ「Simeji」
やばい!
このラーメンやばいよ!
美味しい!
このラーメン美味しいよ!
26
• 相反する限られたデータ
0
20
40
60
80
100
1 2 3 4
例:音声データ分布
系列1
系列2
系列3
系列4
系列5
ニーズにより異なるデータの価値
27
AIを使用することによる影響が想
定可能、且つ使用者に限定され
許容可能である。
AIを使用することによる影響が想
定可能であり、補償もしくは回復
可能である。
AIを使用することにより身体、社
会権に影響を及ぼす可能性があ
る、若しくは補償、回復が困難で
ある。
用途により異なるデータに求める保証レベル
「AI利活用ガイドライン」 (総務省)
https://www.soumu.go.jp/main_content/000637097.pdf
1. 適正利用の原則
2. 適正学習の原則
3. 連携の原則
4. 安全の原則
5. セキュリティの原則
6. プライバシーの原則
7. 尊厳・自立の原則
8. 公平性の原則
9. 透明性の原則
10.アカウンタビリティの原則
「透明性の原則」の論点の1つ
行政機関が利用する際の透明性の確保
行政機関がAIを利用する場合には、法の支配、行政の透明性確保、適正手続等の
要請を踏まえ、AIを利活用する際の社会的文脈に応じ、AIの判断結果の説明可能性
を確保することが期待される。なお、説明可能性を向上させるため、例えば以下の
方法などが考えられる。
[説明可能性を向上させるための方法の例]
⚫ 行政機関が利用するAIのアルゴリズムの開発・設計プロセスに、様々な社会的少
数派を包摂すること(コ・デザイン)
⚫ 学習データの構成の考え方(学習データへの包摂・排除の考え方)、アルゴリズ
ムの設計段階において行った政策的判断、AIを導入することによる社会的影響評
価、AIに対する監査方法等を説明すること
⚫ AIの判断を説明する諸要素について、開発者やAIサービスプロバイダが不開示と
する範囲を限定した形で開発者やAIサービスプロバイダと契約を締結すること
利用者側の責任とは
責任
31
権利、個人情報は整理され
ているのか?説明責任は果
たせるのか
© 2018 Microsoft Corporation. All rights reserved.
本情報の内容(添付文書、リンク先などを含む)は、作成日時点でのものであり、予告なく変更される場合があります。
© 2020 Microsoft Corporation. All rights reserved.
本情報の内容 (添付文書、リンク先などを含む) は、公開日時点のものであり、予告なく変更される場合があります。
本コンテンツの著作権、および本コンテンツ中に出てくる商標権、団体名、ロゴ、製品、サービスなどはそれぞれ、各権利保有者に帰属します。

【de:code 2020】 AI・機械学習で新たに創出されるデータとアノテーションビジネス