秘密計算とは?
- 4. A校の成績データ
B校の成績データ
C校の成績データ
氏名 学年 国語 数学
A 高1 20 70
B 高2 50 50
C 高3 40 60
氏名 学年 国語 数学
D 高1 90 80
E 高2 90 30
F 高3 60 50
氏名 学年 国語 数学
G 高1 60 60
H 高2 90 70
I 高3 50 30
氏名、名前、学年、成績
→ 秘密情報
→ 漏洩させてはならない
→ 秘匿する
・ 学年別の平均点
・ 教科別の平均点
各校で成績を開示できないので
計算できない
簡単な例
- 5. A校の成績データ
B校の成績データ
C校の成績データ
氏名 学年 国語 数学
gyr vgh dx gj
ygu gho xf cj
yyu ghh xy xf
氏名 学年 国語 数学
gho jnk duo tfu
hkh gjo ufi cti
qwe vgh ery ibo
氏名 学年 国語 数学
vib vbu dss Ji^
vip vin cip vyg
vir tyi uok aeq
① データの秘匿化する
定められた秘匿化方法
でデータを秘匿化
② 秘密計算システムに送信
秘匿化
秘匿化
秘匿化
秘密計算システム
簡単な例
- 17. 機密データ10 機密データ15
5 2 3 6 7 2
5 6 3 22 7
秘密計算 秘密計算秘密計算
11 59
25
① 秘密分散
② 機密データ
を開示せず
に加算
③ 復号(加算)
例:10+15
Editor's Notes
- まず、秘密計算とは何かということを説明します。
秘密計算を一言でいうとデータを秘匿したまま各種計算ができる技術のことです。
互いのデータを開示せずに、データと関係なく演算結果のみが分かるという特徴があります。
- ここで簡単な例をいくつかあげます。
まず、投票についてです。
例えば、どのエディタが好きですかという質問があったとしましょう。
VSCodeとかVimとか色々ありますが、ここで互いに手をあげて、VSCodeが好きな人などと投票すると互いにどのエディタが好きなのかが見えてしまい宗教戦争になりかねません。
では、皆さんが全員が目をつぶり、投票をすればどうでしょうか。
これも十分ではありません。集計をする僕には誰がどのエディタが好きなのかわかってしまい。こいつはEmacsが好きだから敵だなとか認識してしまいます。
そこで秘密計算を使えば、個々人の投票データすなわち好きなエディタは秘匿化されますから、集計者である僕を含めて簡単に言えば、全員が目をつぶった状態でどのエディタが一番人気なのかを知れるのです。
- 学校は他の機関に名前や学年、成績を漏洩させてはならない。→ 機密情報で秘匿しなければならない
A校、B校、C校が互いにデータが
開示できないとき
他の機関が・ 学年別の平均点・ 教科別の平均点
が知りたいときに計算できない!
→ 秘密計算を使う!
- システムは、入力である秘密情報から任意のある処理を行い、その結果を出力するもの
例)クレジットカード認証システム
クレジットカード番号や有効期限などの情報を秘密情報として、そのクレジットカードで決済可能であるかないかを結果として返す。
- ・ データの安全性を保つという目的も、もちろん存在する。秘密計算によって通信経路、システム内で秘匿化できる
・ 個人情報を明かさずにデータの解析を行う。
→ 個人が紐づいた(例えば、購買データと閲覧履歴とか)データ解析をしたい両者のデータを相互に公開できない
→ じゃあ仮名化とか匿名化すればいいじゃないのか
→ いやいや特定の人物が識別できないように加工されるから意味ないよね
→ ある個人が何をしているのかという相関をとりたいわけだから意味がない
→ その点秘密計算では、個人に紐づいたデータをプライバシーを保ったまま解析できる
・ データの統計的な傾向を知ること
〇〇さんが何々ということをしているから、〇〇さんには何々をしようみたいなことはできない
あくまでも全体的にどんな傾向を持っているのかとか、平均的にどんな点数なのかみたいなことを知るのが目的
- Web検索会社は、検索履歴を持っている
ネット通販会社は、購買履歴を持っている
これらを組み合わせれば、どのようなキーワードを検索した人が商品を購入しやすいのかなどの情報を得られる。
しかし、それぞれのプライバシーは守らなければならない。だから秘密計算する
これによって、より効果的なターゲティング広告を行うことができる
- 次に実用的な例をいくつかあげてみましょう。
まず、秘密分散と秘匿通信技術を用いた電子カルテ保管、交換システムです。
秘密計算の方法の一種である秘密分散という技術と秘匿通信技術を使い、電子カルテのバックアップをセキュアに素早く復元できるシステムです。
模擬データでは、衛星通信を用いて9秒以内に復元できるということで、災害時の素早いカルテのや複数の医療機関での電子カルテの相互参照などへの応用が期待されています。
- 次に秘密計算技術を利用して、データを暗号化したままディープラーニングを実行できるという研究を紹介します。
従来、ディープラーニングは暗号化してデータをシステムに送ってもサーバで復元して学習を行ってきました。
サーバで復元されるのでプライバシーの問題で提供できないデータもあり、十分な学習が行えないという問題がありました。
例えば、MRIやレントゲンなどの医療データがその一つとしてあげられます。
そこで、秘密計算を使って、ディープラーニングができるようになれば、医療データを秘匿したまま学習ができるので高速かつ正確に病気を発見できるということにつながります。
- アニメーションをつける(To do)