More Related Content
More from Hiroshi Nakagawa (20)
K匿名と濡れ衣
- 2. 「世界最先端IT 国家創造宣言について」
平成25 年6 月14 日閣議決定(抜粋)
• 個人情報やプライバシー保護に配慮したパーソナルデータの利
活用のルールを明確化した上で、個人情報保護ガイドラインの
見直し、同意取得手続の標準化等の取組を年内できるだけ早
期に着手
ところが、ショーンベルガー&クキエ等の「ビッグデータの正体」8,9
章によれば、将来サービスの予見は無理である以上、同意取得
じゃダメ。サービス提供側に責任を持たせる法体系を提案
• さらに、2014 年以降に、制度見直し方針に示されたロードマップ
に従って、国際的な連携にも配慮しつつ、順次パーソナルデー
タ利活用環境を整備し、利活用を推進する。
- 4. 匿名化の弱点:link attack
• Sweeney [S02a] によれば、Massachussetts州知事の医
療記録が公開情報から特定可能
– MA では、収集した医療データを匿名化して公開している
(下図) 左円内
– 一方、選挙の投票者名簿は公開 右円内
• 両者をつきあわせると
•
6 人が知事と同じ生年月日
うち3 人が男
うち1 人が同じzipcode
民族
来院日
郵便番号
診断
生年月日
処方
性別
支払額
病院記録
• 1990年の the US 1990 census dataによれば
選挙人名簿
名前
登録日
政党
前回投票履歴
[S02a]より
– 87% の人が (zipcode, 性別, 生年月日)によって一意特定可能
- 11. 濡れ衣とは心理現象 その2
• 匿名化されて同一グループに入った k人中、
濡れ衣の対象になる怪しいこと(例えば、消
費者金融ショップに居た)Sに実際当てはまっ
た人数をs(>0)とする。このようなグループの
状況を情報文脈 C とする。
• 濡れ衣にあう確率:p(s,k)=1-s/k
• ただし、この匿名化されたデータを見た人が
Sに疑いを持つ主観確率をp 𝑠𝑢𝑏