ビッグデータにおいて何故プライバシーが課題となるのか       NPO情報セキュリティ       研究所       上原哲太郎        twitter: @tetsutalow
よくある構図                                クレーマー?                   イノベーションの種   テクノフォビア?                     なんですよ     イデオロギー?な...
ビッグデータ・ビジネスの現状 研究ベースではさまざまな応用がある… ビジネスは…  カーナビのトラフィックデータから渋滞情報   ホンダのinternaviで1億km/月   東日本大震災では「通れる経路」の把握に威力  センサ+ソ...
行動ターゲティングによる  マーケティング手法 各顧客のサービス利用履歴・Web閲覧履歴…  等からプロファイリングして広告を打つ手法 究極は顧客関係管理(CRM)によるマーケ    総務省:「ビッグデータの活用に関するアドホックグループの...
顧客関係管理:CRM      (Customer Relationship Management) 顧客データベースを元にしたマーケティング手法  各顧客について綿密なデータを取る    いつどんな商品を買ったか/返品したか等の購買記録...
これが一番やりやすいのは   「ポイントカード」商法 マイレージ商法や電子マネーも同じ マーケティング上2つの効果がある  「ロイヤリティ」の向上   ポイントという実質の値引きを使って    『囲い込み』が可能に     ポイントは...
CRMは必ずしも「住所氏名」と         紐付けしなくてよい               403842は必ず                今日はイチゴが               果物を買うわね                   特...
広がるポイントカードの共通化 主な共通ポイントカード  Tカード=ファミマ+TSUTAYA+ドラッグユタカ+…   最近Yahoo! Japanとの提携を発表    ネット上のポイント制度と統合  Ponta=ローソン+ゲオ+HMV+D...
ターゲティング広告 パソコンで見るホームページ内のバナー広告  にサードパーティCookieを埋め込む       OL募集中!       若い女性雑誌       のページ                         132345さん...
ターゲティングの行き着く先 日経ビジネス記事より:  買い物カゴの中身で妊娠を判定する~行動心  理学で企業は「習慣」という金脈を生み出せる  か 「統計学者は、独自のデータ分析によって、買  い物カゴの内容から妊娠初期の女性も高い確  率...
プライバシー的にこれでいいのか 個人情報保護法的にはどうなの? 個人情報とは…  「生存する個人に関する情報であって、特定個  人を識別できるもの・他の情報と容易に照合す  ることができ、個人が識別できるものを含む」  「照合容易性」がな...
どの情報を誰に         個人→ID→属性情報                      渡したいかは                                         個人によって                     ...
固定ID問題   本人の身体もしくは行動に何らかの形で結びつい    ており、容易にその内容が変更できない何らかの    ID(識別子)が存在する場合に可能性あり   本人に意識されることなく収集されることがあれ    ば、本人の望まない相...
IDにリスクアセスメントが必要 IDの性質を分類する必要  本人がそのIDの存在を意識できるか  本人識別性(本人確認)の強固さ  本人による変更や破棄の容易さ   もしくは本人が意識せず変化するまでの時間  IDが取得された先や取得...
属性情報もいろいろ 一般的機微性  差別の要因になりうるもの  思想信条の自由を阻害しかねないもの   ただし私企業の活動に後者がどう関係するか? 実際には個人により大きな幅  性同一性障害を持つ人の「性別」  DV被害を受けてい...
属性情報も集まれば…
属性情報→個人特定を     考える上でのカギ k-Anonymity(k-匿名性)   同一の属性情報の組み合わせが常にk人以上である状態     属性情報による絞り込みではk人未満にできず個人特定不能 l-diversity(l-多...
そもそも個人情報保護法の裏にある       「自己情報コントロール権」               何を持っている?               何に使っている?                内容は正確?              簡単に漏...
なぜ「自己情報コントロール権」が   重要なのか? セキュリティとは「全体主義」  組織防衛のために行う プライバシーとは「個人主義」  個人の「感じ方の違い」を包み込む必要     「私は平気、あなたは気にしすぎ」は通用しない    ...
じゃあ、どうすればいいの? まずは「何をやっているか」提示する 「サービス利用約款」「個人情報保護ポリシー」  「プライバシーポリシー」に明記する …ただ…あまりにも長い  場所も判りにくい  まして、「間違っていたりする」  これを是正...
その上で「オプトアウト」を保証 追跡や個人情報収集・第三者提供を  「停止してくれ」と申し込むこと 例えばマイクロアド社の例 これにより自己選択権を  確保してゆく
米国の最近の動き FTCによる「Do Not Track合意」  2010年   FTC「急変する時代の消費者プライバシー保護」    特にターゲティング広告を行う事業者に対し     「統一的かつ包括的消費者選択の仕組み」を求める   ...
続・米国の最近の動き 2012年2月22日  カリフォルニア州司法長官との合意  スマホアプリケーションに対する   Amazon, Apple, Google, HP, Microsoft,   RIMとの合意  州オンラインプライバシ...
米国プライバシー権利章典 2012年2月23日 オバマ政権発表 権利章典 Bill of Rights! 7つの原則  コントロール・透明性・「コンテキスト」の尊重・   安全性・アクセスと正確性・対象を絞った収集   説明責任 「プ...
スマートフォンを経由した利用者情報の取扱いに関するWG(第3回)筑波大学 石井夏生利先生の資料より
スマートフォンを経由した利用者情報の取扱いに関するWG(第3回)筑波大学 石井夏生利先生の資料より
EUデータ保護指令→規則 データ保護指令(95年)  「全ての者は、自らに関する個人データを保護する   権利を有する。」  OECDガイドラインに沿った規定   +プライバシーコミッショナー制度(PIA)  第三国持ち出しについて規制...
SNSの登場が産んだ新しい問題 SNS問題:人の「つながり」のプライバシー  AさんとBさんが「友達」である時に   「友達である」という事実は誰のもの?? 「連絡先」問題  住所やメールアドレス、電話番号はより活用ニー   ズがある ...
おわりに 個人情報漏洩じゃなく「プライバシー」を語ろう  自分の情報はどこにあって誰が何に使っているか   意識できる・想像の範囲内に収まる世の中を  「意識の高い」人に選択権を 世界の議論に追随しよう  アクセルとブレーキの両方が必...
Upcoming SlideShare
Loading in …5
×

2012年10月26日 サイエンティフィックシステム研究会(SS研) ビッグデータにおいて何故プライバシーが問題になるのか

743 views

Published on

http://www.ssken.gr.jp/MAINSITE/download/newsletter/2012/20121025-joint/index.html

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
743
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
12
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

2012年10月26日 サイエンティフィックシステム研究会(SS研) ビッグデータにおいて何故プライバシーが問題になるのか

  1. 1. ビッグデータにおいて何故プライバシーが課題となるのか NPO情報セキュリティ 研究所 上原哲太郎 twitter: @tetsutalow
  2. 2. よくある構図 クレーマー? イノベーションの種 テクノフォビア? なんですよ イデオロギー?なんとなく 危険!やめて! 利便性を 不安 個人情報漏洩 提供しますよ 事故が起きたら そもそも個人情報 どうするの! じゃないんですよ 根深い対立・成立しない対話 利用者 事業者 あちこち 間違いが
  3. 3. ビッグデータ・ビジネスの現状 研究ベースではさまざまな応用がある… ビジネスは…  カーナビのトラフィックデータから渋滞情報  ホンダのinternaviで1億km/月  東日本大震災では「通れる経路」の把握に威力  センサ+ソーシャル情報から局地的天気予報  ウェザーニュースは1日5000~30000通の情報  一番成功しつつあるのはマーケティング
  4. 4. 行動ターゲティングによる マーケティング手法 各顧客のサービス利用履歴・Web閲覧履歴… 等からプロファイリングして広告を打つ手法 究極は顧客関係管理(CRM)によるマーケ 総務省:「ビッグデータの活用に関するアドホックグループの検討状況」
  5. 5. 顧客関係管理:CRM (Customer Relationship Management) 顧客データベースを元にしたマーケティング手法  各顧客について綿密なデータを取る  いつどんな商品を買ったか/返品したか等の購買記録  どんなクレームをしてきたか それにどう対応したか等の 応対記録  これらのデータを元に適切なマーケティングを行う手法 分野によっては昔からある手法  高額商品(家、車etc...)、家電製品等  医学の世界では常識 「ポイントカード」商法によって 一般小売に導入しやすくなった ネット販売とは適合性が高い (IDがある/強制できるから)
  6. 6. これが一番やりやすいのは 「ポイントカード」商法 マイレージ商法や電子マネーも同じ マーケティング上2つの効果がある  「ロイヤリティ」の向上  ポイントという実質の値引きを使って 『囲い込み』が可能に  ポイントは企業にとって負債になるが先送り可能  CRMの容易さ  住所氏名etcを登録してもらえればベストだが そうでなくても・・・ 実質上会員カードなのだがポイントという インセンティブで消費者の抵抗感を減らす
  7. 7. CRMは必ずしも「住所氏名」と 紐付けしなくてよい 403842は必ず 今日はイチゴが 果物を買うわね 特売ですよ 別の 日会員番号403842 403842 会員番号 02/02 豆腐 403842 !? 02/02 りんご 02/03 カレー粉 02/03 バナナ 02/04 肉 02/04 みかん
  8. 8. 広がるポイントカードの共通化 主な共通ポイントカード  Tカード=ファミマ+TSUTAYA+ドラッグユタカ+…  最近Yahoo! Japanとの提携を発表 ネット上のポイント制度と統合  Ponta=ローソン+ゲオ+HMV+Dental Ponta+… 異業種を横断することで多面的な プロファイリングが可能になる
  9. 9. ターゲティング広告 パソコンで見るホームページ内のバナー広告 にサードパーティCookieを埋め込む OL募集中! 若い女性雑誌 のページ 132345さんは 安産祈願は… 若い女性? プレママ雑誌 妊娠中?? のページ XX産婦人科 自分の友達の 昔はバナー広告で追跡したのが ブログ 今は広告のないページでも追跡
  10. 10. ターゲティングの行き着く先 日経ビジネス記事より: 買い物カゴの中身で妊娠を判定する~行動心 理学で企業は「習慣」という金脈を生み出せる か 「統計学者は、独自のデータ分析によって、買 い物カゴの内容から妊娠初期の女性も高い確 率で特定することができるというのだ。」 家族より早くスーパーが妊娠を知る是非
  11. 11. プライバシー的にこれでいいのか 個人情報保護法的にはどうなの? 個人情報とは… 「生存する個人に関する情報であって、特定個 人を識別できるもの・他の情報と容易に照合す ることができ、個人が識別できるものを含む」  「照合容易性」がなければ個人情報ではない  Q:IPアドレスは個人情報か? メールアドレスは個人情報か? では個人情報でないならよいのか?
  12. 12. どの情報を誰に 個人→ID→属性情報 渡したいかは 個人によって 異なる切ればIDは 住民票コード 生年月日個人情報でなくなる? 基礎年金番号 性別上原哲太郎 免許証番号… 住所 固定電話番号 Tカード番号… 勤務先 卒業校 Suica番号…容易照合性が 昨日行ったところ 会った人ない メールアドレス=リンクが弱け 昔の恋人 性癖れば問題ない? 携帯電話番号 ? 信じている宗教 ケータイID 支持政党 犯罪歴 性的嗜好 Cookie… かかっている病気
  13. 13. 固定ID問題  本人の身体もしくは行動に何らかの形で結びつい ており、容易にその内容が変更できない何らかの ID(識別子)が存在する場合に可能性あり  本人に意識されることなく収集されることがあれ ば、本人の望まない相手にもIDと「位置」や「行 動」等の情報が蓄積され、リスクが高まる  IDが何らかの理由で、望まぬ相手に本人識別さ れた瞬間にプライバシー侵害発生  例:ケータイID、モバイルルータのWiFiのMACア ドレス、固定IPv6アドレス…CSS2012にて発表予定2B1-3: ワイヤレスデバイスのもたらすロケーションプライバシー問題に関する一考察
  14. 14. IDにリスクアセスメントが必要 IDの性質を分類する必要  本人がそのIDの存在を意識できるか  本人識別性(本人確認)の強固さ  本人による変更や破棄の容易さ もしくは本人が意識せず変化するまでの時間  IDが取得された先や取得タイミング、 付随する属性情報が識別できるか  IDと結びつく属性の種類や蓄積先・量の制御可能性  IDが個人識別性を持ったときのリスクヘッジ
  15. 15. 属性情報もいろいろ 一般的機微性  差別の要因になりうるもの  思想信条の自由を阻害しかねないもの  ただし私企業の活動に後者がどう関係するか? 実際には個人により大きな幅  性同一性障害を持つ人の「性別」  DV被害を受けている人の「住所」
  16. 16. 属性情報も集まれば…
  17. 17. 属性情報→個人特定を 考える上でのカギ k-Anonymity(k-匿名性)  同一の属性情報の組み合わせが常にk人以上である状態  属性情報による絞り込みではk人未満にできず個人特定不能 l-diversity(l-多様性)  グループ内で属性の持つ値がl通り以上ある状態  知られたくない(機微性の高い)属性値が l通り未満に絞り込めず、属性情報が特定できない これらを維持したマイニングが Privacy Preserving Data Mining (PPDM) だがここにあるのは「個人識別性」の話がメイン
  18. 18. そもそも個人情報保護法の裏にある 「自己情報コントロール権」 何を持っている? 何に使っている? 内容は正確? 簡単に漏洩しない? 誰に渡している? 何を渡している? 本人の了解を得ている? 入手経路は適切? 使用目的は明白? 何を入手している? 山田太郎67年8月9日生 住所:XXX TEL:012… 他企業・団体 企業・団体
  19. 19. なぜ「自己情報コントロール権」が 重要なのか? セキュリティとは「全体主義」  組織防衛のために行う プライバシーとは「個人主義」  個人の「感じ方の違い」を包み込む必要 「私は平気、あなたは気にしすぎ」は通用しない ならば必要なのは 「社会的に過負荷にならない程度の自己選択権」
  20. 20. じゃあ、どうすればいいの? まずは「何をやっているか」提示する 「サービス利用約款」「個人情報保護ポリシー」 「プライバシーポリシー」に明記する …ただ…あまりにも長い 場所も判りにくい まして、「間違っていたりする」 これを是正していくこと  いわゆる「アリバイ的コンプライアンス」は×
  21. 21. その上で「オプトアウト」を保証 追跡や個人情報収集・第三者提供を 「停止してくれ」と申し込むこと 例えばマイクロアド社の例 これにより自己選択権を 確保してゆく
  22. 22. 米国の最近の動き FTCによる「Do Not Track合意」  2010年 FTC「急変する時代の消費者プライバシー保護」  特にターゲティング広告を行う事業者に対し 「統一的かつ包括的消費者選択の仕組み」を求める  HTTPリクエストに「DNT:1」ヘッダを付加する  Digital Advertising Allianceとの間で実装合意  ブラウザへの実装が進むが…  Firefox, Safari, Chromeは「デフォルトオフ」  Internet Explorer 10 は「デフォルトオン」??
  23. 23. 続・米国の最近の動き 2012年2月22日 カリフォルニア州司法長官との合意  スマホアプリケーションに対する Amazon, Apple, Google, HP, Microsoft, RIMとの合意  州オンラインプライバシー保護法に基づく プライバシーポリシーの明示  表示手段・領域・事業者の対応手続・BPなど取り決め  「アプリ開発者」のプライバシーポリシー違反は 州の不正競争防止法・虚偽広告禁止法に違反
  24. 24. 米国プライバシー権利章典 2012年2月23日 オバマ政権発表 権利章典 Bill of Rights! 7つの原則  コントロール・透明性・「コンテキスト」の尊重・ 安全性・アクセスと正確性・対象を絞った収集 説明責任 「プライバシー権は 民主主義に最初からあったものだ そして今、私たちは何よりも必要としている」
  25. 25. スマートフォンを経由した利用者情報の取扱いに関するWG(第3回)筑波大学 石井夏生利先生の資料より
  26. 26. スマートフォンを経由した利用者情報の取扱いに関するWG(第3回)筑波大学 石井夏生利先生の資料より
  27. 27. EUデータ保護指令→規則 データ保護指令(95年)  「全ての者は、自らに関する個人データを保護する 権利を有する。」  OECDガイドラインに沿った規定 +プライバシーコミッショナー制度(PIA)  第三国持ち出しについて規制 データ保護規則(現在は素案)  「忘れられる権利」の明記  Privacy by Design など
  28. 28. SNSの登場が産んだ新しい問題 SNS問題:人の「つながり」のプライバシー  AさんとBさんが「友達」である時に 「友達である」という事実は誰のもの?? 「連絡先」問題  住所やメールアドレス、電話番号はより活用ニー ズがある  個人識別子の代わりに活用するとさまざまな弊害  例:FacebookやLINEにおける「連絡先」取得問題
  29. 29. おわりに 個人情報漏洩じゃなく「プライバシー」を語ろう  自分の情報はどこにあって誰が何に使っているか 意識できる・想像の範囲内に収まる世の中を  「意識の高い」人に選択権を 世界の議論に追随しよう  アクセルとブレーキの両方が必要  日本のビジネスの世界展開に障害? ビッグデータ内の「個別例外処理」という 問題が今後大きな課題になるのでは?

×