20130203北大・ビッグデータとプライバシー

1,175 views

Published on

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,175
On SlideShare
0
From Embeds
0
Number of Embeds
13
Actions
Shares
0
Downloads
17
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

20130203北大・ビッグデータとプライバシー

  1. 1. ビッグデータとプライバシー NPO情報セキュリティ 研究所 上原哲太郎 twitter: @tetsutalow
  2. 2. よくある構図 クレーマー? イノベーションの テクノフォビ 危険!やめ 種なんですよ ア?なんとな て! イデオロギー? 利便性を く不安 個人情報漏洩 提供しますよ 事故が起きた そもそも個人情報 ら じゃないんですよ どうするの! 根深い対立・成立しない対 話 利用者 事業者 あちこち 間違いが
  3. 3. ビッグデータ・ビジネスの現状 研究ベースではさまざまな応用がある… ビジネスは…  カーナビのトラフィックデータから渋滞情報  ホンダのinternaviで1億km/月  東日本大震災では「通れる経路」の把握に威力  センサ+ソーシャル情報から局地的天気予報  ウェザーニュースは1日5000~30000通の情報  一番成功しつつあるのはマーケティング
  4. 4. 行動ターゲティングによる マーケティング手法 各顧客のサービス利用履歴・Web閲覧履歴 …等からプロファイリングして広告を打つ 手法 究極は顧客関係管理(CRM)によるマーケ 総務省:「ビッグデータの活用に関するアドホックグループの検討状
  5. 5. 顧客関係管理:CRM (Customer Relationship Management) 顧客データベースを元にしたマーケティング手法  各顧客について綿密なデータを取る  いつどんな商品を買ったか/返品したか等の購買記録  どんなクレームをしてきたか それにどう対応したか等の 応対記録  これらのデータを元に適切なマーケティングを行う手法 分野によっては昔からある手法  高額商品(家、車etc...)、家電製品等  医学の世界では常識 「ポイントカード」商法によって 一般小売に導入しやすくなった ネット販売とは適合性が高い (IDがある/強制できるから)
  6. 6. これが一番やりやすいのは 「ポイントカード」商法 マイレージ商法や電子マネーも同じ マーケティング上2つの効果がある  「ロイヤリティ」の向上  ポイントという実質の値引きを使って 『囲い込み』が可能に  ポイントは企業にとって負債になるが先送り可能  CRMの容易さ  住所氏名etcを登録してもらえればベストだが そうでなくても・・・ 実質上会員カードなのだがポイントという インセンティブで消費者の抵抗感を減らす
  7. 7. CRMは必ずしも「住所氏名」と 紐付けしなくてよい 403842は必ず 今日はイチゴが 果物を買うわね 特売ですよ 別の 日会員番号403842 403842 会員番号 02/02 豆腐 403842 !? 02/02 りんご 02/03 カレー粉 02/03 バナナ 02/04 肉 02/04 みかん
  8. 8. ターゲティング広告 パソコンで見るホームページ内のバナー広 告にサードパーティCookieを埋め込む OL募集中! 若い女性雑誌 のページ 132345さんは 安産祈願は… 若い女性? プレママ雑誌 妊娠中?? のページ XX産婦人科 自分の友達の 昔はバナー広告で追跡したが ブログ 今は広告のないページでも追跡可能に
  9. 9. 「データを増やせば精度が上が る」 共通ポイントカード:異業種を横断すること で多面的なプロファイリングが可能に  Tカード=ファミマ+TSUTAYA+ドラッグユタカ +…  Yahoo! Japanとの提携を発表 ネット上のポイント制度と統合(O2O)  Ponta=ローソン+ゲオ+HMV+Dental Ponta+… データエクスチェンジ市場の登場  行動履歴を市場化する
  10. 10. ターゲティングの行き着く先 日経ビジネス記事より: 買い物カゴの中身で妊娠を判定する~行動 心理学で企業は「習慣」という金脈を生み 出せるか 「統計学者は、独自のデータ分析によっ て、買い物カゴの内容から妊娠初期の女性 も高い確率で特定することができるという のだ。」 家族より早くスーパーが妊娠を知る是非
  11. 11. プライバシー的にこれでいいの か 個人情報保護法的にはどうなの? 個人情報とは… 「生存する個人に関する情報であって、特定 個人を識別できるもの・他の情報と容易に照 合することができ、個人が識別できるものを 含む」  「照合容易性」がなければ個人情報ではない  Q:IPアドレスは個人情報か? メールアドレスは個人情報か? では個人情報でないならよいのか?
  12. 12. どの情報を誰に 個人→ID→属性情報 渡したいかは 個人によって 異なる切ればIDは 住民票コード 生年月日個人情報でなくなる? 基礎年金番号 性別上原哲太郎 免許証番号… 住所 固定電話番号 Tカード番号… 勤務先 卒業校 Suica番号…容易照合性が 昨日行ったところ 会った人ない メールアドレス=リンクが弱け 昔の恋人 性癖れば問題ない? 携帯電話番号 ? 信じている宗教 ケータイID 支持政党 犯罪歴 性的嗜好 Cookie… かかっている病気
  13. 13. 固定ID問題  本人の身体もしくは行動に何らかの形で結び ついており、容易にその内容が変更できない 何らかのID(識別子)が存在する場合に可能 性あり  本人に意識されることなく収集されることが あれば、本人の望まない相手にもIDと「位 置」や「行動」等の情報が蓄積され、リスク が高まる  IDが何らかの理由で、望まぬ相手に本人識別 された瞬間にプライバシー侵害発生  例:ケータイID、モバイルルータのWiFiの MACアドレス、固定IPv6アドレス…CSS2012にて発表2B1-3: ワイヤレスデバイスのもたらすロケーションプライバシー問題に関する一考察
  14. 14. IDにリスクアセスメントが必 要 IDの性質を分類する必要  本人がそのIDの存在を意識できるか  本人識別性(本人確認)の強固さ  本人による変更や破棄の容易さ もしくは本人が意識せず変化するまでの時間  IDが取得された先や取得タイミング、 付随する属性情報が識別できるか  IDと結びつく属性の種類や蓄積先・量の制御可能性  IDが個人識別性を持ったときのリスクヘッジ
  15. 15. 属性情報もいろいろ 一般的機微性  差別の要因になりうるもの  思想信条の自由を阻害しかねないもの  ただし私企業の活動に後者がどう関係するか? 実際には個人により大きな幅  性同一性障害を持つ人の「性別」  DV被害を受けている人の「住所」
  16. 16. 属性情報も集まれば…
  17. 17. 属性情報→個人特定を 考える上でのカギ k-Anonymity(k-匿名性)  同一の属性情報の組み合わせが常にk人以上である状 態  属性情報による絞り込みではk人未満にできず個人特定不 能 l-diversity(l-多様性)  グループ内で属性の持つ値がl通り以上ある状態  知られたくない(機微性の高い)属性値が l通り未満に絞り込めず、属性情報が特定できない これらを維持したマイニングが Privacy Preserving Data Mining (PPDM) だがここにあるのは「個人識別性」の話がメイン
  18. 18. そもそも個人情報保護法の裏にあ る 「自己情報コントロール権」 何を持っている? 何に使っている? 内容は正確? 簡単に漏洩しない? 誰に渡している? 何を渡している? 本人の了解を得てい る? 入手経路は適切? 使用目的は明白? 何を入手している? 山田太郎67年8月9日生 住所:XXX TEL:012… 他企業・団体 企業・団体
  19. 19. セキュリティとプライバシーは しばしば混同される セキュリティとは「全体主義」  組織防衛のために行う プライバシーとは「個人主義」  個人の「感じ方の違い」を包み込む必要 「私は平気、あなたは気にしすぎ」は通用しない ならば必要なのは 「社会的に過負荷にならない程度の自己選択権」
  20. 20. じゃあ、どうすればいいの? まずは「何をやっているか」提示する 「サービス利用約款」「個人情報保護ポリ シー」 「プライバシーポリシー」に明記する …ただ…あまりにも長い 場所も判りにくい まして、「間違っていたりする」 これを是正していくこと  いわゆる「アリバイ的コンプライアンス」は×
  21. 21. その上で「オプトアウト」を保 証 追跡や個人情報収集・第三者提供を 「停止してくれ」と申し込むこと 例えばマイクロアド社の例 これにより自己選択権を 確保してゆく
  22. 22. 米国の最近の動き FTCによる「Do Not Track合意」  2010年 FTC「急変する時代の消費者プライバシー保 護」  特にターゲティング広告を行う事業者に対し 「統一的かつ包括的消費者選択の仕組み」を求め る  HTTPリクエストに「DNT:1」ヘッダを付加する  Digital Advertising Allianceとの間で実装合意  ブラウザへの実装が進むが…  Firefox, Safari, Chromeは「デフォルトオフ」  Internet Explorer 10 は「デフォルトオン」…
  23. 23. 続・米国の最近の動き 2012年2月22日 カリフォルニア州司法長官との合意  スマホアプリケーションに対する Amazon, Apple, Google, HP, Microsoft, RI Mとの合意  州オンラインプライバシー保護法に基づく プライバシーポリシーの明示  表示手段・領域・事業者の対応手続・BPなど取り 決め  「アプリ開発者」のプライバシーポリシー違反は 州の不正競争防止法・虚偽広告禁止法に違反
  24. 24. 米国プライバシー権利章典 2012年2月23日 オバマ政権発表 権利章典 Bill of Rights! 7つの原則  コントロール・透明性・「コンテキスト」の尊 重・ 安全性・アクセスと正確性・対象を絞った収集 説明責任 「プライバシー権は 民主主義に最初からあったものだ そして今、私たちは何よりも必要として
  25. 25. スマートフォンを経由した利用者情報の取扱いに関するWG(第3回筑波大学 石井夏生利先生の資料より
  26. 26. スマートフォンを経由した利用者情報の取扱いに関するWG(第3回筑波大学 石井夏生利先生の資料より
  27. 27. EUデータ保護指令→規則 データ保護指令(95年)  「全ての者は、自らに関する個人データを保護 する権利を有する。」  OECDガイドラインに沿った規定 +プライバシーコミッショナー制度(PIA)  第三国持ち出しについて規制 相手国に同等の規制を求める データ保護規則(現在は素案) 米国は「セーフハーバ協定」 日本は今だ未認証  「忘れられる権利」の明記  Privacy by Design など
  28. 28. SNSの登場が産んだ新しい問題 SNS問題:人の「つながり」のプライバ シー  AさんとBさんが「友達」である時に 「友達である」という事実は誰のもの?? 「連絡先」問題  住所やメールアドレス、電話番号はより活用 ニーズがあるが、実態が規制と乖離  個人識別子の代わりに活用するとさまざまな弊 害  例:FacebookやLINEにおける「連絡先」取得問 題
  29. 29. おわりに 個人情報漏洩じゃなく「プライバシー」を 語ろう  自分の情報はどこにあって誰が何に使っている か 意識できる・想像の範囲内に収まる世の中を  「意識の高い」人に選択権を 世界の議論に追随しよう  アクセルとブレーキの両方が必要  日本のビジネスの世界展開に障害? ビッグデータ内の「個別例外処理」という

×