Your SlideShare is downloading. ×
0
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
20120628ビッグデータとプライバシー
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

20120628ビッグデータとプライバシー

738

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
738
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
17
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. ビッグデータとプライバシー NPO情報セキュリティ 研究所 上原哲太郎 twitter: @tetsutalow
  • 2. ビッグデータとは? 分析が困難な巨大なデータ(の解析手法)  構造化されたものに加え非構造化データも対象 しかし急速にバズワード化  単なる「データマイニング」の言い換えの場合 も?
  • 3. 総務省:「ビッグデータの活用に関するアドホックグループの検討状況
  • 4. 総務省:「ビッグデータの活用に関するアドホックグループの検討状況
  • 5. 各国が大規模投資を表明 米国 ビッグデータ研究開発イニシアチブ “Big data is a big deal” (3月29日)  NSF, NIH, DOE, DOD, DARPA, USGSを 通じて2億ドル以上を投資 総務省 情報通信審議会 情報通信政策部 会 新事業創出戦略委員会・研究開発戦略 委員会「ビッグデータの活用に関するアド ホックグループ」報告(4月27日)  国内各社へのヒアリングを元に課題を抽出  平成25年度予算に反映予定
  • 6. 総務省:「ビッグデータの活用に関するアドホックグループの検討状況
  • 7. ビッグデータ・ビジネスの現状 研究ベースではさまざまな応用がある… ビジネスは…  カーナビのトラフィックデータから渋滞情報  ホンダのinternaviで1億km/月  東日本大震災では「通れる経路」の把握に威力  センサ+ソーシャル情報から局地的天気予報  ウェザーニュースは1日5000~30000通の情報  一番成功しつつあるのはマーケティング
  • 8. 行動ターゲティングによる マーケティング手法 各顧客のサービス利用履歴・Web閲覧履歴 …等からプロファイリングして広告を打つ 手法 究極は顧客関係管理(CRM)によるマーケ 総務省:「ビッグデータの活用に関するアドホックグループの検討状
  • 9. 顧客関係管理:CRM (Customer Relationship Management) 顧客データベースを元にしたマーケティング手法  各顧客について綿密なデータを取る  いつどんな商品を買ったか/返品したか等の購買記録  どんなクレームをしてきたか それにどう対応したか等の 応対記録  これらのデータを元に適切なマーケティングを行う手法 分野によっては昔からある手法  高額商品(家、車etc...)、家電製品等  医学の世界では常識 「ポイントカード」商法によって 一般小売に導入しやすくなった ネット販売とは適合性が高い (IDがある/強制できるから)
  • 10. アマゾンはCRMをフル活用購買履歴や「クリック」の履歴から、購買欲をそそる商品をリスト
  • 11. これが一番やりやすいのは 「ポイントカード」商法 マイレージ商法や電子マネーも同じ マーケティング上2つの効果がある  「ロイヤリティ」の向上  ポイントという実質の値引きを使って 『囲い込み』が可能に  ポイントは企業にとって負債になるが先送り可能  CRMの容易さ  住所氏名etcを登録してもらえればベストだが そうでなくても・・・ 実質上会員カードなのだが ポイントという「餌」で消費者の抵抗感を
  • 12. CRMは必ずしも「住所氏名」と 紐付けしなくてよい 403842は必ず 今日はイチゴが 果物を買うわね 特売ですよ 別の 日会員番号403842 403842 会員番号 02/02 豆腐 403842 !? 02/02 りんご 02/03 カレー粉 02/03 バナナ 02/04 肉 02/04 みかん
  • 13. 購買履歴から判ることは多い 日経ビジネス記事より: 買い物カゴの中身で妊娠を判定する~行動 心理学で企業は「習慣」という金脈を生み 出せるか 「統計学者は、独自のデータ分析によっ て、買い物カゴの内容から妊娠初期の女性 も高い確率で特定することができるという のだ。」
  • 14. 広がるポイントカードの共通化 主な共通ポイントカード  Tカード=ファミマ+TSUTAYA+ドラッグユタカ +…  最近Yahoo! Japanとの提携を発表 ネット上のポイント制度と統合  Ponta=ローソン+ゲオ+HMV+Dental Ponta+… 異業種を横断することで多面的な プロファイリングが可能になる
  • 15. 最近流行のターゲティング広告 パソコンで見るホームページ内のバナー広 告にサードパーティCookieを埋め込む OL募集中! 若い女性雑誌 のページ 132345さんは 安産祈願は… 若い女性? プレママ雑誌 妊娠中?? のページ XX産婦人科 自分の友達の 昔はバナー広告で追跡したのが ブログ 今は広告のないページでも追跡
  • 16. マーケティングにとって SNSは宝の山? 「類は友を呼ぶ」はず→クラスタ化の補助 に 言及されているURLや「いいね!」は 単なる閲覧履歴以上の意味を持つはず ただ必ずしも成功してないという話も?
  • 17. プライバシー的にこれでいいの か 個人情報保護法的にはどうなの? 個人情報とは… 「生存する個人に関する情報であって、特定 個人を識別できるもの・他の情報と容易に照 合することができ、個人が識別できるものを 含む」  「照合容易性」がなければ個人情報ではない  Q:IPアドレスは個人情報か? メールアドレスは個人情報か? つまり、「匿名化」がカギ?
  • 18. 個人→ID→属性情報切れば匿名? 住民票コード 生年月日 基礎年金番号 性別上原哲太郎 免許証番号… 住所 固定電話番号 Tカード番号… 勤務先 卒業校 Suica番号… 昨日行ったところ 会った人リンクが メールアドレス 昔の恋人 性癖弱ければ 携帯電話番号 ?問題ない? 信じている宗教 ケータイID 支持政党 犯罪歴 性的嗜好 Cookie… かかっている病気
  • 19. 属性情報も集まれば…
  • 20. 属性情報→個人特定を 考える上でのカギ k-Anonymity(k-匿名性)  同一の属性情報の組み合わせが 常にk人以上である状態(k人未満に絞り込めな い) l-diversity(l-多様性)  属性の持つ値がl通り以上ある状態 これらを維持したマイニングが Privacy Preserving Data Mining (PPDM)
  • 21. そもそも個人情報保護法の裏にあ る 「自己情報コントロール権」 何を持っている? 何に使っている? 内容は正確? 簡単に漏洩しない? 誰に渡している? 何を渡している? 本人の了解を得てい る? 入手経路は適切? 使用目的は明白? 何を入手している? 山田太郎67年8月9日生 住所:XXX TEL:012… 他企業・団体 企業・団体
  • 22. なぜ「自己情報コントロール 権」が 重要なのか? セキュリティとは「全体主義」  組織防衛のために行う プライバシーとは「個人主義」  個人の「感じ方の違い」を包み込む必要 「私は平気、あなたは気にしすぎ」は通用しない ならば必要なのは 「社会的に過負荷にならない程度の自己選択権」
  • 23. じゃあ、どうすればいいの? まずは「何をやっているか」提示する 「サービス利用約款」 「個人情報保護ポリシー」 「プライバシーポリシー」に明記する! …ただ…あまりにも長い 場所も判りにくい まして、「間違っていたりする」 これを是正していくこと
  • 24. その上で「オプトアウト」を保 証 追跡や個人情報収集・第三者提供を 「停止してくれ」と申し込むこと 例えばマイクロアド社の例 これにより自己選択権を 確保してゆく
  • 25. 米国の最近の動き FTCによる「Do Not Track合意」  2010年 FTC「急変する時代の消費者プライバシー保 護」  特にターゲティング広告を行う事業者に対し 「統一的かつ包括的消費者選択の仕組み」を求め る  HTTPリクエストに「DNT:1」ヘッダを付加する  Digital Advertising Allianceとの間で実装合意  ブラウザへの実装が進むが…  Firefox, Safariは「デフォルトオフ」  Internet Explorer 10 は「デフォルトオン」??
  • 26. 続・米国の最近の動き 2012年2月22日 カリフォルニア州司法長官との合意  スマホアプリケーションに対する Amazon, Apple, Google, HP, Microsoft, RI Mとの合意  州オンラインプライバシー保護法に基づく プライバシーポリシーの明示  表示手段・領域・事業者の対応手続・BPなど取り 決め  「アプリ開発者」のプライバシーポリシー違反は 州の不正競争防止法・虚偽広告禁止法に違反と
  • 27. 米国プライバシー権利章典 2012年2月23日 オバマ政権発表 権利章典 Bill of Rights! 7つの原則  コントロール・透明性・「コンテキスト」の尊 重・ 安全性・アクセスと正確性・対象を絞った収集 説明責任 「プライバシー権は 民主主義に最初からあったものだ そして今、私たちは何よりも必要として
  • 28. スマートフォンを経由した利用者情報の取扱いに関するWG(第3回筑波大学 石井夏生利先生の資料より
  • 29. スマートフォンを経由した利用者情報の取扱いに関するWG(第3回筑波大学 石井夏生利先生の資料より
  • 30. EUデータ保護指令→規則 データ保護指令(95年)  「全ての者は、自らに関する個人データを保護 する権利を有する。」  OECDガイドラインに沿った規定 +プライバシーコミッショナー制度(PIA)  第三国持ち出しについて規制 データ保護規則(2012年?)  「忘れられる権利」の明記  Privacy by Design など
  • 31. 日本も「成熟した」 プライバシー論が必要 「個人(識別)情報」が漏洩するかどうか は どちらかというと「セキュリティの問題」 そうではなく「プライバシー」を語ろう  自分の情報はどこにあって誰が何に使っている か 意識できる・想像の範囲内に収まる世の中 ビッグデータの海の中で 技術者・研究者は何ができるか?

×