SlideShare a Scribd company logo
1 of 10
コンシューマーコレ
ティブデータ(CCD)
及び多分野横断デー
タ分析領域について
伊豫田旭彦
何をしたいの?
ユーザーが好き勝手集めたデータを1つのリポジトリに集結
させ、
そのデータ収集手法及び信頼性を向上する研究を行い、
データのクレンジング及び構造化をし、
多分野を横断する分析手法を確立したい。
背景と目的
データ分析の研究は、現実のデータ爆発からたちおくれてい
る。
例えば放射能測定データ、ライフログデータ、GPS情報、
tweet情報、ニコニコ動画で大量に投稿される動画に付随する
時系列メタデータ(再生数、タグ、コメント)など、現在の
世の中にはあらゆるデータがあふれている。
それらは研究のために個人がそれぞれの手法で収集し、分析
している。そしてそれらのデータは公開されず、眠ったまま
となっている。その上、データ収集の信頼性、データのクレ
ンジングと構造化の信頼性、そして分析の妥当性は議論され
ないまま結果だけが漂っているのが現状である。
CGMの原則を用い、各領域の専門化が「疎結合」して上手く
結果が出るようなメカニズムを設計する。また、データ収集
の上で問題となる倫理的法的問題を、グレーゾーンのまま回
対象領域
      • データスクレイピング領域
        • ネット及びリアルのデータを収集することを目的とする。
集める

      • データクレンジング領域
        • データのクレンジング・構造化を目的とする。
綺麗に

      • 多分野データ横断分析領域
        • 多分野のデータを統合し、分析する手法の確立を目的とす
分析        る。
ごめん
見栄張っ
面白い分析
結果見たい
だけ。
面白いってなんだ?
新規性がある
注がれた労力がすごい
アイディアやコンセプトが独
自
便利でスマートで効率的
内輪ネタ
どうやったらデータ分析領域で
面白いものが集まるんだ?
面白い人を集める。
面白い発表をする場ですよ、と期待す
る。
発表者の話を聞いてあげる
成果を誰かが使えるようにする。
法的なグレーゾーンを上手く扱う。
            ニコニコ学会βを参考に
具体的にどうやんの?
野良データリポジトリを作る
 →法的にグレイなままデータを集める
デファクトスタンダードなスキーマを作
る
 →TSVとか超分かりやすいヤツを
みんながコミットしたくなるゴールを作
る
 →政府やGoogleのデータ公開?
定期的に集まるイベントを作る
データで
もっと面白く。

More Related Content

Similar to ニコニコ学会データ分析研究会 第一回伊豫田発表 全体について

楽天のECにおけるAI技術の活用
楽天のECにおけるAI技術の活用楽天のECにおけるAI技術の活用
楽天のECにおけるAI技術の活用Rakuten Group, Inc.
 
研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて
研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて
研究活動の新たな常識としてのデータ出版・データ引用の実現に向けてMasahito Nose
 
「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜Keiichiro Ono
 
Cross-modality meta-survey of dataset
Cross-modality meta-survey of datasetCross-modality meta-survey of dataset
Cross-modality meta-survey of datasetcvpaper. challenge
 
deep learningによるCTスキャン画像シーケンスの3次元セグメンテーションからのMixed Realityでの活用
deep learningによるCTスキャン画像シーケンスの3次元セグメンテーションからのMixed Realityでの活用deep learningによるCTスキャン画像シーケンスの3次元セグメンテーションからのMixed Realityでの活用
deep learningによるCTスキャン画像シーケンスの3次元セグメンテーションからのMixed Realityでの活用Naoji Taniguchi
 
大規模ネットワーク分析 篠田
大規模ネットワーク分析 篠田大規模ネットワーク分析 篠田
大規模ネットワーク分析 篠田Kosuke Shinoda
 
2017年度 河野ゼミ スタートアップ資料
2017年度 河野ゼミ スタートアップ資料2017年度 河野ゼミ スタートアップ資料
2017年度 河野ゼミ スタートアップ資料義広 河野
 
Modeling Mass Protest Adoption in Social Network Communities using Geometric ...
Modeling Mass Protest Adoption in Social Network Communities using Geometric ...Modeling Mass Protest Adoption in Social Network Communities using Geometric ...
Modeling Mass Protest Adoption in Social Network Communities using Geometric ...Takanori Nakai
 
データ駆動型実世界計測におけるセンサ配置とデータ収集を支援するシステムの開発(EC2019)
データ駆動型実世界計測におけるセンサ配置とデータ収集を支援するシステムの開発(EC2019)データ駆動型実世界計測におけるセンサ配置とデータ収集を支援するシステムの開発(EC2019)
データ駆動型実世界計測におけるセンサ配置とデータ収集を支援するシステムの開発(EC2019)sugiuralab
 
包括的な可視性を確立し、潜在するセキュリティの問題を見つけ出す
包括的な可視性を確立し、潜在するセキュリティの問題を見つけ出す 包括的な可視性を確立し、潜在するセキュリティの問題を見つけ出す
包括的な可視性を確立し、潜在するセキュリティの問題を見つけ出す Elasticsearch
 
社会人博士入試面接スライド(ヘテロ加速器環境でのデータストリームグラフ処理フレームワーク)
社会人博士入試面接スライド(ヘテロ加速器環境でのデータストリームグラフ処理フレームワーク)社会人博士入試面接スライド(ヘテロ加速器環境でのデータストリームグラフ処理フレームワーク)
社会人博士入試面接スライド(ヘテロ加速器環境でのデータストリームグラフ処理フレームワーク)亮 神林
 
ソーシャルメディアによる情報拡散モデル
ソーシャルメディアによる情報拡散モデルソーシャルメディアによる情報拡散モデル
ソーシャルメディアによる情報拡散モデルDaisuke Sashida
 
マイクロジオデータ研究会5年間の歩み
マイクロジオデータ研究会5年間の歩みマイクロジオデータ研究会5年間の歩み
マイクロジオデータ研究会5年間の歩みYuki Akiyama
 
20230203_LT資料.pptx
20230203_LT資料.pptx20230203_LT資料.pptx
20230203_LT資料.pptxssusered6b1f
 
20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司
20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司
20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司Insight Technology, Inc.
 
ビッグデータプロジェクトを加速させるための 仕組みと運用
ビッグデータプロジェクトを加速させるための仕組みと運用ビッグデータプロジェクトを加速させるための仕組みと運用
ビッグデータプロジェクトを加速させるための 仕組みと運用Eiji Sasahara, Ph.D., MBA 笹原英司
 
どこでも使えるIoTを目指して 〜さくらインターネットのIoTへの取り組み〜
どこでも使えるIoTを目指して 〜さくらインターネットのIoTへの取り組み〜どこでも使えるIoTを目指して 〜さくらインターネットのIoTへの取り組み〜
どこでも使えるIoTを目指して 〜さくらインターネットのIoTへの取り組み〜法林浩之
 

Similar to ニコニコ学会データ分析研究会 第一回伊豫田発表 全体について (20)

楽天のECにおけるAI技術の活用
楽天のECにおけるAI技術の活用楽天のECにおけるAI技術の活用
楽天のECにおけるAI技術の活用
 
研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて
研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて
研究活動の新たな常識としてのデータ出版・データ引用の実現に向けて
 
「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
「数字を見せろ」から「コードを見せろ」へ 〜過程の透明性を確保したデータ可視化を目指す〜
 
Cross-modality meta-survey of dataset
Cross-modality meta-survey of datasetCross-modality meta-survey of dataset
Cross-modality meta-survey of dataset
 
150607ACN
150607ACN150607ACN
150607ACN
 
tut_pfi_2012
tut_pfi_2012tut_pfi_2012
tut_pfi_2012
 
deep learningによるCTスキャン画像シーケンスの3次元セグメンテーションからのMixed Realityでの活用
deep learningによるCTスキャン画像シーケンスの3次元セグメンテーションからのMixed Realityでの活用deep learningによるCTスキャン画像シーケンスの3次元セグメンテーションからのMixed Realityでの活用
deep learningによるCTスキャン画像シーケンスの3次元セグメンテーションからのMixed Realityでの活用
 
大規模ネットワーク分析 篠田
大規模ネットワーク分析 篠田大規模ネットワーク分析 篠田
大規模ネットワーク分析 篠田
 
2017年度 河野ゼミ スタートアップ資料
2017年度 河野ゼミ スタートアップ資料2017年度 河野ゼミ スタートアップ資料
2017年度 河野ゼミ スタートアップ資料
 
Modeling Mass Protest Adoption in Social Network Communities using Geometric ...
Modeling Mass Protest Adoption in Social Network Communities using Geometric ...Modeling Mass Protest Adoption in Social Network Communities using Geometric ...
Modeling Mass Protest Adoption in Social Network Communities using Geometric ...
 
データ駆動型実世界計測におけるセンサ配置とデータ収集を支援するシステムの開発(EC2019)
データ駆動型実世界計測におけるセンサ配置とデータ収集を支援するシステムの開発(EC2019)データ駆動型実世界計測におけるセンサ配置とデータ収集を支援するシステムの開発(EC2019)
データ駆動型実世界計測におけるセンサ配置とデータ収集を支援するシステムの開発(EC2019)
 
包括的な可視性を確立し、潜在するセキュリティの問題を見つけ出す
包括的な可視性を確立し、潜在するセキュリティの問題を見つけ出す 包括的な可視性を確立し、潜在するセキュリティの問題を見つけ出す
包括的な可視性を確立し、潜在するセキュリティの問題を見つけ出す
 
社会人博士入試面接スライド(ヘテロ加速器環境でのデータストリームグラフ処理フレームワーク)
社会人博士入試面接スライド(ヘテロ加速器環境でのデータストリームグラフ処理フレームワーク)社会人博士入試面接スライド(ヘテロ加速器環境でのデータストリームグラフ処理フレームワーク)
社会人博士入試面接スライド(ヘテロ加速器環境でのデータストリームグラフ処理フレームワーク)
 
ソーシャルメディアによる情報拡散モデル
ソーシャルメディアによる情報拡散モデルソーシャルメディアによる情報拡散モデル
ソーシャルメディアによる情報拡散モデル
 
マイクロジオデータ研究会5年間の歩み
マイクロジオデータ研究会5年間の歩みマイクロジオデータ研究会5年間の歩み
マイクロジオデータ研究会5年間の歩み
 
20230203_LT資料.pptx
20230203_LT資料.pptx20230203_LT資料.pptx
20230203_LT資料.pptx
 
20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司
20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司
20150630_ビッグデータプロジェクトを加速させるための仕組みと運用 -米国の最新フレームワーク動向とデータアドミニストレータの役割の変化- by 笹原英司
 
ビッグデータプロジェクトを加速させるための 仕組みと運用
ビッグデータプロジェクトを加速させるための仕組みと運用ビッグデータプロジェクトを加速させるための仕組みと運用
ビッグデータプロジェクトを加速させるための 仕組みと運用
 
どこでも使えるIoTを目指して 〜さくらインターネットのIoTへの取り組み〜
どこでも使えるIoTを目指して 〜さくらインターネットのIoTへの取り組み〜どこでも使えるIoTを目指して 〜さくらインターネットのIoTへの取り組み〜
どこでも使えるIoTを目指して 〜さくらインターネットのIoTへの取り組み〜
 
ビッグデータ
ビッグデータビッグデータ
ビッグデータ
 

Recently uploaded

論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 

Recently uploaded (10)

論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 

ニコニコ学会データ分析研究会 第一回伊豫田発表 全体について