Submit Search
Upload
Wikipedia における情報の質
•
3 likes
•
1,641 views
Yu Suzuki
Follow
1126 に DBS 研究会で行われた発表の資料です.
Read less
Read more
Technology
Report
Share
Report
Share
1 of 49
Download now
Download to read offline
Recommended
「ご清聴ありがとうございました」 いつ,どこからはじまったのか分からないこの悪習. 絶たねばならない.
ご清聴ありがとうございました(テンプレートその1)
ご清聴ありがとうございました(テンプレートその1)
鈴鹿工業高等専門学校
ダウンロードしてご利用下さい。 スライドは自動で切り替わります。 ご清聴スライドについて考える会「GOSEICHO会」 (旧:ご清聴ありがとうございました撲滅委員会) 最後のスライドは,発表内容の骨子が一覧できるようなサマリにしましょう。
ご清聴ありがとうございました で、質疑応答に入るのはやめましょう(白)
ご清聴ありがとうございました で、質疑応答に入るのはやめましょう(白)
Yoshiaki Nakano
This is the talk I gave January 12, 2017 at the G20/OECD Conference on the Digital Future in Berlin. I talk about fitness landscapes as applied to technology and business, the role of unchecked financialization in the state of our politics and economy, and why technology really wants to create jobs, not destroy them. (There is a separate PDF version, but some readers said the notes were too fuzzy to read.)
WTF - Why the Future Is Up to Us - pptx version
WTF - Why the Future Is Up to Us - pptx version
Tim O'Reilly
http://kulibrarians.g.hatena.ne.jp/kulibrarians/20020731/1318075702
20020731 ku-librarians勉強会 #34 : 大学図書館にもとめられるもの
20020731 ku-librarians勉強会 #34 : 大学図書館にもとめられるもの
kulibrarians
静大情報学部オープンキャンパス ミニ講義CS系で使ったスライド。
静大情報学部オープンキャンパス ミニ講義CS系
静大情報学部オープンキャンパス ミニ講義CS系
Shohei Yokoyama
http://kulibrarians.g.hatena.ne.jp/kulibrarians/20090827/1290515677
20090827 ku-librarians勉強会 #114 : Wikipediaをいかに使いこなすか? ---知識抽出、情報ナビゲーション、そしてトピ...
20090827 ku-librarians勉強会 #114 : Wikipediaをいかに使いこなすか? ---知識抽出、情報ナビゲーション、そしてトピ...
kulibrarians
Otsuma(2010706)
Otsuma(2010706)
真 岡本
2015年12月5日に行われる『デジタルの際』(河島茂生編著, 聖学院大学出版会, 2014)のトークイベントでのスライド資料。
ソシオナイト Vol.02「デジタル社会のなかで僕たちは出会う」_河島資料
ソシオナイト Vol.02「デジタル社会のなかで僕たちは出会う」_河島資料
茂生 河島
Recommended
「ご清聴ありがとうございました」 いつ,どこからはじまったのか分からないこの悪習. 絶たねばならない.
ご清聴ありがとうございました(テンプレートその1)
ご清聴ありがとうございました(テンプレートその1)
鈴鹿工業高等専門学校
ダウンロードしてご利用下さい。 スライドは自動で切り替わります。 ご清聴スライドについて考える会「GOSEICHO会」 (旧:ご清聴ありがとうございました撲滅委員会) 最後のスライドは,発表内容の骨子が一覧できるようなサマリにしましょう。
ご清聴ありがとうございました で、質疑応答に入るのはやめましょう(白)
ご清聴ありがとうございました で、質疑応答に入るのはやめましょう(白)
Yoshiaki Nakano
This is the talk I gave January 12, 2017 at the G20/OECD Conference on the Digital Future in Berlin. I talk about fitness landscapes as applied to technology and business, the role of unchecked financialization in the state of our politics and economy, and why technology really wants to create jobs, not destroy them. (There is a separate PDF version, but some readers said the notes were too fuzzy to read.)
WTF - Why the Future Is Up to Us - pptx version
WTF - Why the Future Is Up to Us - pptx version
Tim O'Reilly
http://kulibrarians.g.hatena.ne.jp/kulibrarians/20020731/1318075702
20020731 ku-librarians勉強会 #34 : 大学図書館にもとめられるもの
20020731 ku-librarians勉強会 #34 : 大学図書館にもとめられるもの
kulibrarians
静大情報学部オープンキャンパス ミニ講義CS系で使ったスライド。
静大情報学部オープンキャンパス ミニ講義CS系
静大情報学部オープンキャンパス ミニ講義CS系
Shohei Yokoyama
http://kulibrarians.g.hatena.ne.jp/kulibrarians/20090827/1290515677
20090827 ku-librarians勉強会 #114 : Wikipediaをいかに使いこなすか? ---知識抽出、情報ナビゲーション、そしてトピ...
20090827 ku-librarians勉強会 #114 : Wikipediaをいかに使いこなすか? ---知識抽出、情報ナビゲーション、そしてトピ...
kulibrarians
Otsuma(2010706)
Otsuma(2010706)
真 岡本
2015年12月5日に行われる『デジタルの際』(河島茂生編著, 聖学院大学出版会, 2014)のトークイベントでのスライド資料。
ソシオナイト Vol.02「デジタル社会のなかで僕たちは出会う」_河島資料
ソシオナイト Vol.02「デジタル社会のなかで僕たちは出会う」_河島資料
茂生 河島
情報処理学会第81回全国大会での発表資料です. https://www.gakkai-web.net/gakkai/ipsj/81/event/html/event/B-9.html 本スライドに出てくる学会は明示しているものを除き,特定の学会や集会を指したものではありません.また,ある特定の学会について成否を評価,改善を要求することを目的としたものではありません.最後にある意見は私が想定したものであって,特定の人物についてではありません. 本スライドのライセンスは CC-BY です.適切に引用元を表示していれば,商用・非商用を問わずどのような利用も可能です. 訂正:2017年のWebDBのベビーシッター代は無料だったそうです.2,000円じゃなかった.
4歳の子供を連れて学会に参加してみた
4歳の子供を連れて学会に参加してみた
Yu Suzuki
Wikimedia Conference Japan 2013で発表したプレゼンテーションです
Wikimedia Conference Japan 2013 情報の信頼度測定
Wikimedia Conference Japan 2013 情報の信頼度測定
Yu Suzuki
This is a
Wikisym 2012
Wikisym 2012
Yu Suzuki
F3-2: 信頼度を考慮した知識の構造化
F3-2: 信頼度を考慮した知識の構造化
Yu Suzuki
F3 2
F3 2
Yu Suzuki
DEIM F1-1: CredibilityRank: 編集履歴と著者情報を用いたWikipedia の記事信頼度算出手法
DEIM F1-1: CredibilityRank: 編集履歴と著者情報を用いたWikipedia の記事信頼度算出手法
Yu Suzuki
Wikipedia ws
Wikipedia ws
Yu Suzuki
2010年7月合同研究会
2010年7月合同研究会
Yu Suzuki
Wikipedia の情報信頼性検証技術
Wikipedia の情報信頼性検証技術
Yu Suzuki
The slides presented at Wikimedia Conference Japan (wcj2009).
Wikimedia Conference 2009 presentation
Wikimedia Conference 2009 presentation
Yu Suzuki
ICDE 2007 Overview Presentation
ICDE 2007 Overview Presentation
ICDE 2007 Overview Presentation
Yu Suzuki
Jue Wang, Wentao Zhu, Pichao Wang, Xiang Yu, Linda Liu, Mohamed Omar, Raffay Hamid, " Selective Structured State-Spaces for Long-Form Video Understanding" CVPR2023 https://openaccess.thecvf.com/content/CVPR2023/html/Wang_Selective_Structured_State-Spaces_for_Long-Form_Video_Understanding_CVPR_2023_paper.html
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
This is an introduction to MAPPO's paper.
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
LoRaWANスマート距離検出センサー DS20Lカタログ
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
2024年5月8日 Power Platform 勉強会 #1 LT資料
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
2024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Syed Talal Wasim, Muzammal Naseer, Salman Khan, Ming-Hsuan Yang, Fahad Shahbaz Khan , "Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Grounding" arXiv2024 https://arxiv.org/abs/2401.00901v2
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
2022年10月27日に社内向けに開催した勉強会資料の社外公開版です(発表8分程度)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
2024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Key topics covered: - Understanding Ballerina's role in integrations: features and advantages - Designing and implementing REST APIs for integration - Designing and implementing GraphQL services with Ballerina - Monitoring and observing applications - Introduction to data integration
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
More Related Content
More from Yu Suzuki
情報処理学会第81回全国大会での発表資料です. https://www.gakkai-web.net/gakkai/ipsj/81/event/html/event/B-9.html 本スライドに出てくる学会は明示しているものを除き,特定の学会や集会を指したものではありません.また,ある特定の学会について成否を評価,改善を要求することを目的としたものではありません.最後にある意見は私が想定したものであって,特定の人物についてではありません. 本スライドのライセンスは CC-BY です.適切に引用元を表示していれば,商用・非商用を問わずどのような利用も可能です. 訂正:2017年のWebDBのベビーシッター代は無料だったそうです.2,000円じゃなかった.
4歳の子供を連れて学会に参加してみた
4歳の子供を連れて学会に参加してみた
Yu Suzuki
Wikimedia Conference Japan 2013で発表したプレゼンテーションです
Wikimedia Conference Japan 2013 情報の信頼度測定
Wikimedia Conference Japan 2013 情報の信頼度測定
Yu Suzuki
This is a
Wikisym 2012
Wikisym 2012
Yu Suzuki
F3-2: 信頼度を考慮した知識の構造化
F3-2: 信頼度を考慮した知識の構造化
Yu Suzuki
F3 2
F3 2
Yu Suzuki
DEIM F1-1: CredibilityRank: 編集履歴と著者情報を用いたWikipedia の記事信頼度算出手法
DEIM F1-1: CredibilityRank: 編集履歴と著者情報を用いたWikipedia の記事信頼度算出手法
Yu Suzuki
Wikipedia ws
Wikipedia ws
Yu Suzuki
2010年7月合同研究会
2010年7月合同研究会
Yu Suzuki
Wikipedia の情報信頼性検証技術
Wikipedia の情報信頼性検証技術
Yu Suzuki
The slides presented at Wikimedia Conference Japan (wcj2009).
Wikimedia Conference 2009 presentation
Wikimedia Conference 2009 presentation
Yu Suzuki
ICDE 2007 Overview Presentation
ICDE 2007 Overview Presentation
ICDE 2007 Overview Presentation
Yu Suzuki
More from Yu Suzuki
(11)
4歳の子供を連れて学会に参加してみた
4歳の子供を連れて学会に参加してみた
Wikimedia Conference Japan 2013 情報の信頼度測定
Wikimedia Conference Japan 2013 情報の信頼度測定
Wikisym 2012
Wikisym 2012
F3-2: 信頼度を考慮した知識の構造化
F3-2: 信頼度を考慮した知識の構造化
F3 2
F3 2
DEIM F1-1: CredibilityRank: 編集履歴と著者情報を用いたWikipedia の記事信頼度算出手法
DEIM F1-1: CredibilityRank: 編集履歴と著者情報を用いたWikipedia の記事信頼度算出手法
Wikipedia ws
Wikipedia ws
2010年7月合同研究会
2010年7月合同研究会
Wikipedia の情報信頼性検証技術
Wikipedia の情報信頼性検証技術
Wikimedia Conference 2009 presentation
Wikimedia Conference 2009 presentation
ICDE 2007 Overview Presentation
ICDE 2007 Overview Presentation
Recently uploaded
Jue Wang, Wentao Zhu, Pichao Wang, Xiang Yu, Linda Liu, Mohamed Omar, Raffay Hamid, " Selective Structured State-Spaces for Long-Form Video Understanding" CVPR2023 https://openaccess.thecvf.com/content/CVPR2023/html/Wang_Selective_Structured_State-Spaces_for_Long-Form_Video_Understanding_CVPR_2023_paper.html
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
This is an introduction to MAPPO's paper.
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
LoRaWANスマート距離検出センサー DS20Lカタログ
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
2024年5月8日 Power Platform 勉強会 #1 LT資料
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
2024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Syed Talal Wasim, Muzammal Naseer, Salman Khan, Ming-Hsuan Yang, Fahad Shahbaz Khan , "Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Grounding" arXiv2024 https://arxiv.org/abs/2401.00901v2
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
2022年10月27日に社内向けに開催した勉強会資料の社外公開版です(発表8分程度)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
2024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Key topics covered: - Understanding Ballerina's role in integrations: features and advantages - Designing and implementing REST APIs for integration - Designing and implementing GraphQL services with Ballerina - Monitoring and observing applications - Introduction to data integration
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
Recently uploaded
(11)
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
Wikipedia における情報の質
1.
情報処理学会 第158回データベースシステム研究会 招待講演 (17:45-18:45) 国際交流ホールIII @京都大学 Wikipediaにおける情報の質 名古屋大学
大学院 情報科学研究科 鈴木 優
2.
発表の流れ Wikipediaにおける情報の質 1. 質とは何か 2. Wikipediaについて 3.
どのようにして質を測定するか 4. 今後の展望 !2
3.
考え方 クラウドソーシングが産み出す知識の限界に挑戦 Wikipediaは一つのテストケース 様々な特徴は他と共通する部分もある 多くの利用者が協調して記述している文書を対象 !3
4.
質とは何か
5.
“記事には間違いもあるが、信頼性は相対的に高い” –Jimmy Wales (Wikipedia創始者)
6.
“だいたいオレは150センチ台でもないのに 嘘の情報でよくこれだけ盛り上がれるよ” –L’Arc∼en∼Ciel HYDE (身長
161 cm)
7.
Wikipediaは質が高いのか? Wikipediaは質が高い 裁判の資料として用いられた ブリタニカと比較して質が高いという調査結果 レポートにコピーされることもしばしば Wikipediaは質が低い 誰でも記述できる=誰もレビューしていない 専門的なことはほとんど書かれていない 誤った情報を探すのは容易 !7
8.
Wikipediaは質が高いのか? Wikipediaは質が高い 裁判の資料として用いられた ブリタニカと比較して質が高いという調査結果 のか レポートにコピーされることもしばしば な は何 と Wikipediaは質が低い質 も もそ そ 誰でも記述できる=誰もレビューしていない 専門的なことはほとんど書かれていない 誤った情報を探すのは容易 !7
9.
質とは何か 「真実が書かれている = 質が高い」ではない 「地球は回っている」は質が高いか 今は誰もが真実だと思っている 昔は真実だと誰も思っていなかった 昔,計算機があっても,地球が回っているこ とを計算機だけで判定することは困難 誰も真実を知らないこともある 誰もが知っている常識が真実であるとは限らない 哲学的な問題に帰着するので定式化が困難 !8
10.
質とは何か 広辞苑での定義 対象が他の対象と区別する特色となって いるもの 人の主観によるもの 色々な意味で使われる「質」 利用しやすい(検索機能が充実) 何かに認められた実績がある 計算機上でどのように質を扱うか? !9
11.
信憑性の定義 心理学における定義 [Fogg et
al., CHI 99 ] Trustworthiness believability どれだけ多くの人に信じられているか 比較的主観的な尺度 Expertise 専門性 比較的客観的な尺度 !10
12.
その他の尺度 紙による百科事典を評価する方法 [Wong, 2011] 9種類の要素 取り扱う範囲,構成,独自性,権威,正確性,最新性,使いやすさ,利 用者の要求との関連度,価格 利用しやすさについての定義 真実であるかどうかを検証
[Sheppardら] 3種類の要素 信憑性,正確性,整合性 市民科学コミュニティにおける検証 ニセ科学のようなものを検証するため 誤った情報が存在 < 情報が不存在 本当かどうかを質の定義としている !11
13.
Wikipediaについて
14.
Wikipediaに関する研究 主に二つの方向性 Wikipediaを利用して様々な知的資源を生成 DBPedia, YAGO2,… Wikipediaそのものを解析 本講演で扱う範囲 !13
15.
Wikipedia について 閲覧者から見たWikipedia 記事の状況 編集者はなぜ貢献する? Wikipediaの統治方法
16.
Wikipediaは使われている? White による調査(2007年) 70%∼84% の利用者がWikipediaを利用 Blogは40%∼60% Facebook
は 5%∼20% 利用用途 50%∼60% は仕事,学習 Blog は 20%程度 参考文献として利用されるWebサービスとしては最多 !15
17.
利用者はWikipediaをどう思っている? Flanagin らによる調査 ブリタニカとCitizendiumとの比較 Citizendium: 査読付きWikipedia アンケート 若年層(11∼18歳):
183人 成人層(18歳以上): 283人 結果 若年層は成人層よりもWIkipediaを信じていない 70%∼80%はWikipediaをUGCであると理解していない 特に成人層では顕著 !16
18.
Wikipedia について 閲覧者から見たWikipedia 記事の状況 編集者はなぜ貢献する? Wikipediaの統治方法
19.
編集者の貢献割合を図示 History Flow [Viegas
et al. CHI 2004] IBM による,Wikipediaの可視化に関する一番最初の研究 妊娠中絶(英語版)の編集履歴を可視化 編集合戦の様子などを観察できる NY にある MoMA で展示されていた 引用: http://www.bewitched.com/historyflow.html !18
20.
Wikipedia Revision History 木構造による編集履歴の表現
[Sabel, WikiSym 2007] 拡大 !19
21.
Wikipedia Revision History 木構造による解析
[Wu et al. WikiSym 2013] Savel らはテキストブロック の追加削除を利用 Wu らはバージョンごとの 共通文字列を利用 !20
22.
編集者のバイアスによる表現 グラフによる表現 [Nakamura et
al. WI 2013] テキストの追記・削 除を利用 編集者の可視化 編集合戦が起こるよ うなページに有効 日本語版記事「原子力発電所」 !21
23.
Wikipedia について 閲覧者から見たWikipedia 記事の状況 編集者はなぜ貢献する? Wikipediaの統治方法
24.
Wikipediaを編集する動機 なぜWikipediaを編集するのか Wikipediaは充実する ⇄ 対価は発生しない Yang
らによる調査 内的自己概念を満たすため 内的自己概念 = 自分の思う「状況のあるべき 姿」を実現するため 外的自己概念 = 他の人が思う「状況のあるべ き姿」を実現することとは相関関係が少ない !23
25.
Wikipedia について 閲覧者から見たWikipedia 記事の状況 編集者はなぜ貢献する? Wikipediaの統治方法
26.
不適切な記述への対応 不適切な記述とは 百科事典としてふさわしくない 明白に誤っている 著作権法などの法令に違反している 不適切な記述は削除される 平均2分で削除 不適切な記事を閲覧する割合は 0.007% 多くの理由は著作権違反によるもの !25
27.
質の測定方法
28.
質の測定方法を分類 人手による方法 正確さ (trustworthiness),専門度 (Expertise) 半自動的な方法 投票 悪意のある投票の判定 自動的な方法 編集内容 記事間リンク 編集者間の相互評価 !27
29.
人手: 正確さの観点から Giles による調査(2005) Natureの編集者による目視 Wikipediaとブリタニカには信頼度に大きな差がない 紙の百科事典よりも質が高い記事が数多く存在 未完成の記事も多い ブリタニカ社はこれに反論 Wikimedia財団はこれに対応するために,一部の記 事における詳細なレポートを作成 !28
30.
人手: 専門度の観点から Chesney による調査 専門家グループと非専門家グループで評価 編集者と記事を対象 編集者に対する評価は有意差なし 専門家は記事を信憑性が高いと評価する傾向 ただし13%の記事で誤りを見つけた !29
31.
人手による手法: まとめ 一部の記事をサンプルとして評価 ある程度の傾向をつかむことはできる 全体としてどうなっているかは分からない どの記事を評価したかによって評価が変わる 評価は主観的 定量的な測定は難しい !30
32.
半自動的な手法 投票による方法 !31
33.
Wikipedia Feedback Tool 英語版などいくつかのページで採用 信憑性,主観性,完全性,記述の完成度の四つで判定 あまり利用されていない.現在も取り外されている. !32
34.
悪意のある投票 悪意がある投票を特定する方法が必要 コメント文から SPAM かどうかを特定する方法
[Ott] 利用者の振る舞いからSPAMを判定する方法 [Mukherjee et al.] ある特定の記事に集中して投票をすると SPAMで ある可能性が高い !33
35.
半自動: 利点と欠点 利点 利用者の直感を反映することができる システムとして比較的簡易(集計するだけ) 質の算出根拠が明確 欠点 利用者は必ずしも正当な評価を行うわけではない YouTube ではほとんど
5 か 1,2-4 はほとんど無 [Singer] Wikipedia では 90.9%の投票が最高点 78.6% の記事はまだ未完成にも関わらず 2012年1月の「食べログ」における評価の社会問題化 有用な評価かどうかを判定する手法の必要性 !34
36.
自動的な方法: 編集内容による方法 様々な統計量の利用 単語数 [Blumenstock] 編集回数や編集者数
[Lih, Wilkinson] 差し戻し回数 [Viegas] 記事の安定性 [Doudio] 記述の変更が少ない = 質が高い 編集者間の対立 [Kittur] 残存率と利用者の投票の組合せ [Kramer] !35
37.
自動的な方法: 編集内容による方法 様々な統計量の利用(続き) 文体 [Emigh] 記事をジャンルで分類しコーパス構築 文体の硬さを計測 複数の特徴量の融合
[Stvilla] 何を特徴量として用いるかよりも,どのように統 合するかが質の値に大きく影響 記事間のリンク [Bellomi, Wu] Wikipedia 内で HITS や PageRank を利用 !36
38.
残存率による方法 良質 = 多くの人から信頼されている バージョン [Adler,
Hu, Suzuki] 編集履歴 2 A B Aの記述 Aの記述 C は A の記述を 残した 削除した = B は A を信頼 1 B は A の記述を = C は A を信頼せず ○ B 3 C A A × C 編集者相互の関係 !37
39.
二つの問題点 計算時間がかかる 質算出する編集者を削減し計算時間を削減 [鈴木09] 30-40% の計算時間でほぼ精度が変化しない 悪質な編集者からの攻撃に弱い 多重アカウントによる攻撃
(Sybil Attack) 一度で行うべき編集を複数人で行っているかどう かを検出 [Chatterjee ら] 質が高い記述を削除,低い記述を残存 (Zig-zag Attack) 編集者とテキストの質を交互に測定 [Suzuki 2013] !38
40.
Zig-zag Attack の解決 A 1.テキストの質を測定 2.編集者の質を測定 A’s
text ○ 3.編集者の質を使ってテキストの質 × を測定 4.テキストの質を使って編集者の質 C B を測定 5.収束するまで 3. と 4. を繰り返す B’s text B’s text !39
41.
Zig-zag Attack の解決 A 1.テキストの質を測定 2.編集者の質を測定 A’s
text ○ 3.編集者の質を使ってテキストの質 × を測定 4.テキストの質を使って編集者の質 C B を測定 5.収束するまで 3. と 4. を繰り返す B’s text B’s text !39
42.
自動的な手法の利点と欠点 利点 客観的な質の測定が可能 人の意見が直接反映されにくい 欠点 人間による主観の利用が困難 質は人間の主観であるにも関わらず 文体を利用することによる解決 何に対して質を算出するのかも重要な論点 記述の一部,全体,編集者,… !40
43.
今後の研究展望
44.
今後の展望 質とは何かを測定する尺度は様々 Wikipedia内部で得られる情報を利用したものが主 Wikipedia以外の情報を利用することも考えられる 出典,… より直感的な質の算出尺度の必要性 質を決める様々な要因の考慮 !42
45.
知識ベース構築への応用 Wikipedia で利用されている知識の範囲は少ない InfoBox が主 全ての記述が正しいことが前提となっている 質が低い記述も多い あまり書かれていない記事も多い 質の算出手法と知識構築手法の融合を !43
46.
まとめ
47.
まとめ 質とは何か 様々な定義 多くの人がどう思っているか,にどれだけ近いか 便利かどうか Wikipedia とは 様々な調査 →
多くの人は信頼している 編集履歴,編集者のバイアスなどを可視化 編集を行う動機 : 内的自己概念を満たすため 内的自己概念 = 自分が思うWikipediaの姿 !45
48.
まとめ 質の測定手法 全て人手による方法 専門家によるサンプル調査 半自動的な手法 投票による方法 有用な投票かどうかを選別する必要 自動的な方法 統計量の利用 編集者相互の評価を利用 !46
49.
ありがとうございました @hello_yu_suzuki http://www.db.ss.is.nagoya-u.ac.jp/~suzuki/
Download now