Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

9.6 Million Links in Source Code Comments: Purpose, Evolution, and Decay (日本語版)

325 views

Published on

A Japanese version of the presentation of our ICSE 2019 paper.
The online appendix is available at https://github.com/NAIST-SE/9.6MillionLinks
English version (used in ICSE2019) is also available online: https://www.slideshare.net/hideakihata5/96-million-links-in-source-code-comments-purpose-evolution-and-decay

Published in: Software
  • ..............ACCESS that WEBSITE Over for All Ebooks ................ ......................................................................................................................... DOWNLOAD FULL PDF EBOOK here { http://bit.ly/2m6jJ5M } ......................................................................................................................... Download Full EPUB Ebook here { http://bit.ly/2m6jJ5M } .........................................................................................................................
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • DOWNLOAD THAT BOOKS/FILE INTO AVAILABLE FORMAT - (Unlimited) ......................................................................................................................... ......................................................................................................................... Download FULL PDF EBOOK here { http://bit.ly/2m6jJ5M } ......................................................................................................................... .............. Browse by Genre Available eBooks ......................................................................................................................... accessibility Books Library allowing access to top content, including thousands of title from favorite author, plus the ability to read or download a huge selection of books for your pc or smartphone within minutes Christian, Classics, Comics, Contemporary, Cookbooks, Art, Biography, Business, Chick Lit, Children's, Manga, Memoir, Music, Science, Science Fiction, Self Help, History, Horror, Humor And Comedy, Suspense, Spirituality, Sports, Thriller, Travel, Young Adult, Crime, Ebooks, Fantasy, Fiction, Graphic Novels, Historical Fiction, Mystery, Non Fiction, Paranormal, Philosophy, Poetry, Psychology, Religion, Romance,
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • If you want to download or read this book, copy link or url below in the New tab ......................................................................................................................... DOWNLOAD FULL PDF EBOOK here { http://bit.ly/2m6jJ5M } ......................................................................................................................... Download EPUB Ebook here { http://bit.ly/2m6jJ5M } .........................................................................................................................
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • accessibility Books Library allowing access to top content, including thousands of title from favorite author, plus the ability to read or download a huge selection of books for your pc or smartphone within minutes DOWNLOAD THIS BOOKS INTO AVAILABLE FORMAT ......................................................................................................................... ......................................................................................................................... Download Full PDF EBOOK here { http://bit.ly/2m6jJ5M } ......................................................................................................................... Download Full EPUB Ebook here { http://bit.ly/2m6jJ5M } ......................................................................................................................... ...................................ALL FOR EBOOKS................................................. Cookbooks, Manga, Memoir, Music, Mystery, Non Fiction, Paranormal, Philosophy, Poetry, Psychology, Religion, Art, Biography, Business, Chick Lit, Children's, Christian, Classics, Comics, Contemporary, Romance, Science, Science Fiction, Self Help, Suspense, Spirituality, Sports, Thriller, Travel, Young Adult, Crime, Ebooks, Fantasy, Fiction, Graphic Novels, Historical Fiction, History, Horror, Humor And Comedy,
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • ACCESS that WEBSITE Over for All Ebooks (Unlimited) ......................................................................................................................... DOWNLOAD FULL PDF EBOOK here { http://bit.ly/2m6jJ5M } ......................................................................................................................... DOWNLOAD FULL EPUB Ebook here { http://bit.ly/2m6jJ5M } ......................................................................................................................... Download Full PDF EBOOK here { http://bit.ly/2m6jJ5M } ......................................................................................................................... Download EPUB Ebook here { http://bit.ly/2m6jJ5M }
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Be the first to like this

9.6 Million Links in Source Code Comments: Purpose, Evolution, and Decay (日本語版)

  1. 1. 9.6 Million Links in Source Code Comments: Purpose, Evolution, and Decay Hideaki Hata, Christoph Treude, Raula Gaikovina Kula, Takashi Ishio ICSE 2019: 41st ACM/IEEE International Conference on Software Engineering, Montréal, QC, Canada
  2. 2. 背景:ソースコードから Web ページへのリンク https://stackoverflow.com/a/23838584 2
  3. 3. リンク先の内容は更新されることがある https://stackoverflow.com/a/48027778 新しいやりかたが あるのか! ソースコードを 改善できる!! 3 2017年12月(直前の回答の3年後)に加わった回答
  4. 4. コードコメント内のリンクは有用か? コードに関連した外部情報の明示 ● 開発者の意図を理解する手がかり として有用そう ● 外部情報は更新されることもある し、消滅する可能性もある 4
  5. 5. コードコメント関係の既存研究 ● Task annotations [Storey et al., ICSE 2008] ○ TODO/FIXME などを使ったカジュアルなタスク管理 ● Self-admitted technical debt (自覚のある技術的負債) [Potdar and Shihab, ICSME 2014] ○ 素早くソフトを作るための特殊な実装コードへの言及 ● Fragile comments [Ratol and Robillard, ASE 2017] ○ 実装とコメントの不整合 ● License evolution [Wu et al., EMSE 2017] ○ ライセンス変更による不整合 5
  6. 6. リンク切れに関する既存研究 CHASE 2019 We encourage authors of accepted papers to make their data public, in order to enhance the transparency of the process and the reproducibility of the results. We encourage you to avoid putting the data on your own websites or systems like Dropbox, since more than 30% of them will not work in a 4 years period Koehler, Web page change and persistence—A four‐year longitudinal study, https://doi.org/10.1002/asi.10018. 6
  7. 7. 何のために使われる? どう更新される? リンク切れは起きる? 本研究:ソースコードコメント内のリンクはどうか? 7
  8. 8. からのデータ収集 https://github.blog/2015-08-19-language-trends-on-github/ 25,925 repos 8 10年間、Top 10 の7言語: C, C++, Java, JavaScript, Python, PHP, Ruby JavaScript Ruby Python PHP C C++ Java (The GHTorrent Dataset)
  9. 9. 9.6 million links 9 ※コメント内の http(s) URL の総数
  10. 10. コメント内にリンクを持つリポジトリの割合 10 89% in total
  11. 11. リンク先のドメイン 11
  12. 12. 調査内容 (Research Questions) 12  リンク先はどのような文書か? [サンプリングによる目視調査]  何のために参照しているか? [サンプリング調による目視査]  リンクの URL はどれぐらい更新されるか? [サンプリングによる目視調査]  リンク先の内容は変化するか? [StackOverflow に関する全数調査]  リンク切れはどれぐらい起きるか? [全数調査]  リンク切れの修正には価値があるか? [ケーススタディ]
  13. 13. 調査方法:ドメイン単位での層別サンプリング Strata by domain # domains # links Sample size common 2,013 9,128,444 384 sometimes 30,851 502,083 384 rare 24,175 24,175 378 sum 57,039 9,654,702 1,146 13 サンプルごとの目視検査の質の保証: 少数のサンプルに対して4人の著者が個別に判断した結果が合致することを検証 (誰がやっても、ほどほどに同じ結果が得られる)
  14. 14. リンク先の文書種別 14 ● 仕様 ● 組織のホームページ ● チュートリアルなどの記事 ● API ドキュメント ● ブログ記事 ● バグレポート ● アプリケーション ● 個人のホームページ ● ソースコード ● Stack Overflow のスレッド ● 研究論文
  15. 15. ソースコードに対するメタデータ (metadata) ○ 作者、組織、ライセンス ソースコードの付加情報 (attribution) ○ アルゴリズムや実装方法の解説 技術的負債 (self-admitted technical debt) ○ 特殊な実装の事情 リンクの目的(コメントの記述で分類) 15 アルゴリズムの記述 (61ページのPDF) Issue の記述・議論
  16. 16. 各サンプルファイルの変更履歴を調査 ● ライセンスの変更 ● 組織名の変更 ● http から https への変更 ● コンテンツの移動 ● 参照コンテンツの変更 ほか リンクの更新 16 スペルミスの修正 正式なドキュメントを参照するようにリンクを更新 (1,146 サンプル中 88サンプルに更新あり)
  17. 17. におけるリンク先の変化 (The SOTorrent Dataset) 17 リンクがコミットされた時点を基準に 新しいコメント・回答の数を調査
  18. 18. リンク切れ の起きる割合 18 すべての URL に実際に アクセスしてみた結果を分類 • 何かデータがあれば success • 404 が返ってきたらリンク切れ • internal server error 等はその他
  19. 19. リンク切れの修正に価値があるか ● 正しいリンク先が分かるものを Pull Request で送信 ○ Internet Archive で当時のコンテン ツを探し、新しい URL を特定 ● アクティブなプロジェクトでは すぐ accept された (9件中 9件) 19https://github.com/sveawebpay/php-integration/pull/82
  20. 20. 20 ● コードコメントにリンクは多数出現する ● よくあるリンク先はライセンス, ソフトウェアのホームページ, 404 Not Found. ● よくあるリンクの理由:ソースコードのメタデータと付加情報 ● リンク自体はほとんど更新されない ● リンク先の内容は変わっていることがある。Stack Overflow スレ ッドの 75% は最初に見た時と同じではない ● 全リンク先のうち 9% はリンク切れ ● 開発者はリンクを重要な情報とは認識している
  21. 21. 今後の課題: 外部情報との同時進化の支援 21 ● 外部情報の更新の検知や、リ ンク更新のツール支援 ● 外部情報のさらなる理解 ● ソースコードコメントの調査
  22. 22. オンライン素材あります https://github.com/NAIST-SE/9.6MillionLinks 22

×