8. ScisummNet: A Large Annotated Corpus and Content-Impact Models for
Scientific Paper Summarization with Citation Networks
Michihiro Yasunaga, Jungo Kasai, Rui Zhang, Alexander R. Fabbri, Irene Li, Dan
Friedmann, Dragomir R. Radev
AAAI 2019
• 論文のアブストラクトは主観的であ
るという指摘の元,対象論文を引用
している論文を使って要約するアプ
ローチが主流となっている
• 一方でアブストにも有益な情報が含
まれているのではないか?というこ
とでアブストラクト+引用情報を用
いた要約
• 既存のデータセットは小規模である
ため,Computational Linguistic論文
1000本の新たな要約データセットを
構築
9. Learning to Generate Posters of Scientific Papers
Yuting Qiang, Yanwei Fu, Yanwen Guo, Zhi-Hua Zhou, Leonid Sigal
AAAI 2016
• 入力論文から(半)自動で論文のポスターを生成するという研究
• 文章はTextRankを用いて重要文を抽出,図に関してはユーザが手動で選
択する必要がある
• 重要文とユーザ選択の図に関して,レイアウトの最適化問題を解く
10. TALKSUMM: A Dataset and Scalable Annotation Mehotd for Scientific
Paper Summarization Based on Conference Talks
Guy Lev, Michal Shumueli-Scheuer, Jonathan Herzig, Achiya Jerbi, David Konopnicki
ACL 2019
• 論文要約タスクに対して,学会での
プレゼンテーションを活用するとい
う研究.
• 話者の発言内容が論文中のどの文に
基づいているか対応付けすることで
要約を生成.
• NLP(ACL, NAACL, EMNLP, SIGDIAL)及び
ML(ICML)のプレゼン動画によるデー
タセットを構築.
• Yasunaga+ 2019よりも高いROUGEス
コアを記録.
12. Paper Abstract Writing through Editing Mechanism
Qingyun Wang, Zhihao Zhou, Lifu Huang, Spencer Whitehead, Boliang Zhang, Heng Ji,
Kevin Knight
ACL 2018
• 論文のタイトルを入力として,
その論文のアブストラクトを自
動で生成するという一風変わっ
た研究
• 初めにencoder-decoder構造で生
成し,その後Editing Networkで
改善していく
• 論文の分野に詳しくない人は騙
せるらしい
13. PaperRobot: Incremental Draft Generation of Scientific Ideas
Qingyun Wang, Lifu Huang, Zhiying Jiang, Kevin Knight, Heng Ji, Mohit Bansal, Yi Luan
ACL 2019
• 過去の論文から知識グラフを構築
し,新たな研究アイデアを自動で
生み出す研究
• 研究アイデアのみならず,そこか
らアブストラクトなど論文の一部
も自動で生成する
• 10から30%の人が生成結果の方が
良いと回答
14. • 材料科学の論文330万本のアブストを
使ってword embeddingを学習
• 教師なし学習だが,各原子の特徴や
酸化など化学的概念の獲得に成功
Unsupervised word embeddings capture latent knowledge from materials
science literature
Vahe Tshitoyan, John Dagdelen, Leigh Weston, Alexander Dunn, Ziqin Rong, Olga Kononova,
Kristin A. Persson, Gerbrand Ceder, Anubhav Jain
nature 2019
22. Learning to Extract Semantic Structure from Documents Using
Multimodal Fully Convolutional Neural Networks
Xiao Yang, Ersin Yumer, Paul Asente, Mike Kraley, Daniel Kifer, C. Lee Giles
CVPR 2017
• 文章の図,表,セクション名,キャプション,箇条書き,段落の位置
推定をセマンティックセグメンテーションの問題として考える研究
• CNNに加えて,文章領域に関しては単語のembeddingを与える
23. FigureSeer: Parsing Result-Figures in Research Papers
Noah Siegel, Zachary Horvitz, Roie Levin, Santosh Divvala, Ali Farhadi
ECCV 2016
• 論文中のグラフ(散布図)から性能などに関する数値を自動で抽出する
手法を提案
• 学習済みAlexNetやResNetをファインチューニングし,図の種類の識別
(Flowchart, Scatterなど)を行う
• グラフの軸や凡例情報を抜き出し,CNNによってグラフ上にプロット
されているか否かを判定することで数値を認識する
24. DVQA: Understanding Data Visualizations via Question Answering
Kushal Kafle, Brian Price, Scott Cohen, Christopher Kanan
CVPR 2018
• 棒グラフが入力画像であるVQA
• Matplotlibを用いることで学習データを大量に作ることを可能とした
• Structure Understanding, Data Retrieval, Reasoningの3種類の質問を定義
• ネットワークはyes/noの回答及びOCRを用いた回答の2つから構成
25. DLPaper2Code: Auto-generation of Code
from Deep Learning Research Papers
Akshay Sethi, Anush Sankaran, Naveen Panwar, Shreya Khare, Senthil Mani
AAAI 2018
• 論文中のネットワーク構造図からDNNのコードを自動生成する研究
• 論文から抽出した図表から,DNNのネットワークを表現しているもの
か、どのタイプの図かを分類
• 論文中では1種類の図(2D Box)に対してのみコード生成手法を提案
26. 強い研究機関
Allen Institute for Artificial Intelligence (AI2)
• NLPやCV中心にAIについて研究しているシアトルの研究所
• Semantic Scholarという,人工知能を搭載した学術検索エン
ジンを運営している
• Semantic Scholarに含まれている論文を100万本単位で学習
するという類の研究が多い
• 研究成果はオープンソース化してgithub上に公開されてい
るものが多い