Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
QuASAR: A Question-Driven
Structure-Aware Approach for
Table-to-Text Generation
北海道大学 大学院情報科学研究院
情報理工学部門 複合情報工学分野 調和系工学研究室
修士課程1年 佐藤優太
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
タイトル
QuASAR: A Question-Driven Structure-Aware
Approach for Table-to-Text Generation
著者
Weijie Liu1, Yibin Zheng1, Fang Kong¹
¹ School of Computer Science and Technology, Soochow
University
掲載
Association for Computational Linguistics(ACL 2025)
URL
https://aclanthology.org/2025.acl-long.1300.pdf
論文情報 2
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
Table-to-Text Generationの課題
目的:構造化された表データから、自然言語のテキスト
を自動生成するタスクの生成品質向上
従来手法の課題:
線形化: 表を単純な文字列に変換するため、二次元的な構造情報
が失われる
グラフベース: 構造を捉えられるが、モデルの注意機構に複雑な
改造が必要で、コストが高い
根本的な問題
既存の手法では、表が持つ局所的・大域的な構造を十分に捉えき
れていない
研究背景 3
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
質問駆動型アプローチ「QuASAR」の提案
目的
質問応答の仕組みを応用し、モデルが表の構造をより深く理解で
きるようにする、軽量な自己教師ありフレームワークの提案
本研究の主な意義
質問駆動型の構造学習: 表構造に関する多様な質問と回答を自己
教師あり学習に用いることで、モデルの構造認識能力を向上させ
る
補助的な事前学習タスク: 「単語→文の再構築」と「数値要約」
タスクにより、生成テキストの流暢性と事実性を強化
高い性能: ToTToとHiTabデータセットにおいて、既存手法を上回
る高品質なテキスト生成を実証
研究目的と意義 4
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
QUASARを構成する3つのコア技術
本手法は、3つの主要なコンポーネントを組み合わせて、
テキスト生成の品質向上を目指す
単語から文への再構築
疎な単語群から流暢な文章を生成する能力を養う
数値要約
表中の数値情報を正確に集約・要約する能力を強化する
表構造の認識(本手法の核)
質問応答形式で表の構造的関係をモデルに学習させる
提案手法(QUASAR)の全体像 5
Table Data
Structure Awareness
(Encoder)
Text Generation
(Decoder)
Structure-Related
Question
Generated
Text
・T5/BART
・ChatGPT
・RoBERTa
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
疎な情報から自然な文章を生成する
目的
表のセルに含まれる名詞や数値といった疎な情報から、自然で一
貫性のある文章を生成する能力を向上させる
手順
1.元の文章から名詞・数詞などの重要単語を抽出
2.単語の順序をランダムにシャッフルし、ノイズを加える
3.モデルがこの単語のパズルから元の文章を復元するように学習さ
せる
・これにより、適切な語順や文法構造を生成する能力が向上する。
提案手法-Step1:単語から文への再構築 6
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
数値データの要約能力を強化する
目的
表に頻出する数値データを正確に理解し、比較・集約して要約す
る能力をモデルに与える
手順:カスタムデータセットの構築
1.既存のQAデータセットから数値情報が豊富な表を収集
2.T5/BARTモデルで行ごとに詳細な記述を生成
3.ChatGPTを用いて、生成された記述から数値的な洞察(範囲、最
大値、傾向など)を要約させる
4.この「詳細な記述→数値要約」のデータセットでモデルを事前学
習させる
提案手法-Step2:数値要約 7
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
「質問」でモデルに構造を教える
着想
人間が質問を通じて表の情報を探すように、モデルも構造に関する
質問を通じて表の構造を学習できるはず
手法
表の入力に構造に関する質問を追加する (例: "セルAと同じ行にある
セルはどれ?")
モデルは、質問の答えに該当するセルを予測するシーケンスラベリ
ングタスクを解く
・この自己教師あり学習を通じて、セル間の関係性を明示的に学習
・エンコーダの最終層のみを修正する軽量な設計
提案手法-Step3:表構造の認識(主テーマ) 8
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
表構造を網羅する5つの質問カテゴリ
モデルに多様な構造的関係を学習させるため、以下
の5カテゴリ・計20種類の質問テンプレートを設計
行・列の関係
「セルXと同じ行/列にあるセルは?」
ヘッダーの関係
「セルXのヘッダーは?」
空間的関係
「セルXの上/下/左/右にあるセルは?」
近接関係
「セルXに隣接するセルは?」
相対的位置
「セルXとセルYでは、どちらが先に来る?」
構造認識のための質問設計 9
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
モデルアーキテクチャと学習2 つのタスクを同時に学習
入力:[構造に関する質問]+[ハイライトされたセル]+[表の
メタデータ]
学習:2つの目的関数を持つマルチタスク学習
シーケンスラベリング損失( ℒseq)
エンコーダが出力する各セルの表現を用いて、質問に対する正解ラベル
(関連あり/ なし)を予測構造理解を促進
テキスト生成損失( ℒgen)
デコーダが正解のテキスト記述を生成するように学習
総損失
ℒtotal = 𝜆𝜆seqℒseq + 𝜆𝜆genℒgen
モデルアーキテクチャと学習 10
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
データセット
ToTTo : Wikipedia由来の大規模なオープン・ドメイン
データセット
HiTab : 階層構造を持つ複雑な表を含むデータセット
ベースモデル
T5-base:Text-to-Textの標準的なモデル
比較対象 (ベースライン)
T5-based: 表を線形化する標準的な手法
LATTICE, UniD2T: グラフベースの手法
PixT3: 表を画像として扱う視覚言語モデル
実験設定 11
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
主要データセットでベースラインを凌駕
ToTTo データセット
QUASARは、BLEU、PARENT、BLEURTの全ての指標でT5-
baseを大幅に上回り、より大規模なT5-3Bモデルに匹敵す
る性能を達成
LATTICEやUniD2Tといった他の構造認識手法も上回る
実験結果①:自動評価 12
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
ToTTo データセットより複雑な構造を持つHiTabにお
いても、QUASARは全てのベースラインを上回り、
最高のBLEUとPARENTスコアを記録
手法の汎用性と有効性を証明
実験結果①:自動評価 13
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
実験結果②:人手評価 14
事実性・数値の正確性で特に高い評価
100サンプルを用いて、5人の評価者が4つの観点で評価
評価項目
流暢性 (Fluency)
事実整合性 (Factual Consistency)
数値の正確性 (Numerical Accuracy)
情報網羅性 (Information Coverage)
結果
QUASARは「事実整合性」と「数値の正確性」において、T5-3Bを含
む全てのベースラインの中で最高スコアを獲得
構造認識アプローチと数値要約タスクが、ハルシネーションの抑制に
寄与していることを示唆
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
手動設計された質問への依存
性能が20種類の手動で作成された質問テンプレートに依存
している→未知の表構造への汎化能力に限界がある可能性
事前学習タスクの効果の限定性
T5のような強力な事前学習済みモデルに対しては、補助タ
スク(単語→文、数値要約)による性能向上が限定的
データ構築コスト
数値要約データセットの構築にChatGPT APIを大規模に利用
しており、コストと時間がかかる
課題 15
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
課題:
従来の表の線形化やグラフ化といった手法のテキスト生成品質
の限界
提案手法:
質問駆動型の構造学習:
「このセルと同じ行にあるのはどれ?」といった構造に関する質問をモデルに
問い、答えさせる自己教師あり学習を行うことで、セル間の関係性を明示的に
学習させる
2つの補助タスク:
単語から文への再構築と数値要約の事前学習タスクにより、生成されるテキス
トの流暢性と事実性をさらに向上させる
結果:
ToTTo やHiTabといった主要データセットにおいて、既存のグラ
フベース手法などを上回り、高品質なテキスト生成を達成した
人手評価では、事実整合性と数値の正確性でベースラインを大
きく上回り、ハルシネーションの抑制に有効であることが示唆
された
まとめ 16
Copyright © 2020 調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved.
今後の展望
入力が大規模な表で、出力がより詳細となる大規模テー
ブル要約タスクへの本手法の拡張
実世界での応用に向け、ノイズの多い、あるいは不規則
な形式の表に対する頑健性 (Robustness) の強化
今後の展望 17

QuASAR: A Question-Driven Structure-Aware Approach for Table-to-Text Generation

  • 1.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. QuASAR: A Question-Driven Structure-Aware Approach for Table-to-Text Generation 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 調和系工学研究室 修士課程1年 佐藤優太
  • 2.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. タイトル QuASAR: A Question-Driven Structure-Aware Approach for Table-to-Text Generation 著者 Weijie Liu1, Yibin Zheng1, Fang Kong¹ ¹ School of Computer Science and Technology, Soochow University 掲載 Association for Computational Linguistics(ACL 2025) URL https://aclanthology.org/2025.acl-long.1300.pdf 論文情報 2
  • 3.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. Table-to-Text Generationの課題 目的:構造化された表データから、自然言語のテキスト を自動生成するタスクの生成品質向上 従来手法の課題: 線形化: 表を単純な文字列に変換するため、二次元的な構造情報 が失われる グラフベース: 構造を捉えられるが、モデルの注意機構に複雑な 改造が必要で、コストが高い 根本的な問題 既存の手法では、表が持つ局所的・大域的な構造を十分に捉えき れていない 研究背景 3
  • 4.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 質問駆動型アプローチ「QuASAR」の提案 目的 質問応答の仕組みを応用し、モデルが表の構造をより深く理解で きるようにする、軽量な自己教師ありフレームワークの提案 本研究の主な意義 質問駆動型の構造学習: 表構造に関する多様な質問と回答を自己 教師あり学習に用いることで、モデルの構造認識能力を向上させ る 補助的な事前学習タスク: 「単語→文の再構築」と「数値要約」 タスクにより、生成テキストの流暢性と事実性を強化 高い性能: ToTToとHiTabデータセットにおいて、既存手法を上回 る高品質なテキスト生成を実証 研究目的と意義 4
  • 5.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. QUASARを構成する3つのコア技術 本手法は、3つの主要なコンポーネントを組み合わせて、 テキスト生成の品質向上を目指す 単語から文への再構築 疎な単語群から流暢な文章を生成する能力を養う 数値要約 表中の数値情報を正確に集約・要約する能力を強化する 表構造の認識(本手法の核) 質問応答形式で表の構造的関係をモデルに学習させる 提案手法(QUASAR)の全体像 5 Table Data Structure Awareness (Encoder) Text Generation (Decoder) Structure-Related Question Generated Text ・T5/BART ・ChatGPT ・RoBERTa
  • 6.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 疎な情報から自然な文章を生成する 目的 表のセルに含まれる名詞や数値といった疎な情報から、自然で一 貫性のある文章を生成する能力を向上させる 手順 1.元の文章から名詞・数詞などの重要単語を抽出 2.単語の順序をランダムにシャッフルし、ノイズを加える 3.モデルがこの単語のパズルから元の文章を復元するように学習さ せる ・これにより、適切な語順や文法構造を生成する能力が向上する。 提案手法-Step1:単語から文への再構築 6
  • 7.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 数値データの要約能力を強化する 目的 表に頻出する数値データを正確に理解し、比較・集約して要約す る能力をモデルに与える 手順:カスタムデータセットの構築 1.既存のQAデータセットから数値情報が豊富な表を収集 2.T5/BARTモデルで行ごとに詳細な記述を生成 3.ChatGPTを用いて、生成された記述から数値的な洞察(範囲、最 大値、傾向など)を要約させる 4.この「詳細な記述→数値要約」のデータセットでモデルを事前学 習させる 提案手法-Step2:数値要約 7
  • 8.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 「質問」でモデルに構造を教える 着想 人間が質問を通じて表の情報を探すように、モデルも構造に関する 質問を通じて表の構造を学習できるはず 手法 表の入力に構造に関する質問を追加する (例: "セルAと同じ行にある セルはどれ?") モデルは、質問の答えに該当するセルを予測するシーケンスラベリ ングタスクを解く ・この自己教師あり学習を通じて、セル間の関係性を明示的に学習 ・エンコーダの最終層のみを修正する軽量な設計 提案手法-Step3:表構造の認識(主テーマ) 8
  • 9.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 表構造を網羅する5つの質問カテゴリ モデルに多様な構造的関係を学習させるため、以下 の5カテゴリ・計20種類の質問テンプレートを設計 行・列の関係 「セルXと同じ行/列にあるセルは?」 ヘッダーの関係 「セルXのヘッダーは?」 空間的関係 「セルXの上/下/左/右にあるセルは?」 近接関係 「セルXに隣接するセルは?」 相対的位置 「セルXとセルYでは、どちらが先に来る?」 構造認識のための質問設計 9
  • 10.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. モデルアーキテクチャと学習2 つのタスクを同時に学習 入力:[構造に関する質問]+[ハイライトされたセル]+[表の メタデータ] 学習:2つの目的関数を持つマルチタスク学習 シーケンスラベリング損失( ℒseq) エンコーダが出力する各セルの表現を用いて、質問に対する正解ラベル (関連あり/ なし)を予測構造理解を促進 テキスト生成損失( ℒgen) デコーダが正解のテキスト記述を生成するように学習 総損失 ℒtotal = 𝜆𝜆seqℒseq + 𝜆𝜆genℒgen モデルアーキテクチャと学習 10
  • 11.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. データセット ToTTo : Wikipedia由来の大規模なオープン・ドメイン データセット HiTab : 階層構造を持つ複雑な表を含むデータセット ベースモデル T5-base:Text-to-Textの標準的なモデル 比較対象 (ベースライン) T5-based: 表を線形化する標準的な手法 LATTICE, UniD2T: グラフベースの手法 PixT3: 表を画像として扱う視覚言語モデル 実験設定 11
  • 12.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 主要データセットでベースラインを凌駕 ToTTo データセット QUASARは、BLEU、PARENT、BLEURTの全ての指標でT5- baseを大幅に上回り、より大規模なT5-3Bモデルに匹敵す る性能を達成 LATTICEやUniD2Tといった他の構造認識手法も上回る 実験結果①:自動評価 12
  • 13.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. ToTTo データセットより複雑な構造を持つHiTabにお いても、QUASARは全てのベースラインを上回り、 最高のBLEUとPARENTスコアを記録 手法の汎用性と有効性を証明 実験結果①:自動評価 13
  • 14.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 実験結果②:人手評価 14 事実性・数値の正確性で特に高い評価 100サンプルを用いて、5人の評価者が4つの観点で評価 評価項目 流暢性 (Fluency) 事実整合性 (Factual Consistency) 数値の正確性 (Numerical Accuracy) 情報網羅性 (Information Coverage) 結果 QUASARは「事実整合性」と「数値の正確性」において、T5-3Bを含 む全てのベースラインの中で最高スコアを獲得 構造認識アプローチと数値要約タスクが、ハルシネーションの抑制に 寄与していることを示唆
  • 15.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 手動設計された質問への依存 性能が20種類の手動で作成された質問テンプレートに依存 している→未知の表構造への汎化能力に限界がある可能性 事前学習タスクの効果の限定性 T5のような強力な事前学習済みモデルに対しては、補助タ スク(単語→文、数値要約)による性能向上が限定的 データ構築コスト 数値要約データセットの構築にChatGPT APIを大規模に利用 しており、コストと時間がかかる 課題 15
  • 16.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 課題: 従来の表の線形化やグラフ化といった手法のテキスト生成品質 の限界 提案手法: 質問駆動型の構造学習: 「このセルと同じ行にあるのはどれ?」といった構造に関する質問をモデルに 問い、答えさせる自己教師あり学習を行うことで、セル間の関係性を明示的に 学習させる 2つの補助タスク: 単語から文への再構築と数値要約の事前学習タスクにより、生成されるテキス トの流暢性と事実性をさらに向上させる 結果: ToTTo やHiTabといった主要データセットにおいて、既存のグラ フベース手法などを上回り、高品質なテキスト生成を達成した 人手評価では、事実整合性と数値の正確性でベースラインを大 きく上回り、ハルシネーションの抑制に有効であることが示唆 された まとめ 16
  • 17.
    Copyright © 2020調和系工学研究室 - 北海道大学 大学院情報科学研究院 情報理工学部門 複合情報工学分野 – All rights reserved. 今後の展望 入力が大規模な表で、出力がより詳細となる大規模テー ブル要約タスクへの本手法の拡張 実世界での応用に向け、ノイズの多い、あるいは不規則 な形式の表に対する頑健性 (Robustness) の強化 今後の展望 17