SlideShare a Scribd company logo
1 of 15
Download to read offline
1
1
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions: Aligning Large Language Models
with Retriever’s Preference in Conversational Search
Small Talk, 2024.03.13
백인걸
LILAB
Department of Artificial Intelligence
Chung-Ang University
2
Language Intelligence Lab, Chung-Ang University
• Rewriting in RAG
• Introduction, Abstract
• Method
• Experiment
• Conclusion, Limitation
Outline
3
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions
- Rewriting in RAG
LLM output
LLM input
Query rewriting
4
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions
- Rewriting Methods
Query: what was the immediate impact of
the success of the manhattan project?
Keywords: immediate effects manhattan
project success
Query: what was the immediate impact of t
he success of the manhattan project?
Answer: The immediate impact of the Manhatt
an Project's success was the end of World War
II, marked by the use of atomic bombs on Hiros
hima and Nagasaki, leading to Japan's surrende
r. This event introduced the nuclear age, resha
ping global military, political landscapes, and s
parking ethical and scientific debates.
"passage_text": [ "The presence of
communication amid scientific mind
s was equally important to the suc
cess of the Manhattan Project as s
cientific intellect was. The only
cloud hanging over the impressive
achievement of the atomic research
ers and engineers is what their su
ccess truly meant; hundreds of tho
usands of innocent lives obliterat
ed.", "The Manhattan Project and i
ts atomic bomb helped bring an end
to World War II. Its legacy of pea
ceful uses of atomic energy contin
ues to have an impact on history a
nd science.",
…
Query: what was the immediate impact of
the success of the manhattan project?
Passage: The immediate impact of the su
ccess of the Manhattan Project was profound
and far-reaching, fundamentally altering the
course of world history. Upon its completion,
the project had developed the world's first at
omic bombs, which were subsequently used
on the Japanese …
Label
5
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions
- Introduction, Abstract
기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후,
retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성.
언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을
만들자.
Generate Model
- Query Exploration: GPT-4
- LLM finetuning: Llama2-7b
Retrieval Model
- BM25(Sparse)
- ANCE(Dense)
Model
Summary
Evaluation
Conversation system - TopiOCQA, QReCC
6
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions
- Methods - 1
기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후,
retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성.
언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을
만들자.
Summary
Method - 1
7
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions
- QR(Query Rewriting= coreference resolution)
대명사를 기존 conversation에 있는 명사로 교체
- QR(Query Rewriting) w/Planning
Plan을 바탕으로 같은 의미를 가진 새로운 query를 생성하는 과정
- QE(Query Expansion)
기존 query에서 추가적인 정보를 더해 기존 query 확장
기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후,
retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성.
언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을
만들자.
Summary
- Methods - 1
8
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions
- Method - 2
기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후,
retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성.
언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을
만들자.
Summary
Method - 2
9
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions 기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후,
retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성.
언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을
만들자.
Summary
- Method - 2
Query: what was the immediate impact of
the success of the manhattan project?
Keywords: immediate effects manhattan
project success
Query: what was the immediate impact of t
he success of the manhattan project?
Answer: The immediate impact of the Manhatt
an Project's success was the end of World War
II, marked by the use of atomic bombs on Hiros
hima and Nagasaki, leading to Japan's surrende
r. This event introduced the nuclear age, resha
ping global military, political landscapes, and s
parking ethical and scientific debates.
"passage_text": [ "The presence
of communication amid scientifi
c minds was equally important t
o the success of the Manhattan
Project as scientific intellect
was. The only cloud hanging ove
r the impressive achievement of
the atomic researchers and engi
neers is what their success tru
ly meant; hundreds of thousands
of innocent lives obliterated.",
"The Manhattan Project and its
atomic bomb helped bring an end
to World War II. Its legacy of
peaceful uses of atomic energy
continues to have an impact on
history and science.",
…
Query: what was the immediate impact of
the success of the manhattan project?
Passage: The immediate impact of the su
ccess of the Manhattan Project was profound
and far-reaching, fundamentally altering the
course of world history. Upon its completion,
the project had developed the world's first at
omic bombs, which were subsequently used
on the Japanese …
Label
10
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions 기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후,
retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성.
언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을
만들자.
Summary
- Method - 2
Rankss output
1
2
.
.
.
.
.
.
11
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions
- Method - 3
기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후,
retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성.
언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을
만들자.
Summary
Method -3
12
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions
- Method - 3
기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후,
retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성.
언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을
만들자.
Summary
1. Ranking Threshold 넘은 데이터에 대해서 SFT 학습
2. Ranking 을바탕으로 preference 정도를 알 수 있고,
이를 바탕으로 DPO 학습 진행
13
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions
- Experiment
의미: 가져온 k개의 문서 중 관련된 문서가 얼마나 많은가
가져온 10개의 문서 중, 8개가 관련된 문서,
전체 관련 문서수가 9개 -> Recall@10은 8/9
Ref: https://bigdatamaster.tistory.com/178
14
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions
- Experiment
15
Language Intelligence Lab, Chung-Ang University
Ask Optimal Questions
- Conclusion, Limitation
Conclusion
- Query를 최적화 시키기는 RETPO 라는 framework 소개
- Retrieval system에서의 rank를 바탕으로 학습에 적용
- SFT, DPO 방식으로 학습된 모델이 QReCC, TopiOCQA 에서 baseline outperform
Limitation
- 학습데이터의 사용이 예산 제약으로 전체 TopiOCQA데이터에서 절반만 사용.
- 더 큰 파라미터에서의 모델은 query를 더 지속적으로 생성하는 경향이 있어
작은 모델 사용.

More Related Content

Similar to 백인걸_Ask Optimal Question_alignings LLM with Retriever's preference in Conversational Search.pdf

사이버컴과 네트워크분석 11주차 1
사이버컴과 네트워크분석 11주차 1사이버컴과 네트워크분석 11주차 1
사이버컴과 네트워크분석 11주차 1
Han Woo PARK
 
제1장 정보검색소개
제1장 정보검색소개제1장 정보검색소개
제1장 정보검색소개
Chang-yong Jung
 
Mall Korea Project (모바일 조기교육)
Mall Korea Project (모바일 조기교육)Mall Korea Project (모바일 조기교육)
Mall Korea Project (모바일 조기교육)
tongsung2
 
[SNU UX Lab] Analysis of Youngsters’ Media Multitasking Behaviors and Effect ...
[SNU UX Lab] Analysis of Youngsters’ Media Multitasking Behaviors and Effect ...[SNU UX Lab] Analysis of Youngsters’ Media Multitasking Behaviors and Effect ...
[SNU UX Lab] Analysis of Youngsters’ Media Multitasking Behaviors and Effect ...
PHKIM
 
창작소 미래예측기법워크숍 Cis_등 요약
창작소 미래예측기법워크숍 Cis_등 요약창작소 미래예측기법워크숍 Cis_등 요약
창작소 미래예측기법워크숍 Cis_등 요약
atelier t*h
 

Similar to 백인걸_Ask Optimal Question_alignings LLM with Retriever's preference in Conversational Search.pdf (20)

사이버컴과 네트워크분석 11주차 1
사이버컴과 네트워크분석 11주차 1사이버컴과 네트워크분석 11주차 1
사이버컴과 네트워크분석 11주차 1
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Secret X 팀] : XAI를 활용한 수능 영어영역 문제풀이
 
Product Design System 2009, Team Shabu Final Documentation
Product Design System 2009, Team Shabu Final DocumentationProduct Design System 2009, Team Shabu Final Documentation
Product Design System 2009, Team Shabu Final Documentation
 
Query suggestions as summarization in exploratory search
Query suggestions as summarization in exploratory searchQuery suggestions as summarization in exploratory search
Query suggestions as summarization in exploratory search
 
KrKwic내용분석특강(november2006)
KrKwic내용분석특강(november2006)KrKwic내용분석특강(november2006)
KrKwic내용분석특강(november2006)
 
PR-218: MFAS: Multimodal Fusion Architecture Search
PR-218: MFAS: Multimodal Fusion Architecture SearchPR-218: MFAS: Multimodal Fusion Architecture Search
PR-218: MFAS: Multimodal Fusion Architecture Search
 
[IRU2016]CLASS02_SCIENTIFIC RESEARCH
[IRU2016]CLASS02_SCIENTIFIC RESEARCH[IRU2016]CLASS02_SCIENTIFIC RESEARCH
[IRU2016]CLASS02_SCIENTIFIC RESEARCH
 
20200923 open domain-qa_saltlux
20200923 open domain-qa_saltlux20200923 open domain-qa_saltlux
20200923 open domain-qa_saltlux
 
제1장 정보검색소개
제1장 정보검색소개제1장 정보검색소개
제1장 정보검색소개
 
2장
2장2장
2장
 
TTS System을 이용한 교육용 소프트웨어 개발
TTS System을 이용한 교육용 소프트웨어 개발TTS System을 이용한 교육용 소프트웨어 개발
TTS System을 이용한 교육용 소프트웨어 개발
 
2206 Modupop!
2206 Modupop!2206 Modupop!
2206 Modupop!
 
Mall Korea Project (모바일 조기교육)
Mall Korea Project (모바일 조기교육)Mall Korea Project (모바일 조기교육)
Mall Korea Project (모바일 조기교육)
 
삼육봇 소개
삼육봇 소개삼육봇 소개
삼육봇 소개
 
[SNU UX Lab] Analysis of Youngsters’ Media Multitasking Behaviors and Effect ...
[SNU UX Lab] Analysis of Youngsters’ Media Multitasking Behaviors and Effect ...[SNU UX Lab] Analysis of Youngsters’ Media Multitasking Behaviors and Effect ...
[SNU UX Lab] Analysis of Youngsters’ Media Multitasking Behaviors and Effect ...
 
창작소 미래예측기법워크숍 Cis_등 요약
창작소 미래예측기법워크숍 Cis_등 요약창작소 미래예측기법워크숍 Cis_등 요약
창작소 미래예측기법워크숍 Cis_등 요약
 
젊은 연구자를 위한 국가과제 연구비 소개
젊은 연구자를 위한 국가과제 연구비 소개젊은 연구자를 위한 국가과제 연구비 소개
젊은 연구자를 위한 국가과제 연구비 소개
 
과학리더십 공간과 연구 자율성
과학리더십 공간과 연구 자율성과학리더십 공간과 연구 자율성
과학리더십 공간과 연구 자율성
 
[Imr]week3
[Imr]week3[Imr]week3
[Imr]week3
 
머신러닝의 개념과 실습
머신러닝의 개념과 실습머신러닝의 개념과 실습
머신러닝의 개념과 실습
 

백인걸_Ask Optimal Question_alignings LLM with Retriever's preference in Conversational Search.pdf

  • 1. 1 1 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions: Aligning Large Language Models with Retriever’s Preference in Conversational Search Small Talk, 2024.03.13 백인걸 LILAB Department of Artificial Intelligence Chung-Ang University
  • 2. 2 Language Intelligence Lab, Chung-Ang University • Rewriting in RAG • Introduction, Abstract • Method • Experiment • Conclusion, Limitation Outline
  • 3. 3 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions - Rewriting in RAG LLM output LLM input Query rewriting
  • 4. 4 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions - Rewriting Methods Query: what was the immediate impact of the success of the manhattan project? Keywords: immediate effects manhattan project success Query: what was the immediate impact of t he success of the manhattan project? Answer: The immediate impact of the Manhatt an Project's success was the end of World War II, marked by the use of atomic bombs on Hiros hima and Nagasaki, leading to Japan's surrende r. This event introduced the nuclear age, resha ping global military, political landscapes, and s parking ethical and scientific debates. "passage_text": [ "The presence of communication amid scientific mind s was equally important to the suc cess of the Manhattan Project as s cientific intellect was. The only cloud hanging over the impressive achievement of the atomic research ers and engineers is what their su ccess truly meant; hundreds of tho usands of innocent lives obliterat ed.", "The Manhattan Project and i ts atomic bomb helped bring an end to World War II. Its legacy of pea ceful uses of atomic energy contin ues to have an impact on history a nd science.", … Query: what was the immediate impact of the success of the manhattan project? Passage: The immediate impact of the su ccess of the Manhattan Project was profound and far-reaching, fundamentally altering the course of world history. Upon its completion, the project had developed the world's first at omic bombs, which were subsequently used on the Japanese … Label
  • 5. 5 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions - Introduction, Abstract 기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후, retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성. 언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을 만들자. Generate Model - Query Exploration: GPT-4 - LLM finetuning: Llama2-7b Retrieval Model - BM25(Sparse) - ANCE(Dense) Model Summary Evaluation Conversation system - TopiOCQA, QReCC
  • 6. 6 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions - Methods - 1 기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후, retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성. 언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을 만들자. Summary Method - 1
  • 7. 7 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions - QR(Query Rewriting= coreference resolution) 대명사를 기존 conversation에 있는 명사로 교체 - QR(Query Rewriting) w/Planning Plan을 바탕으로 같은 의미를 가진 새로운 query를 생성하는 과정 - QE(Query Expansion) 기존 query에서 추가적인 정보를 더해 기존 query 확장 기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후, retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성. 언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을 만들자. Summary - Methods - 1
  • 8. 8 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions - Method - 2 기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후, retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성. 언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을 만들자. Summary Method - 2
  • 9. 9 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions 기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후, retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성. 언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을 만들자. Summary - Method - 2 Query: what was the immediate impact of the success of the manhattan project? Keywords: immediate effects manhattan project success Query: what was the immediate impact of t he success of the manhattan project? Answer: The immediate impact of the Manhatt an Project's success was the end of World War II, marked by the use of atomic bombs on Hiros hima and Nagasaki, leading to Japan's surrende r. This event introduced the nuclear age, resha ping global military, political landscapes, and s parking ethical and scientific debates. "passage_text": [ "The presence of communication amid scientifi c minds was equally important t o the success of the Manhattan Project as scientific intellect was. The only cloud hanging ove r the impressive achievement of the atomic researchers and engi neers is what their success tru ly meant; hundreds of thousands of innocent lives obliterated.", "The Manhattan Project and its atomic bomb helped bring an end to World War II. Its legacy of peaceful uses of atomic energy continues to have an impact on history and science.", … Query: what was the immediate impact of the success of the manhattan project? Passage: The immediate impact of the su ccess of the Manhattan Project was profound and far-reaching, fundamentally altering the course of world history. Upon its completion, the project had developed the world's first at omic bombs, which were subsequently used on the Japanese … Label
  • 10. 10 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions 기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후, retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성. 언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을 만들자. Summary - Method - 2 Rankss output 1 2 . . . . . .
  • 11. 11 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions - Method - 3 기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후, retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성. 언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을 만들자. Summary Method -3
  • 12. 12 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions - Method - 3 기존 query하나에 대해서 다양한 방식으로 query rewriting 진행한 후, retrieval system의 input으로 넣어 ranking을 바탕으로 데이터셋 구성. 언어 모델에 학습(SFT, DPO)시켜 최적 query를 생성해내는 언어모델을 만들자. Summary 1. Ranking Threshold 넘은 데이터에 대해서 SFT 학습 2. Ranking 을바탕으로 preference 정도를 알 수 있고, 이를 바탕으로 DPO 학습 진행
  • 13. 13 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions - Experiment 의미: 가져온 k개의 문서 중 관련된 문서가 얼마나 많은가 가져온 10개의 문서 중, 8개가 관련된 문서, 전체 관련 문서수가 9개 -> Recall@10은 8/9 Ref: https://bigdatamaster.tistory.com/178
  • 14. 14 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions - Experiment
  • 15. 15 Language Intelligence Lab, Chung-Ang University Ask Optimal Questions - Conclusion, Limitation Conclusion - Query를 최적화 시키기는 RETPO 라는 framework 소개 - Retrieval system에서의 rank를 바탕으로 학습에 적용 - SFT, DPO 방식으로 학습된 모델이 QReCC, TopiOCQA 에서 baseline outperform Limitation - 학습데이터의 사용이 예산 제약으로 전체 TopiOCQA데이터에서 절반만 사용. - 더 큰 파라미터에서의 모델은 query를 더 지속적으로 생성하는 경향이 있어 작은 모델 사용.