More Related Content Similar to resilient chatbots: repair strategy preferences for conversational breakdowns
Similar to resilient chatbots: repair strategy preferences for conversational breakdowns (20) More from Myeonggyun Ryu (10) resilient chatbots: repair strategy preferences for conversational breakdowns1. + CHI 2019
/ ๋ฅ๋ช
๊ท
Resilient Chatbots: Repair Strategy
Preferences for Conversational
Breakdowns
- Zahra Ashktorab et al. (IBM Research AI)
3. 01 WHY THIS PAPER
์ฑ๋ด ์ค๋ฅ์ ๋ํ 8๊ฐ์ง Repair ์ ๋ต์ ํจ๊ณผ๋ฅผ ์ฐ๊ตฌํ ๋
ผ๋ฌธ
โข ๋๊ตฌ๋ VUI๋ฅผ ๋ ์ฝ๊ฒ ์ธ ์ ์์์ผ๋ฉด ์ข๊ฒ ๋ค
โข ํ์ฌ ์ฌ์ฉ์๊ฐ ๊ฒช๊ณ ์๋ ์ด๋ ค์
- ๋ฌด์จ ๊ธฐ๋ฅ์ด ์๋์ง ๋ชจ๋ฅด๊ณ , ์ด๋ป๊ฒ ๋งํด์ผ ํ ์ง๋ ๋ชจ๋ฆ (Discoverability)
- ์ค๋ฅ๊ฐ ๋ฐ์ํ๋ฉด ๋์ฒ๊ฐ ์ด๋ ค์ (Repair)
- ์ค๋ ์ด๋ค๊ณ ํด๊ฒฐ๋์ง๋ ์์ (Learnability)
์ด๋ป๊ฒ ์๋๋ฅผ ๋ํด์ผ ํ์งโฆ?
๋ด ๋ง์ ๋ชป์์ ๋ฃ๋ ๊ฑฐ๋
๋ด๊ฐ ์ข ์ด๋ ต๊ฒ ๋งํ๊ณ ์๋
์๋๋ฉด ๊ทธ ๊ธฐ๋ฅ์ด ์๋๊ฑฐ๋
์์จ!
ํ์ฌ ์ฌ์ฉ์๊ฐ ๋ํํ ์ธํฐํ์ด์ค๋ฅผ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ
4. 02 INTRODUCTION
ํ์คํฌํ ์ฑ๋ด์์๋ ๋ชฉ์ ์ ๋ฌ์ฑํ ์ ์๋ ์๋ฌ ๋์์ฑ
์ด ํ์
โข ์ฑ๋ด ๊ฐ๋ฐ์๋ค์ด ์ง๋ฉดํ ๋ฌธ์ : ์๋ฌ๋ก ์ธํด ๋ฐ์ํ๋ ๋ถ์ ์ ์ธ ๊ฒฝํ์ ์ด๋ป๊ฒ ๊ฐ์์ํฌ๊น?
- ์ ํ ์ฐ๊ตฌ์์๋ ๊ณต์ํจ์ด๋ ์ฌ๊ณผํ๋ ํ๋๋ฅผ ํตํด ์ฌ์ฉ์์ ๋ถ์ ์ ์ธ ๊ฐ์ ์ ์ํ์ํค๋ ์ฐ๊ตฌ๋ฅผ ์งํ
- ํ์ง๋ง, ํ์คํฌํ ์ฑ๋ด์์ ์ด๋ ํจ๊ณผ์ ์ด์ง ๋ชปํจ
- ํ์คํฌํ ์ฑ๋ด์์๋ ๋ชฉ์ ๋ฌ์ฑ์ด ์ค์
โข ๋ฐ๋ผ์ ์๋ฌ๊ฐ ๋ฐ์ํ์ ๋ ๋ชฉ์ ์ ๋ฌ์ฑํ ์ ์๋๋ก ํ๋ ๋์์ด ํ์ํจ
- ์ฌ๋ ์ฌ์ด์ ๋ํ์์ ์๋ฌ๋ ์์ฃผ ๋ฐ์ํ๊ณ , ๋ค์ํ ๋ฐฉ๋ฒ์ผ๋ก ํด๊ฒฐํจ (๋ฐ๋ณต, ๋ฌธ์ฅ๋ฐ๊พธ๊ธฐ, ๋ช
ํํ๊ฒ)
โข Repair๋ฅผ ๋ฐฉํดํ๋ ์ฑ๋ด์ ๋ฌธ์
- ์๋ฌ์ ํ์ ์ด ์์
- ์ฌ์ฉ์๊ฐ ํจ๊ณผ์ ์ธ ํด๊ฒฐ์ฑ
์ ์ ํํ๊ธฐ์๋ ์์คํ
๋ชจ๋ธ์ด ์ต์์น ์์
RQ1. 8๊ฐ์ง Repair ์ ๋ต ์ค ์ฌ์ฉ์๋ค์ ์ด๋ค ์ ๋ต์ ์ ํธํ๋๊ฐ?
RQ2. ๊ฐ์ธ์ ์ธ ์์์ ์
๋ฌด์ ์ข
๋ฅ๊ฐ ์ ํธ์ ์ํฅ์ ๋ฏธ์น๋๊ฐ?
5. 03 REPAIR STRATEGY
โ ๋ฌด์
โจ
์ธํ
ํธ ์ ๋นํ ์ก์์ ๋ต๋ณ ์ ๊ณต
โก ํ์ธํ๊ธฐ
โจ
์ธํ
ํธ๊ฐ ๋ง๋์ง ๋ฌผ์ด ๋ด์ ํ์ธํจ
โข ๋ฐ๋ณต ์์ฒญ
โจ
๋ค์ ๋งํ๋๋ก ์์ฒญ
โฃ ์ต์
์ ์
โจ
์์๋๋ ์ธํ
ํธ๋ฅผ ์ ์ํจ
โฅ ํค์๋ ํ์ด๋ผ์ดํ
โจ
์ฌ์ฉ์ ๋ฐํ์ ํค์๋๋ฅผ ํ์ด๋ผ์ดํ
ํจ
โค ์๋ด์ ๋ต๋ณ
โจ
์๋ด์์ด ๋ต๋ณํจ
โฆ ํค์๋ ํ์ธ
ํค์๋๋ฅผ ์ฌ์ฉ์์๊ฒ ํ์ธํจ
โง ์ดํด ๋ชปํ ํค์๋ ํ์ด๋ผ์ดํ
์ฌ์ฉ์ ๋ฐํ ์ค ์ดํด ๋ชปํ ํค์๋ ํ์ด๋ผ์ดํ
6. 03 REPAIR STRATEGY
โก ํ์ธํ๊ธฐ
โจ
์ธํ
ํธ๊ฐ ๋ง๋์ง ๋ฌผ์ด ๋ด์ ํ์ธํจ
โข ๋ฐ๋ณต ์์ฒญ
โจ
๋ค์ ๋งํ๋๋ก ์์ฒญ
โฃ ์ต์
์ ์
โจ
์์๋๋ ์ธํ
ํธ๋ฅผ ์ ์ํจ
โฅ ํค์๋ ํ์ด๋ผ์ดํ
โจ
์ฌ์ฉ์ ๋ฐํ์ ํค์๋๋ฅผ ํ์ด๋ผ์ดํ
ํจ
โฆ ํค์๋ ํ์ธ
ํค์๋๋ฅผ ์ฌ์ฉ์์๊ฒ ํ์ธํจ
โง ์ดํด ๋ชปํ ํค์๋ ํ์ด๋ฆฌํ
์ฌ์ฉ์ ๋ฐํ ์ค ์ดํด ๋ชปํ ํค์๋ ํ์ด๋ผ์ดํ
์๋ฌ ํ์ ์์
โ ๋ฌด์
โจ
์ธํ
ํธ ์ ๋นํ ์ก์์ ๋ต๋ณ ์ ๊ณต
Assisted Self-Repair
์๋ฌ ํ์ ์์
+ ์ฌ์ฉ์๊ฐ repairํ๋๋ก ๋์์ค
System-Repair
์๋ฌ ํ์ ์์
+ ์์คํ
์ด repairํจ
Explicit Acknowledgement of Breakdown
์๋ฌ ํ์ ์์
โค ์๋ด์ ๋ต๋ณ
โจ
์๋ด์์ด ๋ต๋ณํจ
7. 04 METHODOLOGY
๋ ์ ๋ต์ฉ ๋น๊ตํ๋ Pairwise Comparison Experiment
โข Scenario : 48๊ฐ (3 context * 8 repair * 2 outcome success)
- Context : shopping/banking/travel
- Outcome success : ๋ ๋ฒ์งธ ๋ฐํ์ ๋ํ ์๋ต์ด ์ฑ๊ณตํ๋์ง, ์คํจํ๋์ง
โข Pairwise Comparison Experiment
- 8๊ฐ ์ค 2๊ฐ์ฉ ๋๋คํ๊ฒ 10์ ๋น๊ต
- ๋ ์ค ํ๋๋ฅผ ๊ณ ๋ฅด๊ณ ์ด์ ๋ฅผ ์ฐ๊ธฐ
10 ์ ๋น๊ต
* 3์ด ๊ฐ๊ฒฉ์ผ๋ก ๋งํ์ ์ฌ๋ผ์ด
vs.
โข Attention Check (10์ ์ค 2์)
- ์ด์ ๊ณผ ๋์ผํ ์์ผ๋ก ๋ณด์ฌ์ฃผ๊ณ ๋ต์ด ๊ฐ์์ง ํ์ธ
- ํด๊ฒฐํ ๊ฒ๊ณผ ํด๊ฒฐ๋ชปํ ๊ฒ์ด ์์ ๋, ํด๊ฒฐํ ๊ฒ์ ์ ํํ๋์ง
8. 05 RESULTS > Preferences of Repair Strategy
์์คํ
์ด ๋ฅ๋์ ์ผ๋ก ํด๊ฒฐํ๋ ค๋ ์ ๋ต์ ์ ํธ๋๊ฐ ๋์
โข ๊ฐ์ฅ ์ ํธ๋๊ฐ ๋์๋ Repair ์ ๋ต์ โโฃ ์ต์
์ ์โ
โข ๋ต๋ณ์ด ์คํจํ๋ ๊ฒฝ์ฐ์๋ โโค ์๋ด์ ๋ต๋ณโ์ ์ ๋ต์ ์ ํธ
โข Assisted Self-Repair ์ ๋ต์ ์ ๋ฐ์ ์ผ๋ก ์ ํธ๋๊ฐ ๋์
โก ํ์ธํ๊ธฐ
โข ๋ฐ๋ณต ์์ฒญ
โฃ ์ต์
์ ์
โฅ ํค์๋ ํ์ด๋ผ์ดํ
โค ์๋ด์ ๋ต๋ณ
โฆ ํค์๋ ํ์ธ
โง ์ดํด ๋ชปํ ํค์๋ ํ์ด๋ผ์ดํ
โ ๋ฌด์
โฃ ์ต์
์ ์
โค ์๋ด์ ๋ต๋ณ
โข ๋ฐ๋ณต ์์ฒญ
โฅ ํค์๋ ํ์ด๋ผ์ดํ
โง ์ดํด ๋ชปํ ํค์๋ ํ์ด๋ผ์ดํ
โ ๋ฌด์
โฆ ํค์๋ ํ์ธ
โก ํ์ธํ๊ธฐ
โฃ ์ต์
์ ์
โค ์๋ด์ ๋ต๋ณ
โฆ ํค์๋ ํ์ธ
โง ์ดํด ๋ชปํ ํค์๋ ํ์ด๋ผ์ดํ
โฅ ํค์๋ ํ์ด๋ผ์ดํ
โก ํ์ธํ๊ธฐ
โ ๋ฌด์
โข ๋ฐ๋ณต ์์ฒญ
All Data(n=1624) Successful(n=800) Unsuccessful(n=824)
9. RESULTS > Reasons for Preferences
โข Explicit Acknowledgement of Breakdown
- โโก ํ์ธํ๊ธฐโ๋ ๊ณต์ํ๊ณ ๋๋ํ๋ค ๋๋, ๊ทธ๋ฌ๋ ๋ฒ๊ฑฐ๋ก์
- ๋ ์ ๋ต ๋ชจ๋ ์ธ๊ฐ๊ณผ ๋น์ทํ๊ฒ ์์ฐ์ค๋ฌ์
- ๋ฐ๋ณต์ ์ด๊ณ ๋ฒ๊ฑฐ๋ก์ด ์ ์ ์ฑ๋ด ์ฌ์ฉ์ ๊ทธ๋ง๋๊ฒ ๋ง๋ค ์๋ ์์ ๋ฏ
โข System-Repair
- โโฃ ์ต์
์ ์โ์ ๊ฒฝ์ฐ ํจ์จ์ ์ด๊ณ ํ์ดํ๊ณผ ๊ฐ์ ๋
ธ๋ ฅ์ด ๋ ๋ฌ
- ์ฑ๋ด์ด ๋๋ํ๋ค ๋๋
- ์๋ง ํ์ค์์๋ ํญ์ ์ฌ๋ฐ๋ฅธ ์ ํ์ง๋ง์ ์ฃผ์ง ์์ ๊ฒ
- ๊ทธ๋ผ์๋ ์คํจ์ ๊ฒฝ์ฐ์๋ ์ ํธ๊ฐ ๋์ ๊ฒ์ ์๋ฏธ๊ฐ ์์
โข Assisted Self-Repair
- ์ฑ๋ด์ ๋ ๋๋ํ๊ฒ ๋ณด์ด๊ฒ ํจ
- ์ด๋ป๊ฒ ์ฑ๋ด์ด ๋์ํ๋์ง์ ๋ํ ์ดํด๋ฅผ ๋์์ค
- ํ์ง๋ง, ์์ฐ์ค๋ฝ์ง๋ ์์ (GUI ์์ ๋๋ฌธ)
- ํค์๋ ํ์ด๋ผ์ดํ
์ด ์ง๊ด์ ์ผ๋ก ์๊ณ ๋ฆฌ์ฆ ๋์์ ์ค๋ช
ํจ. ๊ทธ๋ฌ๋, ๋ค์ ๋ฐ๋ณต์ ์ด๊ณ ์ฅํฉํจ
- ์ดํด ๋ชปํ ํค์๋ ๋ณด์ฌ์ฃผ๊ธฐ๋ ๋ ๋ช
ํํ๋, ์ผ๋ฐ์ ์ธ ๋จ์ด๋ฅผ ์ดํด๋ชปํ๋ ๊ฒฝ์ฐ์๋ ๋ ๋๋ํด ๋ณด์ผ ๊ฒ
05
โฅ ํค์๋ ํ์ด๋ผ์ดํ
โฆ ํค์๋ ํ์ธ โง ์ดํด ๋ชปํ ํค์๋ ํ์ด๋ผ์ดํ
โฃ ์ต์
์ ์ โค ์๋ด์ ๋ต๋ณ
โก ํ์ธํ๊ธฐ โข ๋ฐ๋ณต ์์ฒญ
๊ฐ ์ ๋ต์ ์ ํธํ๋ ์ด์
11. DISCUSSION
Design Implication
โข ๋จ๋์ง์
์ ์ด๊ณ ๋ฐ๋ณตํ์ง ์๋ ๋ฐฉ๋ฒ์ผ๋ก Misunderstanding์ ์์ธํ๊ธฐ
โข ์์ฐ์ค๋ฝ๊ณ , ๋ฏธํ์ ์ผ๋ก, ์์ํ๊ฒ ๋ชจ๋ธ์ ์ค๋ช
ํ๊ธฐ
- Mechanical, unnatural, visually unappealing, hard to read, confusingํ์ง ์๊ฒ
- ํค์๋ ํ์ด๋ผ์ดํ
์ด ํจ์จ์ , ํด ์๋ฅผ ์๋ ์ ์์
โข ์ฌ์ฉ์๊ฐ ์ปจํธ๋กคํ๋ฉด์ ์ง๋ฅ์ ์ธ Repair์ ๋ต์ ์ทจํ๋๋ก
- ์์ด์ ํธ๊ฐ ์ ์ ์ ์ผ๋ก ๋ง๋ ํ๋์ ์ ์ํ ๋ ์ ํธ๊ฐ ๋์
โข ๊ฐ์ธ๊ณผ ์ปจํ
์คํธ๋ฅผ ์ฝ์ ์ ์๋
- ์ด ์ฐ๊ตฌ๊ฐ ๋ชจ๋ ์ํฉ์ ํฌ๊ดํ์ง๋ ์์
- ๋ฐ์ดํฐ ๋๋ ํผ๋๋ฐฑ ๊ธฐ๋ฐ์ ์ ๊ทผ์ผ๋ก ์์คํ
์ด adaptiveํ๊ฒ
06
12. 07 TAKEAWAY
โข Repair ์ ๋ต์ ํจ๊ณผ์ ์ธ ์ธ ๊ฐ์ง ์์
- ์๋ฌ์ ์์ธ์ ๋ณด์ฌ์ฃผ๋ ๊ฒ
- ์ฌ์ฉ์๊ฐ repairํ ์ ์๋๋ก ์์์ ์ ๊ณตํ๋ ๊ฒ
- ์ ๊ทน์ ์ผ๋ก repair์ ๋ํ ์ฃผ๋๊ถ์ ์ก๋๊ฒ
โข ์ฐ๊ตฌ์ ํ๊ณ๋ ๋ง์ ๋ณด์ด์ง๋ง, 8๊ฐ์ง repair ์ ๋ต์ ๋ํ ์ฌ์ฉ์์ ๋๋ต์ ์ธ ์ ํธ๋ ๋ฐ ์๊ฐ์ ์ฐธ๊ณ
โข ์ธ๊ฐ์ ๋ํ + XAI์์ ์๊ฐ์ ์ป์ ๊ฒ์ด ์๋ก์ด ๊ด์
- ํ์ง๋ง, ๋ณธ ์ฐ๊ตฌ์์ ์ฌ์ฉํ ๋ฐฉ๋ฒ์ text-based๋ง ๊ฐ๋ฅ + rule-based์์๋ง ๊ฐ๋ฅํ ๊ฒ ๊ฐ์โฆ
- Intent-based VUI์์ ๊ฐ๋ฅํ ๋ฐฉ๋ฒ์ ๋ญ๊ฐ ์์๊น?
โจ
Classifier์ confidence๋ฅผ ์ข ํ์ฉํด๋ณด๋ฉด ์ด๋จ๊น?
โข ํ๋กํ ํ์
์ผ๋ก ์งํํ repair ์ ๋ต ์ฐ๊ตฌ๋ ์์ง์ ์๋ ๋ฏโฆ
- ๋ฑ
ํค ์คํํ๋ฉด์ ๋๊ผ์ง๋ง, ์ ์ด๋ ์ด๋ ต๊ณ , ์ ๋ขฐ๋๋ ์์ด ๋ณด์
- ๊ทธ๋ ๋ค๊ณ WoZ๋ ๋ณธ ์ฐ๊ตฌ๊ฐ์ ์คํ์ ํ๊ณ๊ฐ ๋ง์ ๋ณด์
- ํ๋กํ ํ์
์ ์ ํจ์ฑ(?)์ ์ด๋ป๊ฒ ๋ณด์ํ ์ ์์๊นโฆ?