Nishimoto2006 wit03 v5-compact

717 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
717
On SlideShare
0
From Embeds
0
Number of Embeds
9
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Nishimoto2006 wit03 v5-compact

  1. 1. 対面朗読者と視覚障害者の 対話の分析 西本卓也(東京大学) 小川佳奈子・渡辺隆行(東京女子大学) 2006-03-22
  2. 2. 2 はじめに  視覚障害者のコンピュータ利用  現状=音声・点字/キーボード  コンピュータとの自然な音声対話への期待  どのような音声対話システムが必要か?  人間同士の対話に学ぶべき  普通の人の会話ではなく「達人の技」に注目したい  対面朗読者  視覚障害者を支援する「達人」
  3. 3. 3 対面朗読者と視覚障害者の対話 課題:ケータリングサービスのメニューで昼食を選ぶ
  4. 4. 4 38 3:20 うん~。全体的にあのー、全 部こう和食でその中から選ぶ という 39 そうですね、えーと全部、全体 に和食でございますが 40 はいはい 41 その中に、今日はお値段関係 ないので、 42 えぇ 43 5000円のオードブルを頼んで もいいかも。 44 ははは・・・それはそれとして 45 総論がそうですね 46 はいはい 47 えーと、
  5. 5. 5 82 5:05 あなたの食べたそうな 83 うーん 84 全体が似てるのでお勧めする 私も迷います。 85 もう一度、すみません、もう一 度大きな分類を読んでもらえ ますか。なんとか御膳とか。 86 5:19 特選御膳ていうのはですね、 87 はいはい 88 そのなかの例えば、例えば申 し上げてみますと、てんぷら 御膳だったり、 89 あ~えぇ 90 ビーフステーキ御膳だったり、 91 はい、えぇ 92 和風ハンバーグ御膳だった りってな感じですね。 う~ん
  6. 6. 6 299 14:12 名前だけ 300 名前だけ言いますね 301 えぇどうぞ。 302 2、チキンカツ。 303 はい。 304 3、チキンカツ&ハンバーグ。 305 はい。 306 4、天むす弁当。 307 おぉ。 308 5、洋風ミックス。 309 はいはい。 310 6、天ぷら。 311 はい。
  7. 7. 7 603 34:02 どれとどれは捨てますか?どれ を浮上させますか? 604 いやー今のところ、もう私の中で は、ビーフステーキ御膳か、カツカ レーか、ステーキカレーか、天む すか、あとはなんだっけな、あとは その、、、松花堂の中かっていう気 にはなってるんですが。 605 まだ到着地点は遠いですね~。 606 あ~。そっかカレーはサラダが付く んですよね? 607 あぁそうでしたね、サラダ付きと なってますけれどもその写真が ないだけに 608 まあそんなに 609 サラダのそのボリューム、たとえ ば海草サラダなのか、チキンサ ラダなのか、なんですか、
  8. 8. 8 695 40:40 そうしましょう。 696 そうですね。じゃぁ松花堂弁当、 Eのあやめをお赤飯を入れてと 697 はいはい 698 こういうことになりましたが 699 はい 700 はい、よろしいですか? 701 まぁね、あまり悩みすぎても仕 方がない。けっこうなやんだなぁ。 702 このようにしてメニューを選んだ ことがありますか? 703 ここまで熟考したことはないなぁ。 704 じゃぁ以上決まったようでござい ます。ありがとうございました。
  9. 9. 9 対面朗読技術の有効性(仮説)  1)ショッピングカートモデル 階層化メニューから何かを選択する  2)音訳技術 視覚に依存しないで情報を伝える  3)対面朗読技術 3a) 大局的理解(全体把握、比較、再構造化) 3b) 双方向性(確認、共同作業)
  10. 10. 10 1) ショッピングカートモデル  階層化メニューから選択 リスト:アイテム、カテゴリ 説明:アイテム、カテゴリ 操作:カートに入れる(出す) 操作:カート内容の確認、比較、決定  多様なアプリケーションとの類似性 レストランのメニュー選択 操作マニュアルや辞書の検索 カツカレー ステーキカレー 天むす 松花堂 特選御膳 ・・・ 松花堂弁当 スタンダード1 ・・・・ 階層化メニュー ショッピングカート
  11. 11. 11 音声対話によるモデル化  対象の全体把握  リストの読み上げ 気になったアイテムはカートに入れる 複数の候補アイテムがカートに入る  カート内容の詳細説明 詳細情報を聞いて取捨選択  カート内に残ったアイテムを確定 カツカレー ステーキカレー 天むす 松花堂 特選御膳 ・・・ 松花堂弁当 スタンダード1 ・・・・ 階層化メニュー ショッピングカート
  12. 12. 12 2) 音訳技術  視覚障害者のための音訳図書の作成  ノウハウが蓄積されている  ボランティアのためのマニュアルの存在  視覚に依存しないで情報を伝える  言語情報  記号、同音異義語、ルビ、注など  図表や写真の説明  非言語情報  抑揚、ポーズ、アクセントなど
  13. 13. 13 音訳マニュアルより:韻律  (H 私たち)の学校は (H 山の上)に(L あります)。  (H 今日は)(H 運動会)の予定でしたが、 (H 朝から)(H 雨が)降っていたので 中止に(L なりました)。
  14. 14. 14 音訳マニュアルより:ポーズ  かわいい(P)女性のための喫煙具が 人気の的です。  有名な(P?)大学の(P?)先生がいる。  太めの(P)時計のバンドを買った。  私の背の高さ位の(P)リンゴが たくさんなっている木。
  15. 15. 15 3) 対面朗読技術  視覚障害者に本などを読むサービス 双方で相談しながら進める 家電操作、ケータリングなどの支援も  ノウハウを記した文献が少ない  熟練者の振る舞いを観察するべき
  16. 16. 16 対話実験  手順:書き起こし、意図記述、タグ付与  対話の所要時間=約40分 発話数の合計=約700 相槌=183 (頷き:ほとんどなし)  利用者の談話行為=69%が「依頼」と「示唆」 利用者の傾向=まず全体を聞く  朗読者の発話=96%が「陳述」 利用者の質問や要望に答える
  17. 17. 17 仮説1) の検討(カートモデル)  対話=ショッピングカートモデル  ただしアイテムとカテゴリが混在可 アイテム「カツカレー」 カテゴリ「松花堂」(アイテム「あやめ」「橘」)  朗読者が戦略を提案 「今日はこれが食べたい・・・てなやり方も ありますでしょ」(26:50)
  18. 18. 18 仮説2) の検討(音訳技術)  詳細説明=写真の言語化など 「お弁当の折り詰めの中の配置は・・」(06:05)  リストの読み上げ アイテム総数の読み上げ(13:47) アイテムの通し番号の読み上げ(14:52) リスト読み上げの終了を宣言
  19. 19. 19 仮説3a) 大局的理解=全体把握  「何があるか」+「何がないか」 「全体に和食です」 「麺類はなさそうですよ」  知識が必要(利用者が何を求めているか)  利用者は例外の有無を確認する 「冷やし中華とかはありますか?」 「うなぎは?」
  20. 20. 20 仮説3a) 大局的理解=メタな議論  カタログの構成 「1つのメニューに1つの写真がついている?」 (06:34)  アイテムの命名 「名前から内容がわからないネーミング?」 (07:54)
  21. 21. 21 仮説3a)大局的理解=比較の支援  他との比較による特徴の説明 天むすは「白いご飯にごまかけじゃなくて」 (19:01)  2つのアイテムの差分による説明 2500円と3000円の違いは「フルーツのみ」 (38:26)
  22. 22. 22 仮説3a)大局的理解=視点の変更  効率化:省略の利用 「御膳、省略しますよ。 洋風ハンバーグ(御膳)・・・」(21:50)  ユーザの興味に応じて呼び方を変える 「AB若菜、桐」 →「(価格で)1500, 2000, 2500, 3000・・・」 (36:11)
  23. 23. 23 仮説3b) 双方向性  要求の確認 「希望は和風、洋風、中華、天むす、 だいたいこんな感じ?」(20:49)  理解の確認=用語を理解できるか 「かんぴょう分かりますか?」(29:51)  記憶の確認 利用者「天むすが3つで、あとは・・」 朗読者「そうですね」(29:05)
  24. 24. 24 仮説3b) 双方向性=共同作業  読み上げ中の相槌  朗読者の誤りを相槌の代わりに指摘  「5.鳥照り焼き」「はい」「5.ビーフステーキ」 「あ、6ですね」(21:58)  発見(スタンダード1と2の違いは?)  「1と2の違いってわかりますか?価格帯ですか?」 (12:21)  「700円800円代が1、2が1200円クラス、みたいですね」 (12:40)(13:05)
  25. 25. 25 考察:対面朗読者との目的指向対話  利用者の行為=何らかの最適化 全体を把握して納得できる選択を できるだけ少ない時間や労力で  対面朗読者=利用者の最適化行為を支援 全体を見通して情報を伝える 実時間かつ双方向のやりとり  朗読者が利用者の要求を理解している
  26. 26. 26 まとめ  対面朗読における対話の分析 ショッピングカートモデル 音訳技術 対面朗読技術(大局的理解+双方向性)  今後の課題 被験者を増やす/仮説の詳細検討 実装と評価  対話のモデル化/利用者要求理解

×