音声インタフェースと
Webアクセシビリティ
 西本卓也(東京大学)
  2008年11月15日


                1
インタフェースの原則
• 目標:音声インタフェース設計の体系化
 – 既存のHMIに関する提案の再構成
• 基本原則(1996)
 – 労力最少:移動量、回数、操作容易性
 – 透過性:状態理解、手順連想、フィードバック
 – 頑健性:誤入力防止、修復容易性
• 構成原則(1996)
 – 初心者、熟練者、上級利用移行
• 導入原則(2008)
 – 有用性、適合性、妥当性
                           2
ワープロによる文書作成
• 目標
 – あるパラグラフをもう少し短くしたい(曖昧)
• 意図形成
 – ある文末で段落を変える(具体的決定)
• 行為系列の特定
 – カーソル移動、改行コード挿入、空白挿入、、
• 行為実行、状態知覚、状態解釈、評価

• 海保 他:認知的インタフェース,新曜社,1991

                             3
実行の淵と評価の淵
Norman, Draper (ed.) : User Centered System Design,1986.




                                                           4
電話音声応答システム
• プロンプトの例:
  – 1:各イベントの時間・内容についてお知らせします。**
    *から音声でお答えください。
  – 2:***から音声でお答えください。各イベントの時間・
    内容についてお知らせします。
• ユーザは少しずつプロンプトを聞く
  – 任意のタイミングでバージインできる
  – プロンプトを聞きながら何度も評価と実行を行う
• 言語情報の効果:命令表現、文末表現
• 非言語/パラ言語情報(Raman: Auditory UI)
  – 効果音が鳴ったらプロンプトの最後
  – 声の種類に意味を持たせる
                        高山 他: SP2001-132, 2002.
                                           5
ミクロな実行・評価モデル
• 「一次元の揮発性メディア」としての音声
• AJAXも同型の問題?




                        6
実行と評価の不自然な対応
• 問題発見の切り口として
 – キー操作に対するフィードバックの遅れ
  • 「音切れ」の重要性
  • 音声対話システムにも同様の課題
 – システム状況の知覚
  • 不自然な因果関係から
 – 超早口化されて聞き取り困難な合成音声
  • 聞こえているのが「奇跡」
  • 心的辞書が活用できないと聞こえないはず
• 「バッドノウハウ」の温床
 – 「次のリンク」を使って「斜め読みする」
 – コンテンツを後ろからさかのぼって読む
                          7
対策の例
• 音声インタフェース固有の快適性の追求
 – 専用TTSが必要:応答速度、情報伝達速度
 – 妥当な評価尺度、評価手法の確立
• タスクの本質的な構造に基づく設計
 – 画面ではなくアプリの情報を音声化
  • 対面朗読→模擬対話→読み上げ用HTMLアプリ
  • 「ショッピングカート」/アンドゥの重要性
 – 開発が大変、効率化したい
  • Ruby on Rails + {VoiceXML or HTML}
  • モダリティ階層モデル
     – REST : Representational State Transfer
     – Galatea Dialog Studio としての実装


                                                8
対面朗読者と視覚障害者の対話の分析とその応用,
             情処研報, 2007-SLP-11, pp.55-60, Feb 2007.




階層化メニュー

特選御膳
  ・・・
松花堂弁当
スタンダード1
  ・・・・


 カツカレー
 ステーキカレー
 天むす
 松花堂
「お気に入り」リスト                                        9
MVCモデルとマルチモーダル
• MVC = Model / View / Controller
• View => Modality Component




                                    10
マルチモーダルIFの6階層モデル




               11
まとめ
• 音声IFとしてのWebアクセシビリティ
• マルチモーダルIFの原則
 – 問題点の抽出
 – 「実行」と「評価」の対応という観点から
 – 個別の問題に関する評価と改良
• 課題
 – もっと体系的な方法論
 – HTMLの現実に即した問題解決
 – Voice Webの可能性
   • 音声認識の有用性と適合性??

                         12

音声インタフェースとWebアクセシビリティ