音声インタフェースと
Webアクセシビリティ
 西本卓也(東京大学)
  2008年11月15日


                1
インタフェースの原則
• 目標:音声インタフェース設計の体系化
 – 既存のHMIに関する提案の再構成
• 基本原則(1996)
 – 労力最少:移動量、回数、操作容易性
 – 透過性:状態理解、手順連想、フィードバック
 – 頑健性:誤入力防...
ワープロによる文書作成
• 目標
 – あるパラグラフをもう少し短くしたい(曖昧)
• 意図形成
 – ある文末で段落を変える(具体的決定)
• 行為系列の特定
 – カーソル移動、改行コード挿入、空白挿入、、
• 行為実行、状態知覚、状態解釈...
実行の淵と評価の淵
Norman, Draper (ed.) : User Centered System Design,1986.




                                                   ...
電話音声応答システム
• プロンプトの例:
  – 1:各イベントの時間・内容についてお知らせします。**
    *から音声でお答えください。
  – 2:***から音声でお答えください。各イベントの時間・
    内容についてお知らせします...
ミクロな実行・評価モデル
• 「一次元の揮発性メディア」としての音声
• AJAXも同型の問題?




                        6
実行と評価の不自然な対応
• 問題発見の切り口として
 – キー操作に対するフィードバックの遅れ
  • 「音切れ」の重要性
  • 音声対話システムにも同様の課題
 – システム状況の知覚
  • 不自然な因果関係から
 – 超早口化されて聞...
対策の例
• 音声インタフェース固有の快適性の追求
 – 専用TTSが必要:応答速度、情報伝達速度
 – 妥当な評価尺度、評価手法の確立
• タスクの本質的な構造に基づく設計
 – 画面ではなくアプリの情報を音声化
  • 対面朗読→模擬対話→...
対面朗読者と視覚障害者の対話の分析とその応用,
             情処研報, 2007-SLP-11, pp.55-60, Feb 2007.




階層化メニュー

特選御膳
  ・・・
松花堂弁当
スタンダード1
  ・・・・

...
MVCモデルとマルチモーダル
• MVC = Model / View / Controller
• View => Modality Component




                                    10
マルチモーダルIFの6階層モデル




               11
まとめ
• 音声IFとしてのWebアクセシビリティ
• マルチモーダルIFの原則
 – 問題点の抽出
 – 「実行」と「評価」の対応という観点から
 – 個別の問題に関する評価と改良
• 課題
 – もっと体系的な方法論
 – HTMLの現実に...
Upcoming SlideShare
Loading in …5
×

音声インタフェースとWebアクセシビリティ

1,606 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,606
On SlideShare
0
From Embeds
0
Number of Embeds
413
Actions
Shares
0
Downloads
2
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

音声インタフェースとWebアクセシビリティ

  1. 1. 音声インタフェースと Webアクセシビリティ 西本卓也(東京大学) 2008年11月15日 1
  2. 2. インタフェースの原則 • 目標:音声インタフェース設計の体系化 – 既存のHMIに関する提案の再構成 • 基本原則(1996) – 労力最少:移動量、回数、操作容易性 – 透過性:状態理解、手順連想、フィードバック – 頑健性:誤入力防止、修復容易性 • 構成原則(1996) – 初心者、熟練者、上級利用移行 • 導入原則(2008) – 有用性、適合性、妥当性 2
  3. 3. ワープロによる文書作成 • 目標 – あるパラグラフをもう少し短くしたい(曖昧) • 意図形成 – ある文末で段落を変える(具体的決定) • 行為系列の特定 – カーソル移動、改行コード挿入、空白挿入、、 • 行為実行、状態知覚、状態解釈、評価 • 海保 他:認知的インタフェース,新曜社,1991 3
  4. 4. 実行の淵と評価の淵 Norman, Draper (ed.) : User Centered System Design,1986. 4
  5. 5. 電話音声応答システム • プロンプトの例: – 1:各イベントの時間・内容についてお知らせします。** *から音声でお答えください。 – 2:***から音声でお答えください。各イベントの時間・ 内容についてお知らせします。 • ユーザは少しずつプロンプトを聞く – 任意のタイミングでバージインできる – プロンプトを聞きながら何度も評価と実行を行う • 言語情報の効果:命令表現、文末表現 • 非言語/パラ言語情報(Raman: Auditory UI) – 効果音が鳴ったらプロンプトの最後 – 声の種類に意味を持たせる 高山 他: SP2001-132, 2002. 5
  6. 6. ミクロな実行・評価モデル • 「一次元の揮発性メディア」としての音声 • AJAXも同型の問題? 6
  7. 7. 実行と評価の不自然な対応 • 問題発見の切り口として – キー操作に対するフィードバックの遅れ • 「音切れ」の重要性 • 音声対話システムにも同様の課題 – システム状況の知覚 • 不自然な因果関係から – 超早口化されて聞き取り困難な合成音声 • 聞こえているのが「奇跡」 • 心的辞書が活用できないと聞こえないはず • 「バッドノウハウ」の温床 – 「次のリンク」を使って「斜め読みする」 – コンテンツを後ろからさかのぼって読む 7
  8. 8. 対策の例 • 音声インタフェース固有の快適性の追求 – 専用TTSが必要:応答速度、情報伝達速度 – 妥当な評価尺度、評価手法の確立 • タスクの本質的な構造に基づく設計 – 画面ではなくアプリの情報を音声化 • 対面朗読→模擬対話→読み上げ用HTMLアプリ • 「ショッピングカート」/アンドゥの重要性 – 開発が大変、効率化したい • Ruby on Rails + {VoiceXML or HTML} • モダリティ階層モデル – REST : Representational State Transfer – Galatea Dialog Studio としての実装 8
  9. 9. 対面朗読者と視覚障害者の対話の分析とその応用, 情処研報, 2007-SLP-11, pp.55-60, Feb 2007. 階層化メニュー 特選御膳 ・・・ 松花堂弁当 スタンダード1 ・・・・ カツカレー ステーキカレー 天むす 松花堂 「お気に入り」リスト 9
  10. 10. MVCモデルとマルチモーダル • MVC = Model / View / Controller • View => Modality Component 10
  11. 11. マルチモーダルIFの6階層モデル 11
  12. 12. まとめ • 音声IFとしてのWebアクセシビリティ • マルチモーダルIFの原則 – 問題点の抽出 – 「実行」と「評価」の対応という観点から – 個別の問題に関する評価と改良 • 課題 – もっと体系的な方法論 – HTMLの現実に即した問題解決 – Voice Webの可能性 • 音声認識の有用性と適合性?? 12

×