ヒューマンインタフェース学会研究報告集 Vol.2 No.5, pp.33-38, Dec 2000.

発表:2000年12月15日

更新:2012年6月5日

視覚障害者のための電子メール環境における
操作性の検討

Designing the e-mail software for visually impaired persons

西本 卓也, 住吉 悠希, 荒木 雅弘, 新美 康永

京都工芸繊維大学 工芸学部 電子情報工学科
〒606-8585 京都市左京区松ヶ崎御所海道町

目次


1. はじめに

視覚障害者は通常 GUI (Graphical User Interface) を前提としたソフトウェアを 音声化して利用している。 しかし GUI ベースのソフトウェアの音声化では 視覚障害者が真に使いやすい環境は実現しにくいという指摘があり、 Emacspeak(文献7) に代表される AUI (Auditory User Interface) の概念も提案されている。 我々は、これらの議論は GUI そのものの問題ではなく、GUI の影響により アプリケーションの概念モデルやコマンド体系、フィードバックなどの 設計および実装が異なっていることに問題の本質があると考える。

このような問題に関する予備的な検討として、今回我々は、 GUI を前提としつつ音声読み上げに対応した2種類のメールソフトと Bilingual Emacspeak のメール環境について、 音声読み上げとキーボード入力のみを用いた場合の操作性の 比較検討を試みた。

目次へ戻る


2. 背景

厚生省の調査 (平成8年身体障害者実態調査及び身体障害児実態調査の概要について) によると、平成8年度における視覚障害者の推計値は305,000人であるが、 そのうちパソコンが使える人は1,000人である。 また点字が使える人はすべての視覚障害者の10%未満である。 点字が意外に普及していないのであるが、その理由としては、 生まれたときから視覚がない人は点字を学ぶ時間に恵まれており熱意もある反面、 成人した後に視覚を失った人には点字を習得することは苦痛である、 といった事情がある。

一方で、視覚障害者がパソコンを使えるようになることの社会的意義は大きい。 従来視覚障害者は点字や朗読テープといったメディアからの情報収集に頼っていたが、 電子メール、ワープロ、インターネットなどを使うことで、 即時性のある情報の送受信やコミュニケーションの手段を得ることができる。

現在、Windows環境で画面表示内容を読み上げる スクリーンリーダ・ソフトウェアが比較的低価格で入手可能となっている。 しかし、パソコンやWindowsの全く初心者である視覚障害者には、 自宅で介助者がない状況では自ら起動や終了することすらできない。 そこで、視覚障害者に特化された「インターネット講座」が必要となるのだが、 現状ではそのような機会は非常に限られている。

非営利団体(NPO)のSCCJ(日本サスティナブル・コミュニティ・センター)は、 「視覚障害者のためのインターネット講座」を1999年5月より定期開催したところ、 京都で開催しているにも関わらず、大阪、神戸、和歌山、奈良、 滋賀など他府県からも積極的な参加があった。 2000年秋からは WIN 京都という組織となり、ボランティアベースでの運営が続いている。

この講座のカリキュラムは、インターネットを教えるのが目的であるにも関わらず、 受講者にタッチタイピング操作を覚えてもらうために、 15回のコースのうちの半分くらいを使わざるを得ない。 特に遠方から通う受講者の負担を考えると、 これがこの講座において大きな問題となっている。 もし自宅に持ち帰ってタイピング操作の練習ができるような環境があれば、 本講座における7〜8回分のタイピング練習を5回程度減らすことができ、 その時間をインターネット講座の充実に回すことが可能となる。

文字入力はパソコンを使う上での大きなハードルとなっている。 にも関わらず現在、視覚障害者を対象とした 日本語タイピング練習用ソフトウェアは存在しない。 そこで、我々はまず「視覚障害者のためのインターネット講座」を支援する目的で、 視覚障害者のためのタイピング練習ソフト「打ち込み君」の開発を行った (文献9)(文献10)

本稿では、「打ち込み君」によってタイピングを学んだ視覚障害者が、 その後の電子メールやウェブなどのアプリケーションをいかに学ぶべきか、 また、どのようなソフトウェアを選択し改良すべきであるかを、 現実的な立場から検討する。

目次へ戻る


3. 視覚障害者のためのアプリケーション

視覚障害者のための情報ディスプレイ手段としては 触図や点字などがある(文献2)。 これらは2次元情報の表現に優れるが、 即時性が求められる状況では音声合成を用いる方が好ましい。 例えば清田ら(文献3)は中途失明者を対象とした オンライン文字認識システムにおいて、 認識後の候補選択に音声合成を用いるシステムを提案している。

パソコンの画面表示を外付けの 音声合成装置を利用して読み上げるソフトウェアとしては、 MS-DOS対応のVDM100 ((株)アクセステクノロジー製) (文献1) などが広く用いられてきた。 MS-DOS 環境ではパソコン通信などは可能であるが、 インターネット対応のアプリケーションはほとんど利用できないため、 MS-DOS システムを利用してきた多くの視覚障害者が、 近年 Windows 環境への移行を迫られている。

Windows 環境においては、標準ハードウェアのみで テキスト音声合成が利用できるようになった。 これに伴い、 スクリーンリーダとよばれる低価格なソフトウェアによって、 ファイル管理・ワープロ・表計算などのアプリケーションが 視覚障害者にも利用できるようになった。 Windows 95/98に画面読み上げ機能を付加する スクリーンリーダとしては 95Reader ((株)システムソリューションセンターとちぎ製) や PC-Talker(高知システム開発)、 outSPOKEN(富士通中部システムズ)などがあり、広く用いられている。 海外では評価の高い JAWS (Henter-Joyce) の日本語化も予告されている。

しかしスクリーンリーダのみでは、 画面表示を前提とした既存のアプリケーションを すべて音声化することはできない。 そこで、スクリーンリーダが個別のアプリケーションに合わせた処理を行ったり、 アプリケーション開発者がスクリーンリーダのAPIを用いることで (文献5)、 個々のアプリケーションのバリアフリー化を行う必要がある。 このような状況を改善するために MicrosoftなどのOSメーカーがアクセシビリティに関するガイドラインを 発表したり、専用の API を整備している (例)

キーボード入力と音声出力によって操作可能な WWWブラウザについては藤原らの報告(文献6)がある。 また、完成度の高いフリーソフトとして大阪府立盲学校の 横田陽氏による VoiceExplorer がある。 商品としては IBM ホームページ・リーダー が入手可能である。

Windows に代表される GUI 環境は、 近年、晴眼者のコンピュータ利用を大幅に促したが、 一方で視覚障害者に対しては、 ディスプレイ上の空間把握という新たな負担を強いている。 このような問題を解決するために、 GUI情報を立体音響などで表現する研究(文献4)がある。

一方で、UNIX環境で利用可能な音声化システムとしては Emacs Lisp によって実装された Emacspeak(文献7)がある。 Emacspeak の日本語化およびWindows環境への移植は BEP (Bilingual Emacspeak Project) によって行われている (文献8)。 UNIX の統合デスクトップ環境である GNOME のアクセシビリティに関する活動 もある。

目次へ戻る


4. 音声化インタフェースの設計指針

ここではソフトウェアの視覚障害者対応において 参考にすべき設計指針について述べる。

4.1 GUI音声化の指針

GUIを視覚障害者にも利用可能とするための指針については、 すでにいくつかの提案がある。

国内では通産省が平成7年に定めた 「障害者等情報処理機器アクセシビリティ指針」が 平成12年に「障害者・高齢者等情報処理機器アクセシビリティ指針」 通商産業省告示第三百六十二号 に改定されている。 この指針ではアクセシビリティ機能を以下の2つに分類している。

(a) 付加機能(Adaptive function)
標準的なハードウェア及びソフトウェアを使いやすくする機能
(b) 代替機能(Alternative function)
標準的なハードウェア及びソフトウェアの代替手段として提供する機能

特に視覚障害への配慮としては以下が推奨されている。

(a) 付加機能
キーボードのみによる操作機能、 キーボード操作の音声フィードバック機能、 キーの識別手段(突起など)、 ポインタやカーソルを見やすくする機能、 画面の拡大表示機能、 画面の配色変更機能、 出力情報の多重表現機能、 入力操作の取り消し、 メニュー階層のわかりやすさや表示方法の配慮、 不要な情報のアクセス制限、 入力予測機能
(b) 代替機能
点字入力機能、音声入力機能、 音声出力による文字入力支援機能、 音声読み上げ機能、 点字・触覚ディスプレイ

また、渡辺ら(文献5)は、 視覚障害者対応のインタフェース要件として Microsoft社のアクセシビリティ・ガイドラインに 独自の要件を加えて、以下を挙げている。

これらの指針に従っているソフトウェアは、 すべての操作をキーボード入力と音声出力のみによって 行うことが可能になる。 GUI ベースのアプリケーションでありながら スクリーンリーダを用いて音声化できる 電子メールソフトウェアとして Winbiff ((株)オレンジソフト製 Winbiff without EditX) や MMメール (宮崎嘉明氏によるシェアウェア) 、ユニメール ((株)アメディア製) などがある。

4.2 UI部品の探索法

前述した指針は、 個々の UI 部品をどのような構成で配置して探索可能にすべきか、 という問題には触れていない。

藤原ら(文献6)は 既存のGUI用スクリーンリーダで用いられている UI部品の探索法を、 GUI の画面レイアウトに基づいた「画面構造探索」と、 すべての操作を論理的に階層化した木構造に基づいて行う 「論理構造探索」に分類している。 また、画面構造探索に加えてショートカット操作が可能なものを 「ショートカット付き論理構造探索」と呼んでいる。 仮想的なスクリーンリーダによる評価実験においては、 「ショートカット付き論理構造探索」ではキーストローク数が削減されるが、 タスク処理時間の短縮のためには「論理構造探索」の方が有効であることが 示されている。

4.3 AUIの設計指針

Emacspeak (文献7)もまた、 視覚的レイアウトは音声インタラクションには最適ではない、 という立場を取り、 アプリケーションと音声フィードバックの密な統合を目指している。

Emacspeak は GNU Emacs をプラットフォームに用いることで、 アプリケーションの内部情報に直接アクセスしつつ、 既存のアプリケーションの実装を最大限に生かしている。 BEP における Emacspeak の bilingual 対応作業も、 オリジナルの実装をなるべく生かす形で作業が進められている。

Emacspeak が提案するAUIは、 高品質な音声出力を前提とした 独自のインタフェース・システムである。 Emacspeak の実装は以下のような方針で行われている。

Emacspeak は 音声合成装置 DecTalk の利用を前提として実装されたが、 現在はいくつかの音声合成ソフトウェアにも対応している。

目次へ戻る


5. 初心者ユーザへの配慮

アクセシビリティと同時に初心者ユーザへの配慮が必要な場合もある。 特に視覚障害者に対してソフトウェアの概念モデルを教示することは難しい。

例えば Oxford Brookes University で開発された 中途失明者用ウェブブラウザ BrookesTalk において、 初心者がソフトウェアの概念モデルを頭の中に作るのに苦労している、 ということが報告されている(文献11)

音声アプリケーションの操作能力は被験者の短期記憶の能力と関連があり、 現実に中途失明者には高齢者でかつ短期記憶の衰えている場合が多い。 そこで BrookesTalk は以下のような配慮をしている。

ソフトウェアの概念モデルを簡易化するためには、 アプリケーションの設計における配慮が重要となる。 このような試みとして、視覚障害者を前提としたものではないが、 高齢初心者のためのパソコン通信ソフト 「めーるでぽん!」に関する 報告(文献12)(文献13)がある。 単に搭載機能を最低限化するだけでなく、 「メールを書く」「メールを読む」といった具体的な目標を メニュー項目として採用し、すべての操作が ウィザード方式 (表示される質問に答えていくだけで全ての作業を行える) で提供されているところが特徴である。

目次へ戻る


6. 既存メールソフトの比較

例えば、 WindowsはGraphical User Interface (GUI) による画面の直感的操作を前提と するため、スクリーンリーダーの助けを借りても視覚障害者が使いにくいOSで あった(文献14)、といった主張がある。 このような主張は

といった結論を導きがちである。 我々の当初の興味は、このような主張が妥当であるか、 かつて妥当であったとしても現在の状況で通用する 主張であるか、といった検討であった。

もちろん、充分に一般性のある議論としてこのような考察を行うことは難しい。 なぜならば、視覚障害にも程度差があるし、失明の時期や コンピュータの熟練度、ユーザごとの用途や好みによって、 このような問題は左右されるからである。 だが、 何らかの前提条件 (例えば、我々がサポートしている 「視覚障害者のためのインターネット教室」に貢献するかどうか) を設定すれば、 それに応じて適切なソフトウェアを選択する指針を導いたり、 Bilingual Emacspeak などのオープンソースソフトウェアを改良するための 手掛かりが得られると考えらえる。

すでに述べた音声化のための指針や、 一般的なユーザインタフェースの原則論は、 これらの評価を行うための尺度として用いることができる。 具体的な評価方法としては、 個々のソフトウェアの仕様や設計に基づいて検討する評価方法と、 それらを被験者実験で評価する方法が挙げられるが、ここでは 前者に関する検討について述べる。

検討対象としたのは Windows 環境で動作する以下のソフトウェアである。

6.1 概念モデルの比較

Winbiff, MMメール, Mew の各アプリケーションの概念モデルを 図1 図2 図3 に示す。 ただしここでの概念モデルとは、 ユーザからみたアプリケーションの状態と、 それらの状態間の遷移に対応する操作をまとめたものである。 また、これらは各ソフトウェアの機能をすべて挙げたわけではなく、 メールの読み上げ、新規メールの作成、返信、 アドレス登録、といった基本的な操作に限定している。


図1. Winbiffの概念モデル


図2. MMメールの概念モデル


図3. Mewの概念モデル


Winbiff および MMメールは Windows の標準的な UI に準拠しており、 一つのウィンドウの中に複数の UI 部品が階層的に配置されている。 特に MM メールにはテキストのみによるオンラインマニュアル (視覚障害者にはこの形態が望ましい) が添付されており、 その中で「操作窓」という言葉が用いられている。 例えば、新規メールの作成では新たなウィンドウが開くが、 そこには 「送信ヘッダー設定」「送信メール内容の編集」 「送信添付ファイルのリストビュー」の3つの操作窓がある。 そして、各操作窓へは TAB キーで選択移動できる、と説明されている。 ただし、実際には「送信ヘッダーの設定」という操作窓の中に TAB で移動できる複数の項目が存在しており、 「操作窓」の遷移と TAB キー操作が1対1に対応していない状況もある。

Winbiff のマニュアルには操作窓という用語はないが、 UI要素の構成は MMメールとほぼ同等で、 ウィンドウと操作窓の2階層構成が基本である。 いずれも、操作窓間の遷移は TAB キーで行い、 コマンドの実行などに伴うウィンドウ間の状態遷移は それぞれのコマンドに対応するキー操作で行われる。

Mew はUI構成要素に階層がない。 これは、個々のモードの実体が単純なテキスト編集バッファであり、 Windows UI で操作窓に相当する要素のすべてに対して カーソルの上下移動のみでアクセスできるからである。 Windows UI では、操作窓の移動には TAB キーを用い、 メール本文の操作窓ではカーソル上下移動を用いるが、 Mew は階層が少ないうえ、操作にも一貫性がある。

6.2 出力とフィードバック

Windows UI は、スクリーンリーダの助けを借りることによって、 階層化されたプルダウンメニューを読み上げることができ、 項目名を聞きながら、必要な機能を探すことができる。 また、メニュー項目名にショートカット操作が付与されていれば それも読み上げるので、ショートカット操作を調べるための 簡易ヘルプとしても機能している。 視覚的な操作を前提とした機能が、音声化されても有効に機能している。

Mew のプラットフォームである Emacs にもプルダウンメニュー機能は存在する。 しかし我々は、 Emacspeak によって Emacs のプルタウンメニューを 読み上げることができていない(不可能ではないと思われる)。 ヘルプ機能としてのプルダウンメニューがないという前提では、 特にコンピュータの初心者が Mew を使用することは困難になる。 Mew の各機能を mew-summary-show といったコマンド名で呼び出したり 対応するキーバインドを検索することはできる。 しかしこのような名前は必ずしも直感的に覚えられるものではない。

現状の Bilingual Emacspeak では多くの音声メッセージが 英語エンジンによる英語の読み上げになっており、 英語の音声合成を聞き取ることに不慣れなユーザには Bilingual Emacspeak の利用は難しい。

例えば MM メールは単に画面表示を読み上げるだけでなく、 操作窓の移動操作に対して、 移動先の操作窓の名前を音声によってフィードバックする。 このようにシステムの状態把握を容易化する機能は、 Mew では非常に少ない。

メール本文の読み上げにおいても、Mew と Windows 系では大きな違いがある。 つまり、Windows 系の2つのソフトは読み上げたいメッセージを選択しただけで 本文の読み上げを開始する(なんらかのキー操作によって中断する)が、 Mew においては、メッセージを選択したのちに、メッセージモードで カーソルを上下移動して1行ずつ読んでいく、という流れになるのである。

Emacspeak は多くのフィードバックを聴覚アイコンや音声フォントによって行う。 これによって、既存のスクリーンリーダでは不可能だった、 豊かで効率的なフィードバックを提供することが可能となる。 ただし、環境構築上の問題があり、我々はまだこの点を充分に評価できていない。 また、プログラミングやウェブブラウザと異なり、 電子メールにおいて複数の音声フォントが有効に機能する場面はそう多くないと思われる (引用部分の音声を変える、といった程度である)。

6.3 キーボード操作における配慮

Windows 系のメールソフトは、 すべての操作をメニューから選択して実行するのであれば、 カーソルキーやEnterキーなどを中心とした流れになる。 しかし、ショートカット操作においては Alt キーや Ctrl キーなどとの同時打鍵が前提となる。

Mew にも Ctrl キーとの同時打鍵が必要な操作は多いが、 アルファベットキー1文字に対して多くの重要なコマンドが 割り当てられている。 また、タッチタイピングにおいてホームポジションから あまり手を動かさなくても操作できる割り当てになっている。

6.4 各メールソフトの位置付け

これらの検討から改めて明らかになるのは、 個々のソフトウェアの位置付けの違いである。

つまり、インタフェースの構成が 初心者ユーザへの対応の程度と 上級ユーザへの移行支援の トレードオフの関係にあると考えるとき (文献15) 「めーるでぽん!」のような単機能ソフトは 初心者対応度に重きをおいた構成、 Emacspeak は上級利用移行支援に重きをおいた構成、 MMメールやWinbiffはその中間的な構成であると 考えられる(図4)


図4. インタフェース構成のトレードオフ


GUI はこのトレードオフ曲線を「高い初心者対応度」の方向に 持ち上げる貢献をしていた。 例えば、視覚的に目立つ場所には初心者対応の要素を置き、 目立たない場所に上級利用支援の要素を置く、といった方法が可能である。

キーボード入力と音声出力という枠組みに制限されると、 トレードオフ曲線は初心者対応度が全体的に低くなってしまう。 仮に初心者対応度が高いシステムを実装したとすると、 熟練者が求める高機能や効率性と両立が困難になると考えられる。

目次へ戻る


7. まとめと課題

視覚障害者が音声出力によって利用可能な 電子メール環境の操作性について検討した。 特に既存の電子メール用ソフトウェアのいくつかについて、 設計と実装を検討した結果について述べた。 また、これらソフトウェアの相互の位置付けについて、 インタフェース構成のトレードオフのモデルを用いて考察した。

今後の課題について述べる。 本稿で述べたような個々のソフトウェアについて より定量的な実験を行う必要がある。 また、初心者ユーザが望むであろうソフトウェアとして、 「めーるでぽん!」のようにシンプルで 音声化されたメール環境を実現することが望まれる。 さらに、 前述したトレードオフ曲線そのものを、 例えば音声入力を用いて改善できると思われる。 その方法としては、 音声入力を前提としたまったく新しいコミュニケーション環境の 実現(文献16)と、 Emacspeak など上級者向けソフトウェアにおいて、 音声対話エージェントを用いて操作方法のアシストのみを行う、 といった方法が考えられる。

目次へ戻る



参考文献

[文献1] 斎藤正夫: ``視覚障害者支援ソフトウェアの製作,'' 情報処理, Vol.36, No.12, pp.1116--1121 (1995).

[文献2] 大武信之, 小川靖彦, 米沢義道: ``アクセシビリティ向上化システム---視覚障害者のためのコミュニケーション環境---'', 電子情報通信学会論文誌 A Vol.J79-A No.2, pp.302-309, (1996-2)

[文献3] 清田公保, 江崎修央, 柳井貴志, 山本眞司: ``視覚障害者のためのオンライン日本語入力インタフェースの基本設計'', 電子情報通信学会論文誌 A Vol.J79-A No.2, pp.310-317, (1996-2)

[文献4] 材塚俊之,高橋久,助田浩子,永松健司,畑岡信夫: ``障害者対応マルチメディアシステムの開発 ---三次元音場利用情報提示システム---'' 電子情報通信学会 第二種研究会資料 WIT99-8, pp.47-52, (1999-11).

[文献5] 渡辺哲也,岡田伸一,伊福部達: ``スクリーンリーダを活用した電子メディアのバリヤフリー化'' 電子情報通信学会論文誌D-I, Vol.J83-D-I No.1, pp.234-242, (2000-1).

[文献6] 藤原淳史, 堀内靖雄, 市川熹: ``視覚障害者用WWWブラウジングインタフェースの検討'' ヒューマンインタフェース学会論文誌 Vol.2, No.2, pp.31-38, (2000)

[文献7] T.V. Raman:``Auditory User Interfaces,'' Kluwer Academic Publishers (1997).

[文献8] 渡辺隆行, 井上浩一, 坂本貢, 本多博彦, 釜江常好: ``Bilingual Emacspeak for Windows; 日米2ヶ国語の豊かな音声表現力を持つEmacs'' 電子情報通信学会 信学技報 SP2000-46, pp.29-36, (2000-8).

[文献9] 高城敏弘, 西本卓也, 園順一, 浅野令子, 高木治夫: ``視覚障害者のためのモニターレス・キーボード練習環境'' 電子情報通信学会 第二種研究会資料 WIT99-30, (2000-3).

[文献10] 西本卓也, 荒木雅弘, 新美康永: ``視覚障害者のためのタイピング練習ソフト「打ち込み君」の改良'' 電子情報通信学会 第二種研究会資料 WIT00-21, pp.55-59, (2000-8).

[文献11] Mary Zajicek: ``The construction of speech output to support elderly visually impaired users starting to use the internet'' Proceedings of ICSLP2000, Volume I, pp.150-153, (2000-10).

[文献12] 瀬戸裕行, 吉田敦也: ``高齢者向けパソコン通信ソフトの試作'' 第??回ヒューマン・インタフェース・シンポジウム論文集, pp.637-642, (1997).

[文献13] 瀬戸裕行, 吉田敦也: ``高齢者向けパソコン通信ソフトの設計理念について'' 計測自動制御学会ヒューマンインタフェース部会 News and Report 1997 Vol12, pp.427-432, (1997).

[文献14] 石川准: ``GUI用スクリーンリーダの現状と課題---北米と欧州の取り組みを中心に---'' 情報処理, Vol.36, No.12, pp.1133-1139, (1995).

[文献15] 西本卓也, 志田修利, 小林哲則, 白井克彦: ``マルチモーダル入力環境下における音声の協調的利用 ---音声作図システムS-tgifの設計と評価---'' 電子情報通信学会論文誌 VOL.J79-D-II, pp.2176-2183, (1996-12).

[文献16] 西本卓也, 幸英浩, 川原毅彦, 荒木雅弘, 新美康永: ``非同期型音声会議システムAVMの設計と評価'' 電子情報通信学会論文誌 D-II, Vol.J83-D-II, No.11 pp.2490-2497, (2000-11).

目次へ戻る


by Takuya NISHIMOTO