視覚障害者のための電子メール環境における操作性の検討

Designing the e-mail software for visually impaired persons

西本卓也, 住吉悠希, 荒木雅弘, 新美康永

京都工芸繊維大学工芸学部電子情報工学科
〒606-8585 京都市左京区松ヶ崎御所海道町

視覚障害者は通常 GUI (Graphical User Interface) を前提としたソフトウェアを音声化して利用している。しかし GUI ベースのソフトウェアの音声化では視覚障害者が真に使いやすい環境は実現しにくいという指摘があり、 Emacspeak（文献7）に代表される AUI (Auditory User Interface) の概念も提案されている。我々は、これらの議論は GUI そのものの問題ではなく、GUI の影響によりアプリケーションの概念モデルやコマンド体系、フィードバックなどの設計および実装が異なっていることに問題の本質があると考える。

このような問題に関する予備的な検討として、今回我々は、 GUI を前提としつつ音声読み上げに対応した２種類のメールソフトと Bilingual Emacspeak のメール環境について、音声読み上げとキーボード入力のみを用いた場合の操作性の比較検討を試みた。

2. 背景

厚生省の調査（平成８年身体障害者実態調査及び身体障害児実態調査の概要について）によると、平成8年度における視覚障害者の推計値は305,000人であるが、そのうちパソコンが使える人は1,000人である。また点字が使える人はすべての視覚障害者の10%未満である。点字が意外に普及していないのであるが、その理由としては、生まれたときから視覚がない人は点字を学ぶ時間に恵まれており熱意もある反面、成人した後に視覚を失った人には点字を習得することは苦痛である、といった事情がある。

一方で、視覚障害者がパソコンを使えるようになることの社会的意義は大きい。従来視覚障害者は点字や朗読テープといったメディアからの情報収集に頼っていたが、電子メール、ワープロ、インターネットなどを使うことで、即時性のある情報の送受信やコミュニケーションの手段を得ることができる。

現在、Windows環境で画面表示内容を読み上げるスクリーンリーダ・ソフトウェアが比較的低価格で入手可能となっている。しかし、パソコンやWindowsの全く初心者である視覚障害者には、自宅で介助者がない状況では自ら起動や終了することすらできない。そこで、視覚障害者に特化された「インターネット講座」が必要となるのだが、現状ではそのような機会は非常に限られている。

非営利団体（NPO）のSCCJ（日本サスティナブル・コミュニティ・センター）は、「視覚障害者のためのインターネット講座」を1999年5月より定期開催したところ、京都で開催しているにも関わらず、大阪、神戸、和歌山、奈良、滋賀など他府県からも積極的な参加があった。 2000年秋からは WIN 京都という組織となり、ボランティアベースでの運営が続いている。

この講座のカリキュラムは、インターネットを教えるのが目的であるにも関わらず、受講者にタッチタイピング操作を覚えてもらうために、 15回のコースのうちの半分くらいを使わざるを得ない。特に遠方から通う受講者の負担を考えると、これがこの講座において大きな問題となっている。もし自宅に持ち帰ってタイピング操作の練習ができるような環境があれば、本講座における7〜8回分のタイピング練習を5回程度減らすことができ、その時間をインターネット講座の充実に回すことが可能となる。

文字入力はパソコンを使う上での大きなハードルとなっている。にも関わらず現在、視覚障害者を対象とした日本語タイピング練習用ソフトウェアは存在しない。そこで、我々はまず「視覚障害者のためのインターネット講座」を支援する目的で、視覚障害者のためのタイピング練習ソフト「打ち込み君」の開発を行った（文献9）（文献10）。

本稿では、「打ち込み君」によってタイピングを学んだ視覚障害者が、その後の電子メールやウェブなどのアプリケーションをいかに学ぶべきか、また、どのようなソフトウェアを選択し改良すべきであるかを、現実的な立場から検討する。

3. 視覚障害者のためのアプリケーション

視覚障害者のための情報ディスプレイ手段としては触図や点字などがある（文献2）。これらは２次元情報の表現に優れるが、即時性が求められる状況では音声合成を用いる方が好ましい。例えば清田ら（文献3）は中途失明者を対象としたオンライン文字認識システムにおいて、認識後の候補選択に音声合成を用いるシステムを提案している。

パソコンの画面表示を外付けの音声合成装置を利用して読み上げるソフトウェアとしては、 MS-DOS対応のVDM100 （（株）アクセステクノロジー製）（文献1）などが広く用いられてきた。 MS-DOS 環境ではパソコン通信などは可能であるが、インターネット対応のアプリケーションはほとんど利用できないため、 MS-DOS システムを利用してきた多くの視覚障害者が、近年 Windows 環境への移行を迫られている。

Windows 環境においては、標準ハードウェアのみでテキスト音声合成が利用できるようになった。これに伴い、スクリーンリーダとよばれる低価格なソフトウェアによって、ファイル管理・ワープロ・表計算などのアプリケーションが視覚障害者にも利用できるようになった。 Windows 95/98に画面読み上げ機能を付加するスクリーンリーダとしては 95Reader （（株）システムソリューションセンターとちぎ製）や PC-Talker（高知システム開発）、 outSPOKEN（富士通中部システムズ）などがあり、広く用いられている。海外では評価の高い JAWS (Henter-Joyce) の日本語化も予告されている。

しかしスクリーンリーダのみでは、画面表示を前提とした既存のアプリケーションをすべて音声化することはできない。そこで、スクリーンリーダが個別のアプリケーションに合わせた処理を行ったり、アプリケーション開発者がスクリーンリーダのAPIを用いることで（文献5）、個々のアプリケーションのバリアフリー化を行う必要がある。このような状況を改善するために MicrosoftなどのOSメーカーがアクセシビリティに関するガイドラインを発表したり、専用の API を整備している（例）。

Windows に代表される GUI 環境は、近年、晴眼者のコンピュータ利用を大幅に促したが、一方で視覚障害者に対しては、ディスプレイ上の空間把握という新たな負担を強いている。このような問題を解決するために、 GUI情報を立体音響などで表現する研究（文献4）がある。

4. 音声化インタフェースの設計指針

ここではソフトウェアの視覚障害者対応において参考にすべき設計指針について述べる。

4.1 GUI音声化の指針

GUIを視覚障害者にも利用可能とするための指針については、すでにいくつかの提案がある。

国内では通産省が平成7年に定めた「障害者等情報処理機器アクセシビリティ指針」が平成12年に「障害者・高齢者等情報処理機器アクセシビリティ指針」通商産業省告示第三百六十二号に改定されている。この指針ではアクセシビリティ機能を以下の２つに分類している。

また、渡辺ら（文献5）は、視覚障害者対応のインタフェース要件として Microsoft社のアクセシビリティ・ガイドラインに独自の要件を加えて、以下を挙げている。

4.2 UI部品の探索法

前述した指針は、個々の UI 部品をどのような構成で配置して探索可能にすべきか、という問題には触れていない。

藤原ら（文献6）は既存のGUI用スクリーンリーダで用いられている UI部品の探索法を、 GUI の画面レイアウトに基づいた「画面構造探索」と、すべての操作を論理的に階層化した木構造に基づいて行う「論理構造探索」に分類している。また、画面構造探索に加えてショートカット操作が可能なものを「ショートカット付き論理構造探索」と呼んでいる。仮想的なスクリーンリーダによる評価実験においては、「ショートカット付き論理構造探索」ではキーストローク数が削減されるが、タスク処理時間の短縮のためには「論理構造探索」の方が有効であることが示されている。

4.3 AUIの設計指針

Emacspeak （文献7）もまた、視覚的レイアウトは音声インタラクションには最適ではない、という立場を取り、アプリケーションと音声フィードバックの密な統合を目指している。

Emacspeak は GNU Emacs をプラットフォームに用いることで、アプリケーションの内部情報に直接アクセスしつつ、既存のアプリケーションの実装を最大限に生かしている。 BEP における Emacspeak の bilingual 対応作業も、オリジナルの実装をなるべく生かす形で作業が進められている。

Emacspeak が提案するAUIは、高品質な音声出力を前提とした独自のインタフェース・システムである。 Emacspeak の実装は以下のような方針で行われている。

Emacspeak は音声合成装置 DecTalk の利用を前提として実装されたが、現在はいくつかの音声合成ソフトウェアにも対応している。

5. 初心者ユーザへの配慮

アクセシビリティと同時に初心者ユーザへの配慮が必要な場合もある。特に視覚障害者に対してソフトウェアの概念モデルを教示することは難しい。

例えば Oxford Brookes University で開発された中途失明者用ウェブブラウザ BrookesTalk において、初心者がソフトウェアの概念モデルを頭の中に作るのに苦労している、ということが報告されている（文献11）。

音声アプリケーションの操作能力は被験者の短期記憶の能力と関連があり、現実に中途失明者には高齢者でかつ短期記憶の衰えている場合が多い。そこで BrookesTalk は以下のような配慮をしている。

ソフトウェアの概念モデルを簡易化するためには、アプリケーションの設計における配慮が重要となる。このような試みとして、視覚障害者を前提としたものではないが、高齢初心者のためのパソコン通信ソフト「めーるでぽん！」に関する報告（文献12）（文献13）がある。単に搭載機能を最低限化するだけでなく、「メールを書く」「メールを読む」といった具体的な目標をメニュー項目として採用し、すべての操作がウィザード方式（表示される質問に答えていくだけで全ての作業を行える）で提供されているところが特徴である。

6. 既存メールソフトの比較

例えば、 WindowsはGraphical User Interface (GUI) による画面の直感的操作を前提とするため、スクリーンリーダーの助けを借りても視覚障害者が使いにくいOSであった（文献14）、といった主張がある。このような主張は

といった結論を導きがちである。我々の当初の興味は、このような主張が妥当であるか、かつて妥当であったとしても現在の状況で通用する主張であるか、といった検討であった。

もちろん、充分に一般性のある議論としてこのような考察を行うことは難しい。なぜならば、視覚障害にも程度差があるし、失明の時期やコンピュータの熟練度、ユーザごとの用途や好みによって、このような問題は左右されるからである。だが、何らかの前提条件（例えば、我々がサポートしている「視覚障害者のためのインターネット教室」に貢献するかどうか）を設定すれば、それに応じて適切なソフトウェアを選択する指針を導いたり、 Bilingual Emacspeak などのオープンソースソフトウェアを改良するための手掛かりが得られると考えらえる。

すでに述べた音声化のための指針や、一般的なユーザインタフェースの原則論は、これらの評価を行うための尺度として用いることができる。具体的な評価方法としては、個々のソフトウェアの仕様や設計に基づいて検討する評価方法と、それらを被験者実験で評価する方法が挙げられるが、ここでは前者に関する検討について述べる。

検討対象としたのは Windows 環境で動作する以下のソフトウェアである。

6.1 概念モデルの比較

Winbiff, MMメール, Mew の各アプリケーションの概念モデルを図１図２図３に示す。ただしここでの概念モデルとは、ユーザからみたアプリケーションの状態と、それらの状態間の遷移に対応する操作をまとめたものである。また、これらは各ソフトウェアの機能をすべて挙げたわけではなく、メールの読み上げ、新規メールの作成、返信、アドレス登録、といった基本的な操作に限定している。

Winbiff および MMメールは Windows の標準的な UI に準拠しており、一つのウィンドウの中に複数の UI 部品が階層的に配置されている。特に MM メールにはテキストのみによるオンラインマニュアル（視覚障害者にはこの形態が望ましい）が添付されており、その中で「操作窓」という言葉が用いられている。例えば、新規メールの作成では新たなウィンドウが開くが、そこには「送信ヘッダー設定」「送信メール内容の編集」「送信添付ファイルのリストビュー」の3つの操作窓がある。そして、各操作窓へは TAB キーで選択移動できる、と説明されている。ただし、実際には「送信ヘッダーの設定」という操作窓の中に TAB で移動できる複数の項目が存在しており、「操作窓」の遷移と TAB キー操作が1対1に対応していない状況もある。

Winbiff のマニュアルには操作窓という用語はないが、 UI要素の構成は MMメールとほぼ同等で、ウィンドウと操作窓の2階層構成が基本である。いずれも、操作窓間の遷移は TAB キーで行い、コマンドの実行などに伴うウィンドウ間の状態遷移はそれぞれのコマンドに対応するキー操作で行われる。

Mew はUI構成要素に階層がない。これは、個々のモードの実体が単純なテキスト編集バッファであり、 Windows UI で操作窓に相当する要素のすべてに対してカーソルの上下移動のみでアクセスできるからである。 Windows UI では、操作窓の移動には TAB キーを用い、メール本文の操作窓ではカーソル上下移動を用いるが、 Mew は階層が少ないうえ、操作にも一貫性がある。

6.2 出力とフィードバック

Windows UI は、スクリーンリーダの助けを借りることによって、階層化されたプルダウンメニューを読み上げることができ、項目名を聞きながら、必要な機能を探すことができる。また、メニュー項目名にショートカット操作が付与されていればそれも読み上げるので、ショートカット操作を調べるための簡易ヘルプとしても機能している。視覚的な操作を前提とした機能が、音声化されても有効に機能している。

Mew のプラットフォームである Emacs にもプルダウンメニュー機能は存在する。しかし我々は、 Emacspeak によって Emacs のプルタウンメニューを読み上げることができていない（不可能ではないと思われる）。ヘルプ機能としてのプルダウンメニューがないという前提では、特にコンピュータの初心者が Mew を使用することは困難になる。 Mew の各機能を mew-summary-show といったコマンド名で呼び出したり対応するキーバインドを検索することはできる。しかしこのような名前は必ずしも直感的に覚えられるものではない。

現状の Bilingual Emacspeak では多くの音声メッセージが英語エンジンによる英語の読み上げになっており、英語の音声合成を聞き取ることに不慣れなユーザには Bilingual Emacspeak の利用は難しい。

例えば MM メールは単に画面表示を読み上げるだけでなく、操作窓の移動操作に対して、移動先の操作窓の名前を音声によってフィードバックする。このようにシステムの状態把握を容易化する機能は、 Mew では非常に少ない。

メール本文の読み上げにおいても、Mew と Windows 系では大きな違いがある。つまり、Windows 系の2つのソフトは読み上げたいメッセージを選択しただけで本文の読み上げを開始する（なんらかのキー操作によって中断する）が、 Mew においては、メッセージを選択したのちに、メッセージモードでカーソルを上下移動して１行ずつ読んでいく、という流れになるのである。

Emacspeak は多くのフィードバックを聴覚アイコンや音声フォントによって行う。これによって、既存のスクリーンリーダでは不可能だった、豊かで効率的なフィードバックを提供することが可能となる。ただし、環境構築上の問題があり、我々はまだこの点を充分に評価できていない。また、プログラミングやウェブブラウザと異なり、電子メールにおいて複数の音声フォントが有効に機能する場面はそう多くないと思われる（引用部分の音声を変える、といった程度である）。

6.3 キーボード操作における配慮

Windows 系のメールソフトは、すべての操作をメニューから選択して実行するのであれば、カーソルキーやEnterキーなどを中心とした流れになる。しかし、ショートカット操作においては Alt キーや Ctrl キーなどとの同時打鍵が前提となる。

Mew にも Ctrl キーとの同時打鍵が必要な操作は多いが、アルファベットキー1文字に対して多くの重要なコマンドが割り当てられている。また、タッチタイピングにおいてホームポジションからあまり手を動かさなくても操作できる割り当てになっている。

6.4 各メールソフトの位置付け

これらの検討から改めて明らかになるのは、個々のソフトウェアの位置付けの違いである。

つまり、インタフェースの構成が初心者ユーザへの対応の程度と上級ユーザへの移行支援のトレードオフの関係にあると考えるとき（文献15）「めーるでぽん！」のような単機能ソフトは初心者対応度に重きをおいた構成、 Emacspeak は上級利用移行支援に重きをおいた構成、 MMメールやWinbiffはその中間的な構成であると考えられる（図４）。

GUI はこのトレードオフ曲線を「高い初心者対応度」の方向に持ち上げる貢献をしていた。例えば、視覚的に目立つ場所には初心者対応の要素を置き、目立たない場所に上級利用支援の要素を置く、といった方法が可能である。

キーボード入力と音声出力という枠組みに制限されると、トレードオフ曲線は初心者対応度が全体的に低くなってしまう。仮に初心者対応度が高いシステムを実装したとすると、熟練者が求める高機能や効率性と両立が困難になると考えられる。

7. まとめと課題

視覚障害者が音声出力によって利用可能な電子メール環境の操作性について検討した。特に既存の電子メール用ソフトウェアのいくつかについて、設計と実装を検討した結果について述べた。また、これらソフトウェアの相互の位置付けについて、インタフェース構成のトレードオフのモデルを用いて考察した。

今後の課題について述べる。本稿で述べたような個々のソフトウェアについてより定量的な実験を行う必要がある。また、初心者ユーザが望むであろうソフトウェアとして、「めーるでぽん！」のようにシンプルで音声化されたメール環境を実現することが望まれる。さらに、前述したトレードオフ曲線そのものを、例えば音声入力を用いて改善できると思われる。その方法としては、音声入力を前提としたまったく新しいコミュニケーション環境の実現（文献16）と、 Emacspeak など上級者向けソフトウェアにおいて、音声対話エージェントを用いて操作方法のアシストのみを行う、といった方法が考えられる。

参考文献

[文献1] 斎藤正夫: ``視覚障害者支援ソフトウェアの製作,'' 情報処理, Vol.36, No.12, pp.1116--1121 (1995).

[文献2] 大武信之, 小川靖彦, 米沢義道: ``アクセシビリティ向上化システム---視覚障害者のためのコミュニケーション環境---'', 電子情報通信学会論文誌 A Vol.J79-A No.2, pp.302-309, (1996-2)

[文献3] 清田公保, 江崎修央, 柳井貴志, 山本眞司: ``視覚障害者のためのオンライン日本語入力インタフェースの基本設計'', 電子情報通信学会論文誌 A Vol.J79-A No.2, pp.310-317, (1996-2)

[文献4] 材塚俊之,高橋久,助田浩子,永松健司,畑岡信夫: ``障害者対応マルチメディアシステムの開発 ---三次元音場利用情報提示システム---'' 電子情報通信学会第二種研究会資料 WIT99-8, pp.47-52, (1999-11).

[文献5] 渡辺哲也,岡田伸一,伊福部達: ``スクリーンリーダを活用した電子メディアのバリヤフリー化'' 電子情報通信学会論文誌D-I, Vol.J83-D-I No.1, pp.234-242, (2000-1).

[文献6] 藤原淳史, 堀内靖雄, 市川熹: ``視覚障害者用WWWブラウジングインタフェースの検討'' ヒューマンインタフェース学会論文誌 Vol.2, No.2, pp.31-38, (2000)

[文献7] T.V. Raman:``Auditory User Interfaces,'' Kluwer Academic Publishers (1997).

[文献8] 渡辺隆行, 井上浩一, 坂本貢, 本多博彦, 釜江常好: ``Bilingual Emacspeak for Windows; 日米２ヶ国語の豊かな音声表現力を持つEmacs'' 電子情報通信学会信学技報 SP2000-46, pp.29-36, (2000-8).

[文献9] 高城敏弘, 西本卓也, 園順一, 浅野令子, 高木治夫: ``視覚障害者のためのモニターレス・キーボード練習環境'' 電子情報通信学会第二種研究会資料 WIT99-30, (2000-3).

[文献10] 西本卓也, 荒木雅弘, 新美康永: ``視覚障害者のためのタイピング練習ソフト「打ち込み君」の改良'' 電子情報通信学会第二種研究会資料 WIT00-21, pp.55-59, (2000-8).

[文献11] Mary Zajicek: ``The construction of speech output to support elderly visually impaired users starting to use the internet'' Proceedings of ICSLP2000, Volume I, pp.150-153, (2000-10).

[文献12] 瀬戸裕行, 吉田敦也: ``高齢者向けパソコン通信ソフトの試作'' 第??回ヒューマン・インタフェース・シンポジウム論文集, pp.637-642, (1997).

[文献13] 瀬戸裕行, 吉田敦也: ``高齢者向けパソコン通信ソフトの設計理念について'' 計測自動制御学会ヒューマンインタフェース部会 News and Report 1997 Vol12, pp.427-432, (1997).

[文献14] 石川准: ``GUI用スクリーンリーダの現状と課題---北米と欧州の取り組みを中心に---'' 情報処理, Vol.36, No.12, pp.1133-1139, (1995).

[文献15] 西本卓也, 志田修利, 小林哲則, 白井克彦: ``マルチモーダル入力環境下における音声の協調的利用 ---音声作図システムS-tgifの設計と評価---'' 電子情報通信学会論文誌 VOL.J79-D-II, pp.2176-2183, (1996-12).

[文献16] 西本卓也, 幸英浩, 川原毅彦, 荒木雅弘, 新美康永: ``非同期型音声会議システムAVMの設計と評価'' 電子情報通信学会論文誌 D-II, Vol.J83-D-II, No.11 pp.2490-2497, (2000-11).

視覚障害者のための電子メール環境における
操作性の検討

目次

1. はじめに