2009年1月26日月曜日

アイトラッキングでのスクリーンリーダ、Webデザイン改善などについての研究

Validating the Use and Role of Visual Elements of Web Pages in Navigation with an Eye-Tracking Study

アイトラッキングについての研究、内容が複雑なので詳しくはIntroductionで示している 。論文は→http://delivery.acm.org/10.1145/1370000/1367500/p11-yesilada.pdf?key1=1367500&key2=0750692321&coll=GUIDE&dl=GUIDE&CFID=19681038&CFTOKEN=82522043

  1. INTRODUCTION

この論文では、我々は眼が見える人々があるタスクを遂行するためにどのようにvisual
elements
(視覚要素、ロゴやヘッダー、フッターなど) と features(レイアウトの事だと思われる。)を認識するのかを調査するアイトラッキングの研究を発表する。前回の研究では、我々はウェブのナビゲーション、すなわちWebページを自由に行き来するという意味で旅行のメタファを用い、ウェブの構成要素であるヘッダーやメニュー、検索ボックス、ロゴなどをトラベルオブジェクトとして位置づけた。そしてそれらのオブジェクトをシステムで発見するために、我々はTAF(travel analysis framework)というものを提案した。その提案したTAFに基づいてトラベルオブジェクトを発見するシステム「Dante」を作成し、トラベルオブジェクトに対してアノテーションを付与した(ページ内のある部分はどのような役割を果たしているのかといった情報)。そしてそのアノテーションをスクリーンリーダー(ウェブページの読み上げソフト、主に視覚障害者のために用いられる)に応用したところ、視覚障害者がより簡単にWebページの内容を知る事ができるようになった。ところが実際に我々が作成したTravel Analysis Frameworkは十分に正確なのだろうか?実際に視覚正常者はどの程度トラベルオブジェクトを認識して、どの程度TAFで定義した内容どおりにオブジェクトを見るのだろうか?。

2.TRAVEL ANALYSIS FRAMEWORK

Wayfinding(町で如何に迷わず移動できるかを研究する分野)と都市や建築デザインの分野における現実世界の移動の研究では、人々は正しい道のりを確認するために物理環境(自然環境)の様々な物体を使用するという事を明らかにしている[14,21]。この物理環境の様々な物体(看板、目印等)に対応するものがWebページ上にも存在する。我々はそれをトラベルオブジェクトと名づけ、トラベルオブジェクトを大まかに3つのカテゴリに分類した。その3つは以下のようなものである

1.Way Points

道の途中で前進運動を手助けする決定を行うポイント(よくわからない。次の行動を決定するためのキーとなるポイントみたいなニュアンス)。これらはDecision Points(例:メニュー)やWay Edges(例:色の境界)、Navigation points(例:ハイパーリンク)Reference Points(例:サイトロゴ)を含む

2.Orientation Points

設立(establishing)と方向を保つ両方のために使われる。そのようなobjectReference Point(例:ロゴ)、direction(例:戻る、進むのボタン)Location and Position(例:メニューをハイライトする動的なアイテム?)のオブジェクトなどである

3.Travel Assistants

道に迷った時に再び方向付けを行うため、目が見える人、見えない人両方によって使われる異なった戦略。この戦略はInformation Points(例:サーチボックス)、Travel Aids(例:サイトマップ)TravelMemory(例:履歴リスト)やTravel Support(例:guided tour)


このトラベルモデルに基づいて、我々はトラベル解析フレームワークを作成した。それはトラベルをサポートする目的でシステマティックにウェブページを解析するために使われるフレームワークである。このフレームワークは2つの段階でできている。

  1. ウェブページを調査し、トラベルオブジェクトを発見し、トラベルオブジェクトの一覧表を作成する。

  2. それぞれのトラベルオブジェクトを、そのオブジェクトが果たす役割別に分類する

このフレームワークの評価[31]は、このフレームワークは一貫してトラベルオブジェクトを発見、分類する事に使われうるという事を示している。

  1. DANTE TRANSCODING PAGE

トラベルオブジェクトがページ上で発見された後Dante(システム名)はthe Web Authoring for Accessibility(WAfA) オントロジーからの条件と共にセマンティックアノテーション技術を用いる事でアノテーションを付与する。Danteはそれからこれらのアノテーションを用いウェブページを変換(トランスコーディング)し、よりscreen readerが読みやすい形に変える。詳細は[23,32]トランスコーディングの性能はTAFの性能と密接に関係するため、TAFの性能を引き上げる事が必要である。そこで視覚正常者がどのようにトラベルオブジェクトを認識するのかをよりよく理解しTAFに応用していく必要がある。4章ではその事を踏まえ視覚正常者によるアイトラッキングの実験について述べる。

  1. EVALUATION

視覚正常者の目の動きをDanteの評価で使われたタスクセットを用いて計測した。ここでは、我々はどのように視覚正常者が視覚の注目をどのオブジェクトに向けるのかを調査する

1.Method


この研究の主な目的は我々のフレームワークによって発見されたトラベルオブジェクトと視覚の注目を受けるページの場所との関係を調査する事である。

参加者:18人の21歳から35歳までのボランティア


アイトラッキング装置:ページのどの部分が最も注目を集めたかを決定してくれる優れたツール


実験対象サイト:Googleの結果ページ、インターネット映画データベースページ(IMDb)、マンチェスター大学のページ(UM)。なおこれらのページは以前の研究によりTAFを用いて解析が行われている。


手順:被験者はインデックスページから実験をはじめ、以下のタスクのうち1つをこなす。一つのタスクが終わればインデックスページに戻る。被験者は練習としてグーグルページでのタスクを最初に行う。その後はランダムで以下のタスクをこなしていく。以下タスク

1.「オリンピック」とクエリを投げたとして、2番目の検索結果を読み出す(task google)

2.IMDbページ上のメインコンテンツの最初の文章を読み出す。(task IMDb1)

3.IMDbページ上でその日の映画の名前を調べ、その前にあるセクションとその後にあるセクションのタイトルを読み出す。 (task IMDb2)

4.UMページのレイアウトを表現する。(task UM1)

5.マンチェスター大学の図書館に繋がる2つのリンクのうち1つを発見し、その場所をマウスで指し示す(task UM2)


これらのタスクは主に異なるトラベル原則に取り組むようにデザインされており[32]、ブラウジングやサーチング、スキャニング等広範囲の手法をカバーする。(要するに探し方がそれぞれ異なるという事)。すべてのタスクが終了した後に、どれくらい普段これらのサイトを使っているのかを尋ねる。サイトへ対する馴染度合いがパフォーマンスに影響を与えるかどうか調べるためである。


仮定:全体の目的(フレームワークによって発見されたトラベルオブジェクトと視覚の注目を受けるページの場所との関係を調査すること)をサポートするために、我々は次の3つの仮定を調べた。(フレームワークでの仮定、これがアイトラッキングで正しいと証明しようとしている)


H1:人々は自分の場所を確かめるためにページに入ってすぐReference Point(サイトロゴ)を参照する。
H2:Way Edgeはページを分断し、人々がどこに視線を向ければよいのかを決定する信頼の置ける手段である。
H3:人々は特にIdentification Pointshタグにあたる部分)にページを見渡す時に焦点を合わせる。そして目的の情報に届いたか確認するのである。

2.Result
ロゴがReference Point として働いている人もいるが、ユーザーはよりヘッダーとメインタイトルにページに入る時固執している事がわかった。Way Edgesはかなり人々がどのように注意を割り当てるかに影響を与え、メインコンテンツが最も凝視する人が多く、フッターと右側のコラムが非常に凝視する人が少なかった。Identification Pointが人々がページを見ているとき一般的に最も多くの凝視を集めた、これはIdentification Pointがサイト内ナビゲーションで重要な役割を担っている事を示している。

1.Reference Points
フレームワークは一つのReference Pointをそれぞれのページで発見した。それはページの左上にあるサイトのロゴである。フレームワークによればこのReference Pointは人々がサイトに入った時、現在位置を確認するために用いられる。参加者でページに入ってから1秒以内にロゴを見た人は実際50%以下であった(表1参照)。これは多数の人がフレームワークによって予想されたような方法でロゴを使っていないという事を示している。替わりにUMIMDbのページではヘッダーやタイトルのIdentification Pointがこの役割を果たしていた。これらのオブジェクトも考慮すると70%以上の参加者がページに入った瞬間にReference Pointを見ていた。しかしグーグルのページでは44%の参加者しかロゴかヘッダーを見ておらず、直接メインコンテンツを見るものが多かった。これはグーグルのサイトを良く知っているからかかなりページが単純かのどちらかであるだろう

2.Way Edges
それぞれのページは巨大なセクションに分類される。これらはヘッダー、フッター、メインコンテンツ、左右のコラムで構成される。図2は視覚の配分(どこをユーザが見つめるか)にWay
Edge
は強い影響があることを示している。メインコンテンツが最も見られ、ヘッダーと左側のコラムが続いた。右側のコラムとフッターはあまり視界に入らなかったようでほとんどの場合無視された。ここで図4の場合は右のコラムとメインコンテンツの間に境界があり右のコラムはほとんど見られていない。一方で図6の場合右側に図4にあるようなWay
Edge
が存在しないため視線が右側にも集まっている

3.Identification Points
TAF(Travel Analysis Framework)は人々はページの周囲を見渡し、目的の情報へたどり着いたかを確認するためにIdentification Pointhtmlのタグにおいて見出しhにあたるポイント)を使うという事を予想している。アイトラッキングのデータはこの仮説を支持するのか?表2は、それぞれのタスクにおいて、部分別で最も注目を集めた平均回数と平均の注目した時間である。図7は全てのタスク(5つのタスク)合わせた時の、それぞれのオブジェクトごとの平均の凝視回数である。図8は図7を各タスクごとに分解したものである。これによると最も注目を集めているのがIdentification Pointsであり、これはIdentification
Points
を人々がページの周囲を見渡し、目的の情報へたどり着いたか確認するために使っている強い証拠となる。図9は全てのタスク合わせた時の平均のオブジェクトを注目した時間で図10は各タスクごとのそれであるが、オブジェクトタイプと注目した時間の相関はそれほど見られなかった。


5.DISCUSSION

この研究の主な目的は別のコードに変換する(transcodingする)フレームワークを立証する事である。Danteはトラベルオブジェクトを正しく認識できるのか、改善の余地はあるのか?タスクはオブジェクトが使われる過程に影響を与えるのか?ページの表現力を上昇させるタスクに共通する要素はあるのか?データは視覚正常者がページのVisual Elementをどのように使うのかについて興味深い問題をいくつか提示している。ユーザはページの現在位置(Page’s identity)を確認するためにロゴよりもヘッダーやタイトルに目を向けるのか?Way EdgesBanner blindnessの現象に貢献しているのか?グーグルのページとUMIMDbのページとのオブジェクトに対する視線の向け方の違いはページに対する馴染の違いによるものなのか、あるいはページの複雑さによるものなのか?我々はこれらの問題をトランスコーディングともっと一般的なWebデザインの観点からこのうちのいくつか議論する。


仮説の検証


H1ではサイトに訪れた人は現在位置を確認するためにReference Point を活用するということを述べた。データによるとこれは実際そうであり、大多数の人がページに入ってから1秒以内にサイトのアイデンティティを示すオブジェクト(サイトロゴ、ヘッダー、タイトル)を見ていた。フレームワークではサイトロゴだけをReference Pointとしていたが、実際はヘッダーやタイトルの方がより見られていた。ヘッダーやタイトルはIdentification Pointと同様にReference Pointとしての役割も果たしたのである。ページロゴよりもタイトルやヘッダーの方がページに入った時に見られるという実験結果はJakob Nielsonsの研究に反する(http://www.useit.com/alertbox/991003.html)。しかし我々の実験はまだ試作段階のものであるからバナーデザインやバナーデザインとページやサイトの関係にもっと注意を払って考えていく必要がある。


H2Way Edgesが人々が視覚的な注目を割り振る事に影響を与えるという事を述べた。ヒートマップによると実際に単純なオブジェクトの配置位置というよりもWay Edgesが注目する場所を決めている事がわかる。


H3は人々はIdentification Points(タイトル等hタグに関係するものと思われる)をページ内を見渡し、目的の情報にたどり着いたかを確認するために活用するという事を述べた。このタイプのオブジェクトが最も視線を集め、潜在的にユーザが素早くページをスキャンする事を助けている。


Banner blindness問題
Banner blindness の問題はBenwayLane[4]によって示された。ユーザは大きく、ピカピカした、カラフルなバナー情報はページ閲覧時に無視すると言うのである。この現象に物議をかもす論文[3]もあるが最近の研究[5]ではBanner blindnessは存在するということが確かめられている。この研究[5]はページのサイドにあるバナー広告に焦点を当てたものだった。しかし我々の研究から判断すると、Banner
blindness
の問題はバナーがカラフルであるというのと同じ位Way Edgesが寄与しているのではないかと考える。(バナーのカラフルさにより、ページ内のほかの部分との間にWays Edgeが生まれてしまうためユーザが避けてしまうという事だと思う)またある明確な目的を持っている場合は、あまり明確な目的を持っていない場合に比べて広告を無視する傾向が高いということも議論されている[19]。我々の研究のタスクでも特にUMページに対するものは異なるナビゲーションスタイルを要求している。2番目のタスク(マンチェスター大学の図書館に繋がる2つのリンクのうち1つを発見し、その場所をマウスで指し示す)のほうがより1番目のタスク(UMページのレイアウトを表現する)よりも明確な目的を持っている。我々のタスクでは、タスクが視線の分配に影響を与えると言うことを示しているが、両方のタスクで重要な類似点がある。それはヘッダーがメインコンテンツより見られていなく、フッターが最も見られていないと言うことである。よってタスクはページ内の見る場所に影響を与えるかもしれないが、彼らの視線はそれでもWay
Edges
によって導かれるのである。Way Edgesはメインコンテンツと他の部分を分離することに役立つのである。

6.RELATED WORK

この研究はウェブアクセシビリティとトランスコーディングとアイトラッキングの3つと関連がある。
Web accessibility
最近の研究で大抵のウェブサイトは基本的なアクセスの要求すら未だに満たせていないと示している。[1,7,28]。アクセスビリティについて意識的な改善はあるものの[2]、未だに視覚障害者がWebを使いこなすのは難しい[10]Takagiらは最近の研究で、視覚障害者は正常者に比べネットで物を購入するときに10倍以上時間がかかると言うことを示している。これはCoyneNielson[6]が発見したことと、Disability
Rights Commission
が発見したことと一致する。

Transcoding:
アクセスビリティが悪いページを改善する一つの方法が、ページを代替のわかりやすい方式に変換するトランスコーディングである。トランスコーディングは様々な方法で達成される。ヒューリスティックを使ったもの[25]、ユーザの嗜好を用いたもの[25]や外部のアノテーション(詳しくは不明)を用いたものなどがある。我々の研究ではトラベルオブジェクトの知識によってウェブページをトランスコードすることを目的としているため、我々はこれらのオブジェクトをコンピュータで扱えるように外部のアノテーションを用いている。生成されたアノテーションはスキップリンク(スクリーンリーダーでメニューや検索ボックスなどの部分を読み飛ばし、本文へジャンプするリンク、これにより無駄な文章をスクリーンリーダーが読まずに済む)の追加、フラグメンテーション、コンテンツの再構築などに用いられている[27,28]。現存する研究では、外部アノテーションに基づいたトランスコーディング技術は視覚障害者のアクセスビリティを改善したが、優れたトランスコーディング技術は優れたウェブページの理解によるものであることは明白である。アイトラッキングの研究がウェブページの理解に貢献すると我々は信じている。


Eye-tracking
最もわかりやすいアイトラッキングの応用が、ウェブページのレイアウトとデザインを改善してユーザビリティを高めることである[26]。他には様々な条件でのページ上でのアイテムの突出度(ページのどの部分が最も注目を集めるかという事だと思う)[9,20]を調べたもの、どのように目の動きは情報の匂(Information
scent
)によって変わるのか[22](Information foraging動物が獲物を捜す行動と、人間が情報を探す行動との間に類似性を見いだし、動物行動学における最適採餌理論を、情報探索行動に当てはめるという試み、よって獲物の匂いによって動物がどのように餌を見つけるのかという事を情報検索に当てはめ、情報を知るための何か手がかりになるものをInformation scentという言葉を使って表現したのだろう。)や、事前予測やページの複雑さによってどのようにメニューを探す過程が影響を受けるのか[16]などがある。

7.CONCLUSION
この論文では我々はどのように眼が見える人々が視覚要素(メニュー、コンテンツやバナー等)とウェブページの特徴(レイアウトの事だと思われる)をあるタスクを遂行する過程で認知するかを発表した。我々の前回の研究ではこれらの視覚要素を発見するフレームワークを紹介した[31](どの視覚要素がページ上でどのような役割を果たすのかをフレームワークとしてまとめ、オントロジーを用いて自動で視覚要素を割り出すシステムを作成した)、そしてそれを元にこれらオブジェクトが意図した目的をよりよく果たせるようにウェブページを再構築した[32][33]。そしてさらにこれらの視覚要素がどのように使われるのかについて理解を深め、我々のアプローチ(フレームワークが正しいこと)を立証するために今回のアイトラッキングを行った。その結果視覚を集めたページの部分とフレームワークによって提案されたトラベルオブジェクトの間には強い関係がある事を示した。


以下発見したこと
フレームワークで予想されたとおり、Reference
Points(ロゴ)がユーザがページに入ったときに現在位置を確認するために使われることを示した。しかしこのような方法で用いられる全てのオブジェクト(ヘッダーとタイトル)を特定できなかった。

・ページを目でスキャンするときにIdentification
Pointsh1,h2タグなどに相当する大見出し、小見出し)に注目を集めることが分かった。またタスクによって異なるものの最も視覚を集めたのもIdentification Pointsであった。

おそらく最も重要な結果はグループコンテンツをセクションに分解する視覚的構成物であるWay Edgeに関する事であろう。Way Edgeはページの再構成(スクリーンリーダーで用いる)の有用性に対する大きな証拠となっただけではなく、どのように人々が注目を分配しているかの理解も深めた。