2007年6月18日月曜日

Web Trust 研究動向

1.はじめに

フィッシング詐欺やチャリンカー詐欺(現物を確保する前にネットオークションに出品し、注文を受けてから安く調達して利ざやを稼ぐ自転車操業的な手法。また、赤字になるような安い価格で出品を続け、高い評価がたまったところで大量の仮出品を行い、入金されたところで逃亡する詐欺のこともある)、P2Pソフトを介した個人情報漏えい問題など、Webの利用が進むにつれ次々に新しい問題が起こっている。今後Webを健全な社会インフラとして活用するためにはWebの信憑性の扱いが最大の課題となっているといっても過言ではない。そこでWebを安心して使えるようにするためWebの信憑性の問題に様々な分野で取り組んだ研究が近年注目されている。そこで本稿ではこれらをWeb Trustの研究と呼び、具体的な事例をあげて現状を紹介する。

2.Trustとは?

2.1 TrustとPrivacy,Security

相手を信頼するためには相手に関するあらゆる情報を判断材料として入手したいだろう、こうした相手に関する情報の入手につきまとうのがPrivacyである。Privacyは、情報のオーナシップやコントロールに関する権利とされ捉えられ、またその権利を保護することがSecurityである。リスクを減らすには、できるだけ多くの判断情報を集めたいが、これを追求するとPrivacyの考えが脅かされる。一方Privacyを尊重しすぎると、相手を信頼するに至らないという局面が増える。こうした意味で、信頼に基づく社会を実現するには、PrivacyとTrustとのバランスを考慮する必要があり、この点がPrivacyの取り決めを難しくする要因のひとつである。また、Privacyを保護するSecurityが確立していないと、やはりPrivacyは保護されないことになる。Trustに立脚した社会の実現は、PrivacyとSecurityの課題と切り離せない関係にあるといえる。

2.2 Trust研究のマップ

イタリアCNR(National Research Council)のInstitute of Cognitive Sciences and Technologies(ISTC:認知科学技術研究所)では、Trustを総合的に研究するため,T3 Groupという研究組織が活動している。T3はTrust Theory and Technologyの頭文字をとったもので、様々な分野の研究者が集まり、Trustとは何か、Trustは社会や技術にどのような影響を与えるのかなどを幅広く検討している。T3では、Trustを扱う研究分野として以下の5分野をあげている。

  • 経済学(Economics/Organizations)
  • 社会学(Sociology)
  • 心理学(Psychology)
  • コンピュータサイエンス(Computer Science)
  • 社会的認知科学(Socio-cognitive approach)

§1 他分野におけるTrust研究事例

経済学:経済学でのTrustは、主に顧客が企業などの組織に対して感じる信用や安心などの基準であり、変数として表せる因子の一つとみなされている。

社会学:社会学では、Trustを主に個人対個人の信頼関係と捉えている。

心理学:どういう状況でTrustを感じるか、あるいはTrustとTrustに類似した概念をどのように識別するかを中心に議論している。

社会的認知科学:社会的認知科学では、人間が様々な要因からTrustを導き出す過程をモデル化する研究が行われいている。

3.Web Trust研究

3・1 WebにとってのTrustの意義

Webを含むコンピュータサイエンスでは、Trustは大きく分けて二つの異なる側面から議論されている。一つはセキュアなシステムの構築手法、もう一つはネットワーク上でのエージェントに対するTrustを算出する手法である。前者は、高いセキュリティを持つシステムやセキュリティを重視するユーザはTrustworthyであるとするものである。一方後者は実世界での組織や個人の間の関係をコンピュータネットワークに適用し、ネットワーク上のノードやWeb上のオンラインショップ、それらの利用者などをエージェントと捉え、その信憑性を推定しようとするものである。Webには、実世界の距離を超えたコミュニケーションを可能にし、匿名性が高いという2つの大きな特徴があるため、実世界よりも大きなチャンスとリスクがあり、相手を正しく選択する重要性が高い。

3・2 Trust推定のための評判情報管理

利用者の評価情報を元に、エージェントのTrustを予測する一連の仕組みは、評判管理システム(reputation system)と呼ばれている。Reputation systemの基本的なアイディアは、今まで面識のない相手のTrustを「間接的な情報」である評判情報をもとに予測することにある。ここで「間接的な情報」とは、すでにこの相手と面識のあるほかのエージェントによる評価を意味する。

Trustの研究は大きくはcentralized型とdistributed型に分けることができるがこれらについて説明していく

§1 Centralized Reputation Systems

評判情報をサーバ上で中央管理するシステムで、商品レビューサイトなどに代表される情報提示サイトなど、数々のWebサービスにおいてreputation systemが利用されている。最も有名なものがヤフーオークションなどで利用されているユーザ評価方式であり、取引完了後、売り手と買い手のそれぞれが相手に対してプラス(+1)、中立(0)、マイナス(-1)の評価を下すプリミティブなフィードバック方式となっており、あるユーザの評価値は、このユーザが受けた評価値の総和(ないしは平均値)となる。また、オープンソースプログラマのための情報共有コミュニティであるadvogatoにおいてもメンバの評価(スキル習熟度)を管理するreputation systemが提供されていて、ここで採用されているAdvogato's trust metricは、各メンバをnodeとし、メンバ間の参照情報をedgeとする有効グラフを用いてメンバ評価を行う。またEpinionという製品及び店舗のレビューサイトではユーザはレビューとレビュアの双方に評価情報を付与することができる。

§2 Distributed Reputation Systems

中央管理を必要としない分散型reputation systemに関する研究は、主にP2Pファイル共有におけるファイル詐称問題への対応策として研究が進められてきた。例えばMudhakar SrivastsaはP2P環境下でのピア(通信相手)の選択にTrustを導入し、あるファイルを取得する場合にTrust値の高い(信頼できる)ピアを選択することで、故意にウイルス感染させたファイルを配信するような悪質なピアに接続する危険を減少させるシステムを提案している[Srivatsa 05]

また中央管理型とは異なり、分散型reputation systemにおいては、評判情報が各ユーザの手元に点在することになる。このため、あるユーザに関するTrustを調べる際には、他のユーザから該当ユーザに関する評判情報を収集する必要がある。そこで、この評判情報を如何に効率的に収集するか、如何に分散する評判情報を元に必要とするユーザのTrustを計算するかがポイントとなる。Abererらは、ユーザのマイナス評価を分散環境下において共有するアーキテクチャを発表している。[Aberer 01]

また評判情報の一貫性をどう管理するかといった分散環境特有の課題もある。

§3 評判システムの課題

効果的なreputation system実現のためには、いくつか解決すべき課題が存在する。Resnickは、正確なReputationを得るためには、(1)利用者からのフィードバックをどのように誘発するか、(2)信頼性のあるReputationの配信をどう実現するかなどの課題を解決する必要があるとしている。(1)の問題については、ユーザに対してフィードバックへの対価として金銭的インセンティブを与えるアプローチや、ポジティブとネガティブの両方のフィードバックを採用することで、比較的少数のユーザ間関係からでも高い精度でTrust値算出が計算可能な手法を検討するアプローチがある。しかしこのシステムではポジティブ方向に偏りがちなのでより正直な評価を引き出すために匿名性を加えたreputation systemも考えられている。(2)については悪い評判がついたエージェントが、いったん自分のIDを捨てた後、新規参入エージェントのフリをして新たなIDと新たな評判を取得することが問題となっており対応が非常に難しい。また悪意を持ったユーザを統計処理などにより除くといったことも行われている。

3.3 ページの内容による信憑性の推定

FoggによるWebページの信憑性を心理学的な視点から調査した研究があるが、それによると大きく分けて5つのグループがあり、それぞれ

  1. Real-World Feel Scale
    組織の住所や社員の顔写真が掲載されているかといった実世界での実在性を感じさせる基準
  2. Ease of Use Scale
    キーワード検索が可能か、リンクナビゲーションが適切かといった使いやすさによる基準
  3. Expertise Scale
    記事の出展が明記されているなど、情報の専門性、技術的裏づけに関する基準
  4. Trustworthiness Scale
    著名なサイトからリンクされている、よく知られた企業のサイトであるといった社会的な信用に関する基準
  5. Tailoring Scale
    情報を送信すると確認メール返信されるなど、細部の作りこみに関する基準。

3.4 その他のWeb Trustに関する研究

§1検索エンジンのランキング

検索エンジンのランキングの信憑性として、意図した相互リンクなどをどこまで認めるのか、また本来のランキングのあり方を改めて問うてみる、といった動きが見られる。

§2 評価表現抽出

blog等から個人の主観的な意見を抜き出そうということも行われている。ここでは文章中に表れる「良い」評価や「悪い」評価を自然言語処理技術を用いて抽出し、その記述全体としての(おそらく信憑性)の評価を算出するというものである。(「良い」「悪い」の記述からその文に対する信憑性を求めているのか、それともある製品があってそれに対して肯定的な意見が多いのか否定的な意見が多いのかを単に調べているだけなのかは論文内容からはよくわからない)

参考文献 人工知能学会誌 21巻4号

0 件のコメント: