2007年6月8日金曜日

Web2.0時代の個人とコラボレーション

Web2.0は、個人の活動の集積として価値あるコンテンツが生成されるという思想が前提となっている。これらの環境の中で、個々のユーザはどのように振る舞い他者との関係性を構築しているのだろうか?本稿では、ユーザの関係性とネットワークという視点から、Web2.0の代表的な例であるブログやSNS,ソーシャルブックマークにおけるユーザのネットワークに関する研究動向を述べる。社会ネットワーク分析や複雑ネットワークという研究分野と関連して多くの研究が行われているが、こういった研究は、Web2.0を理解し今後の展望を考える上で、サービスの提供者にとってもユーザにとっても重要な知見を提供するものである。

社会ネットワーク分析と複雑ネットワーク

数年前から、スケールフリーやスモールワールドなどで知られる複雑ネットワークが着目を集めている。スモールワールドネットワークは典型的には小さなクラスタが少数のリンクでつながれた形をしているもので、 スケールフリーネットワークはノードの次数(いくつのエッジを持っているか)の分布がベキ則(P(K) = kのーr乗) (rは定数)に従うというもので、極端に次数の大きいノードが少数存在するが、ほとんどは次数の小さいノードである。また社会ネットワーク分析では、大きく2つのタイプのネットワークデータを扱う。一つはノード同士の直接的な関係による隣接関係を行列で表した(Adjacent matrix)であり (誰と誰が知り合いかなど)、もう一つは誰と誰の興味が近いか?や誰がどの複数グループに属しているかなどの関係を行列に表した(Affiliation Matrix)である。こうした2種類の関係を用いるとWeb2.0に関わるの様々なユーザをネットワークとして捉えることができる。

Adjacent matrix(知り合い関係)

太郎

花子 

純一

正弘

慶介

太郎

0

1

0

0

0

花子

1

0

1

0

0

純一

0

1

0

1

1

正弘

0

0

1

0

1

慶介

0

0

1

1

0

Affiliation matrix(人と興味)

Web

音楽

スポーツ

TV

ラジオ

太郎

1

1

1

0

0

花子

1

0

0

0

0

純一

1

0

0

0

0

正弘

1

1

1

1

1

慶介

1

1

1

0

1

ユーザのつながりの分析
日本ではmixiの分析が2005年2月時点のデータを用いて行われている。当時の36万ノード、190万リンクについて調査し、知り合い数がr=2.80のベキ分布であること、次数平均(マイミク数の平均)が10.4であり6ホップで96%をカバーする小さな世界であること、クラスタ数Cが0.328であり凝集性の高いネットワークであることなどが報告されている。また知り合い関係をGNアルゴリズムという方法でクラスタ化していくと、比較的t小規模のクラスタ群と大規模のクラスタ群に2分され、その中間領域が欠けている事を興味深い発見として述べている。mixiでは自分の周りのクラスタのサイズが徐々に成長していくが、あるときに急激に成長がスキップするわけである。この一般性や含意についてはまだ不明な点も多いが、SNSの何かの性質を示しているものかもしれない。またFOAFの分析でもknows(知り合い関係)の分布はベキ分布となり、その分散性はWeb2.0的であるといえ、今後はユーザプロファイル管理の仕組みの成長とともに重要性を増してくると考えられる。
ここで紹介した研究はいずれもWeb上での人のネットワークのスケールフリー性を示すものであるが、これが意味するところは何であろうか?ここで重要なのは多くの人から支持される一部の人だけではなく、ロングテールの部分の人同士のコミュニケーションを促進する仕組みがSNSやブログにはあるということである。個々のユーザにとって、一部のスーパーノードの質の高い情報も価値があるが、それにも劣らず自分の周りにいる人の日々の雑多な情報も価値がある。We2.0で議論されるロングテールはスケールフリーネットワークとは本来直接のつながりはないが、実はWebにおけるユーザのネットワークを間に介することで密接に関係している。
情報の伝播モデル:口コミとブログ
ユーザのネットワークがあるとして、その上で情報はどのように伝播していくのだろうか?この分析に関する研究をいくつか紹介する
B.HubermanらはAmazon.comでの本やDVDの商品の推薦がどのように伝播していくかを分析している。その結果次のようなことがわかった
  1. 2人の間でインタラクションが多くなると推薦はきかなくなる。
  2. 推薦を受け入れる確率は、推薦してくれる人の数が増えると急激に増えるがすぐに飽和する。
  3. 次数の高いスーパーノードがあるが、影響力には限界がある。たくさん推薦する人のことはあまり聞かなくなるからである。
  4. 推薦の効果はカテゴリや値段に影響される。

ここで描きだしているのは、ネットワークとしてつながれた個々が互いに影響しあいながら情報が広がっていくモデルである。またRichardsonらは、1人のユーザが他のユーザの購買にどのくらい影響を持つかを数値化して、そのユーザの"network value"を計算する確率モデルを提案している。またブログ上での情報がどのように伝播していくかを研究しているものも数多くある。いずれの研究でも、モデル化の基礎となっているのはユーザが情報を得て、それによって他の人に情報を伝播させる力を持つという状況である。こうした情報の伝播の性質が今後の研究でさらに明らかにされれば、ユーザにとってより心地の良い、効率的な情報環境の構築につながっていくと考えられる。

コミュニティの形成

最近の研究ではLive Journalのコミュニティ機能について分析したものがある。ゆーざは、自分が入るコミュニティをどう決めているのだろうか?それを予測するモデルを学習した結果

・自分の知り合いの中で、そのコミュニティにすでに入っている数が多ければ、ユーザがそのコミュニティに入る確率が高まる。

ということがわかった。これは、ほとんど自明である。面白いのは

・そのコミュニティにすでに入っている知り合い同士が知り合いであると、そのコミュニティに入る確率が高まる。

というものである。自分の知り合いのうち2人があるコミュニティに入っているとすると、その2人が知り合いでない場合より知り合い同士の場合のほうがそのコミュニティに引き込まれやすいわけである。また安田らはmixiの分析の中で入り口の役割を果たす巨大なコミュニティと、そこから先の徐々にマニアックになる系列コミュニティという生態系が形成されることを発見した。またGoogleの研究者らはOrkutというSNSにおけるコミュニティの推薦について調べている。特定のコミュニティに対してどういうコミュニティを進めればユーザは受け入れられるかというものである。

ソーシャルブックマーク分析

ソーシャルブックマーク(SB)では、世界をどのように分類するか、その分類がコミュニケーションを通じてどのように共有されるのかという言語学や人工知能で重要なテーマを含んでいる。世界の分類はある種のちしきであり、タグ付けのような簡単な仕組みによって実現さればSBにより語彙が構築されていく様子を俯瞰できるのは興味深い。

検索エンジン、そして今後のWeb技術

さて、Web2.0の様々な現象は、検索エンジンにより適切な情報が探せるようになったという部分に依拠するところが大きい。検索エンジンで探してもらえるからWikipediaには人が来るのでるし、質の高いブログを書く人がいる。検索エンジンは今後ますますインフラ化するだろう。また今後はエンティティ間の関係をより捉えた技術がより重要であるし、発展するだろうと思われる。

参考 IPSJ Magazine Vol47 No.11 Nov.2006

0 件のコメント: