twitterから有用な情報を発信するユーザーを発見する研究

やりたいこと

Twitterネットワークの中から、「役にたつ(とtwitterユーザーが考える)」情報を発信するユーザーを発見したい。

そこで、この目的の研究を探してみた。

Twitterにおけるフォローに関する影響力に基づくハブ度の推定

以下、読んでみたメモ

この研究の目的

有益な情報源を発見する(有益な情報を発信するユーザーを特定する)

研究のポイント

  • 有益な情報をtweetするユーザーを陽に発見することは難しい(理由は後述)
  • そこで、有益な情報をtweetするユーザーを発見収集する能力にすぐれたユーザーを特定する
  • そんなユーザーを「フォロー関係を他のユーザーから模倣されやすいユーザー」と定義する
  • ただし、「フォローが模倣された」という情報は、twitterログデータからは観測できない
  • そこで、「フォローが模倣された確率」を定義して、算出する。この確率が高いユーザーこそ、「有益な情報をtweetするユーザーを発見収集する能力にすぐれたユーザー」である

有益な情報をtweetするユーザーを陽に発見することは難しい 理由

  • 被参照数を指標にした場合の問題点

    • ツールなどを使って、意図的に被参照数が増加された場合
    • アカウントが作られたばかりで、まだ被参照数が伸びない場合
  • この場合は、被参照数が伸びず、「有益な情報」とされないまま

    • そこで、「有益な情報をtweetするユーザーを発見収集する能力にすぐれたユーザーを特定」を考える。これなら、被参照数に依らないので、上記のような問題点を避けることができる

先行研究にあげている項目

  • kwak: twitterデータのおいて、followerの数≠ツイートの人気度
    • followerの数は影響力として用いるのは正確ではない
  • weng: 実際にツイートが読まれる確率のtwitterrankを提案

どう発見するか?

各ユーザーの新規情報源(有益な情報つぶやくユーザー)発見能力を定量化する(この研究内では「ハブ度」と呼んでいる)

定量化した後、数値化して、ランキングにする

ランキング上位のユーザーがフォローしているユーザーは新規情報源として有用

どう定量化するか?

以下の指標を定義して、指標からハブ度を算出する

  • ネットワーク構造
  • フォローの時系列情報
  • ユーザー間の興味類似度による重み付け

感想とか

疑問に思った点: 有益な情報を発見する場合に「模倣してフォロー」しか考えていない点

有益な情報を発信するユーザー(A)が居て、そんなユーザーを発見する能力にすぐれたユーザー(B)が居るとして、 ユーザーBはわざわざユーザーAをフォローするだろうか??

ただ、fav.つけるだけで終わるのではないか?と疑問に思った。

fav.をつけるだけで情報収集が行わているなら、この研究の手法は適合しないだろう・・・

この研究の使いドコロ

  • 「情報発見能力の優れていると他のユーザーから信頼されている」ユーザーを特定する手法と考えれば、有用に思う。

必要なデータは

  • twitterネットワークのデータ
  • フォロー関係の順序ログ?