twitterから有用な情報を発信するユーザーを発見する研究
やりたいこと
Twitterネットワークの中から、「役にたつ(とtwitterユーザーが考える)」情報を発信するユーザーを発見したい。
そこで、この目的の研究を探してみた。
Twitterにおけるフォローに関する影響力に基づくハブ度の推定
以下、読んでみたメモ
この研究の目的
有益な情報源を発見する(有益な情報を発信するユーザーを特定する)
研究のポイント
- 有益な情報をtweetするユーザーを陽に発見することは難しい(理由は後述)
- そこで、有益な情報をtweetするユーザーを発見収集する能力にすぐれたユーザーを特定する
- そんなユーザーを「フォロー関係を他のユーザーから模倣されやすいユーザー」と定義する
- ただし、「フォローが模倣された」という情報は、twitterログデータからは観測できない
- そこで、「フォローが模倣された確率」を定義して、算出する。この確率が高いユーザーこそ、「有益な情報をtweetするユーザーを発見収集する能力にすぐれたユーザー」である
有益な情報をtweetするユーザーを陽に発見することは難しい 理由
被参照数を指標にした場合の問題点
- ツールなどを使って、意図的に被参照数が増加された場合
- アカウントが作られたばかりで、まだ被参照数が伸びない場合
この場合は、被参照数が伸びず、「有益な情報」とされないまま
- そこで、「有益な情報をtweetするユーザーを発見収集する能力にすぐれたユーザーを特定」を考える。これなら、被参照数に依らないので、上記のような問題点を避けることができる
先行研究にあげている項目
- kwak: twitterデータのおいて、followerの数≠ツイートの人気度
- followerの数は影響力として用いるのは正確ではない
- weng: 実際にツイートが読まれる確率のtwitterrankを提案
どう発見するか?
各ユーザーの新規情報源(有益な情報つぶやくユーザー)発見能力を定量化する(この研究内では「ハブ度」と呼んでいる)
↓
定量化した後、数値化して、ランキングにする
↓
ランキング上位のユーザーがフォローしているユーザーは新規情報源として有用
どう定量化するか?
以下の指標を定義して、指標からハブ度を算出する
- ネットワーク構造
- フォローの時系列情報
- ユーザー間の興味類似度による重み付け
感想とか
疑問に思った点: 有益な情報を発見する場合に「模倣してフォロー」しか考えていない点
有益な情報を発信するユーザー(A)が居て、そんなユーザーを発見する能力にすぐれたユーザー(B)が居るとして、 ユーザーBはわざわざユーザーAをフォローするだろうか??
ただ、fav.つけるだけで終わるのではないか?と疑問に思った。
fav.をつけるだけで情報収集が行わているなら、この研究の手法は適合しないだろう・・・
この研究の使いドコロ
- 「情報発見能力の優れていると他のユーザーから信頼されている」ユーザーを特定する手法と考えれば、有用に思う。
- つまり、インフルエンサーの発見手法としては有用だと思われる。
必要なデータは
- twitterネットワークのデータ
- フォロー関係の順序ログ?