かたつむりは電子図書館の夢をみるか(はてなブログ版)

かつてはてなダイアリーで更新していた「かたつむりは電子図書館の夢をみるか」ブログの、はてなブログ以降版だよ

Hatena-Index


SPARC Japan連続セミナーでエルゼビアの足立さんがh-indexの説明をしてるのを聞いて考えた妄想。
h-indexがなんであるかはwikipediaを参照
従来の研究者評価指数の問題点を克服するために出てきたのがh-indexという考え方で、引用数の多い論文をどれだけ生産しているかが一目でわかる(ような気がする)。
例えば10本の論文を書いている人がいて、そのそれぞれの引用数が下のようであった場合。

順位 各論文のタイトル 被引用数
1 論文A 100
2 論文B 50
3 論文C 20
4 論文D 10
5 論文E 5
6 論文F 3
7 論文G 3
8 論文H 2
9 論文I 1
10 論文J 0


引用数1位の文献から見ていって、被引用数と順位が交錯したところの数がh-indexとなる。
上の場合だと論文Eのところで順位と被引用数が被っているので、h-indexは5。
つまりこの著者は「5回以上引用されている論文を最低5本書いている」ことになる。
ちなみに平均被引用数は1.89。
同じ平均被引用数1.89の著者でも、たとえば下のような場合だと

順位 各論文のタイトル 被引用数
1 論文A 180
2 論文B 2
3 論文C 1
4 論文D 1
5 論文E 1
6 論文F 1
7 論文G 1
8 論文H 1
9 論文I 1
10 論文J 0


h-indexは2となり、大当たりによる底上げを回避できるようになる。
まあ実際はもっと大規模なデータに適用すべきだと思うが。
「よく引用される文献をどれだけ書いたか」を簡単な算術で出せるのが面白いよね。


以上で長い前振りは終わり。
本題はここから。


この考え方、ブログとかwebサイトとかにも適用すっとなんか面白そうじゃね?
最近はヒット数じゃサイトの良し悪しはわからんから滞在時間とかその他の評価指標探そうみたいな話も出てることだし。
トラックバック件数とかソーシャルブックマーク数とか、なにを持ってindexに使う数字とするかはいくらでも考えようがあると思うが、例えばはてなブックマークなんか良いのではないかと思ったり。
ちょうど頭文字が「h」なのも大きな理由だが、スターと違って基本は一人一票だし、それに必ずしもプラスな影響だけを図るものではない(「これはひどい」系とか)ところも引用(批判文も引用は引用)と似てるし。
実際はトラックバックの方が正しいかとは思うが、それだとあんまり数字がでかくならないから面白みがない。そこは感覚優先。
あと、はてなブックマークの機能でブックマーク件数順の並びかえができるのも計算が楽でいい。


仮にこれをHatena-Indexと呼ぶことにしよう。
例えばmin2-flyの場合、ブクマ数8番目のエントリでブクマ件数と順位が一致するので、Hatena-Indexは8。
他に例えば有名なところで404 Blog Not Foundの場合、101位目のエントリでブクマ件数と順位が一致するので、Hatena-Indexは101となる。
101て。
「101件以上ブックマークされているエントリが最低でも101件ある」ってことかよ。
それはすげえな。
他には皆大好き(?)痛いニュース(ノ∀`) - ライブドアブログの場合、Hatena-Indexは98。
割と「404 Blog Not Found」と競ってる。


難点ははてなでブクマされるエントリに偏りがあることだが、まあでもその偏りも含んでそういうものだ、と思って見てるとなんか色々面白そうだ。
最近、NHKとかで企業が人気ブロガーに試供品あげたりして広告活動に生かそうとしてる、みたいな話があったが、人気ブログを選ぶひとつの指標としてこういうのを使うのも面白いんではないかと思ったり。


はてなブックマークユーザの志向が世間と一緒かは知らんけどね。
いいじゃん、活用とかできなくても、見てて面白ければ(それを面白いと思うかどうかもその人の嗜好性にかなり左右されるが・・・)。