かたつむりは電子図書館の夢をみるか(はてなブログ版)

かつてはてなダイアリーで更新していた「かたつむりは電子図書館の夢をみるか」ブログの、はてなブログ以降版だよ

リポジトリの力:リポジトリの効果と応用サービス(国立情報学研究所平成21年度CSI委託事業報告交流会(コンテンツ系) A-1 成果報告)


ベントラッシュ2日目。
昨日は大学・研究評価の話でした*1が、今日はその中で少しお話も出てきた機関リポジトリに関する国内最大級のイベントの一つ、CSI委託事業報告交流会に参加して来ました!


昨年は自分も発表サイドにまわったわけですが*2、今年は自分は聞いて記録を取る係ー、ということで割と気楽な立場だったり。
一方で、昨年までは2日間にわたって開催される代わりに1会場で行われていたのですが、今年からは1日・2会場での並行開催と言うことで、どちらも大変興味がある発表目白押しだったのですが残念ながら身体は1つしかなく・・・今回はずっと一ツ橋講堂側で記録をとっていました。
もう1会場の方はどなたかその場にいた方の記録に期待したいと思います。
なお、今回も丸一日にわたるイベントと大変長かったので、記録は3部構成に分けて順次アップしていきます。


というわけで以下、例によって例のごとくメモです。
あくまでmin2-flyの聞きとれた/理解できた/書きとれた範囲のものであり、かつ今回は2日連続で睡眠時間が4時間に届いていない影響でたまに意識飛んでいたりもするので不正確性を御理解いただければ幸いです。
また、第1部前半は会場でネット接続を試みて失敗し、PCが調子悪くなってメモが荒かったりします。
その点も御容赦願います。


では、まずは信州大学の岩井さんのご発表から!



コーディネータ:逸村裕先生、筑波大学

ダウンロードデータを次に生かす:視認度評価分析システムの現在(岩井雅史さん、信州大学

  • 背景
    • CSIを通して基盤となる機関リポジトリが整備された
    • 大学で研究資金における競争資金の比率が高まる・・・自己評価、アピールの重要性が増す
    • 研究機関における研究評価が浸透
      • 多面的な評価指標が必要に!
  • 機関リポジトリのダウンロード数、検索語、アクセス元情報を提供するシステム
    • リポジトリを評価指標に付け加えることで、自らの強みを発見しアピールに活かせる
    • そうしたデータを得るためにリポジトリへの登録を促す効果も期待
    • 具体的機能・・・被引用数、ダウンロード数、研究者総覧アクセス数等のデータをまとめて見られるように
  • システムの概要
    • 研究者総覧とリポジトリのリンキングがベース
    • 研究者、リポジトリ内の論文、引用DB内の論文を紐付けてまとめ上げる
    • 引用DBに入っていないと被引用数が出ない、リポジトリに入っていないとダウンロード数が表示されない
    • 平成20年度中に研究者単位の集計まで開発。平成21年度には学部、学科等の組織レベルでの統計表示機能を開発。現在サイトで公開
      • さらに汎用性を向上するために、Web of ScienceだけでなくScopusにも対応可能に。リポジトリもDSpaceだけでなくXooNipsにも対応
  • 質疑
    • 名古屋大学・伊藤先生:作られた立場からのご発表だが、利用者側、先生方の反応は?
      • 個人別の方は昨年度から試験運用。先生方からは「こういったデータが見れるのは嬉しい」との反応。ダウンロード数だけでなくリンク元等がわかるのは有り難い、とのこと。ただ、利用している先生の数はまだ多くない。組織別の統計はこれからどう見せるか。
    • 東北大学・??さん:自分自身の思いと被引用数が関係しないのは研究者はよくわかっているので、選択肢が多いことは研究者にとっては厳粛に受け止めたい。自信を持って宣伝して欲しい。自分のイメージを壊してもらえることもいい。
    • 民博・高橋さん:デモで検索ワードクラウドの文字の大きさが違うのは意味が?
      • 字が大きいワードほど検索回数が多いもの。
    • 北見工業大学・フナキさん:今までもダウンロード数は教員にお知らせしていたが、どこから来たか等を質問されたことがあった。その時は答えられなかったが、このシステムは完成時には一般のリポジトリでも利用できる環境になる?
      • 無償提供モジュールは大学、学術機関で研究者総覧と組み合わせて使う場合には出す。その受付を始める。ただ、今のところは適用できるシステムが、特に研究者データベースについては制約がある。リポジトリについては多くのシステムで大丈夫だと思うが、今はDSpaceとXooNips。研究者データベースをどうするか、カスタマイズの必要性の程度がまた不透明。それについては今後もお知らせしていきたい。
    • 完成を楽しみにしています。

研究者情報システム連携プログラム(守本瞬さん、金沢大学)

  • 事業の目的:大きく2つ
    • 1.著者自身による投稿をどう容易にする?
    • 2.いかにして著者を同定する?
  • 著者自身による投稿を如何に容易にするか
    • 金沢大学の業績DBへの登録は義務。そこで登録するとリポジトリへも登録する画面が出るようにした。月数件はそこからリポジトリへの登録が進んでいる
    • 業績DBとのデータ連携・・・業績DBのメタデータと登録された本文を自動登録、図書館から再度言わなくてもいい
    • リポジトリの中に科研費番号と業績IDの項目を作り、教員総覧との相互連携を構築
    • 一方で・・・リポジトリ側の業績IDの遡及登録が終わっていない
      • システム的にはできるがまだ・・・
    • ここまでが20年度の話
  • 著者同定をどうする?
    • NIIの研究者リゾルバ(http://rns.nii.ac.jp/)に、金沢大の総覧から研究者個人データをアップロードする仕組み
      • ReaD(http://read.jst.go.jp/)向けに情報を飛ばすシステムを、リゾルバ向けにXML変換するものを構築
      • 大学が持っている最新の情報をNIIのリゾルバにアップロード
    • NIIのJAIRO(http://jairo.nii.ac.jp/)向けにjunii2とクロスウォーク
      • JAIROに科研費番号を届ける仕組み
  • これらによる将来構想
    • 各大学のリポジトリと業績DBの相互リンクで連携を深める
    • そのデータを著者の番号をつれてNIIのJAIROや研究者リゾルバへ
    • 将来的には番号によってJAIRO側で著者同定し、研究者リゾルバでその著者の最新状況に相互リンク
    • 科研費番号を各大学で入れておけば、大学を移ってもJAIROでは名寄せ可能に。婚姻による姓の変更にも対応可能、同姓同名問題もJAIRO側で解決
      • 今回はその途中まで作成
  • 今後の構築
    • JAIROで名寄せできる仕組みを作ってもらう
    • 研究者リゾルバとの相互リンクをやってもらう
    • なるべくたくさんの大学で、個人番号を登録しやすい仕組みを作る必要がある
    • 現在は科研費番号を個人番号として使っているが、科研費番号は日本ローカルだし全研究者が持っているわけではない。個人的な研究者IDの動きとの連携、関与が必要
      • 海外ではCOARで同定識別子が検討されている/ORCID:トムソン・ロイター/Nature Publishing Groupの動きに参加/ISNIに関与?
  • 質疑
    • NII・米澤さん:金沢大学の研究者のDBはある程度ほかの大学にも適用できるようなツール?
      • システムそのものに何か手を加えるのではなく出てくるデータを変換するプログラムを作った。ほとんどの大学はReaDにデータを送るシステムがあると思うので、それを加工して作りかえるプログラム。最終的に制作されたXMLをアップデートすることで研究者リゾルバに必要なデータが流し込める。ReaD向けのデータさえ作っていただければ。
    • 文部科学省・首東さん:事業の目的としてデータベースに先生がデータを登録した際に本文データを登録できるとのことだが、月数件というのは業績DBに登録する中のどれくらいの比率?
      • 比率としてはごくわずか。どちらかと言えば先生方は年度末にまとめてDBに入れてしまうので、それより先に図書館の毎月の呼び掛けで登録されてしまっていたり。そこで漏れていたものとか。割合で言うと1割に行っていないかと思うが、いろんな入口があれば何かの機会に登録いただけるかと思う。
    • 登録数自体は増えてきている?
      • 爆発的に増えたとかいうことはない。

アクセス統計の手法と効果(ROAT project)(武内八重子さん、千葉大学

  • 平成21年度のシステム改修
    • アップロードされたログを夜間バッチで処理してきたが、その前に間違ったファイルを削除できる画面を作成
    • ログのアップロードし直し等の処理を各機関でできるように
    • 書誌事項の出力項目の充実
    • JAIROからの書誌事項のハーベスト頻度の増加
    • アクセスログの自動アップロード機能・・・まだ千葉大学内で検証中
  • 海外の状況調査
    • フランス、ドイツのアクセス統計プロジェクトと情報交換
    • フランス・・・各機関リポジトリでログの分析
      • 相互比較できる枠組みの概念形成を目的に活動しているプロジェクトと情報交換
      • システムはない。分析方法や用語の使用方法の統一
    • ドイツ・・・Open Access Statisticsプロジェクトでシステム構築
      • 複数の基準でログを分析した結果を比較表示できるようになっている
      • まだ広くは公開されていない。プロジェクト内で研究中とのこと
    • イギリス・・・PIRUSプロジェクト
    • 海外に対するROATの利点
      • 書誌情報付きで結果を返せる。他ではまだあまり出来ていないとのこと
      • アクセスログ分析時にYahoo!Google等の検索ロボットの除去が重要だが、そのロボットのリスト更新について利用機関から情報提供いただけるシステム
        • なかなか活用できる状況ではないかも知れないが、他国との情報交換でも興味を持ってもらえる
    • 課題
      • 国際標準化の必要性
      • 複数機関の著者が同じ論文をそれぞれにアップロードした場合、論文の利用としてはそれらを合計したいはずだが、どうやったらうまく行く?
        • 多様な分析方法への対応
  • 今後の課題
    • より妥当な、利用機関のニーズにあったが、国際的な場でも使用できる統計結果を得られるように
      • IPではなくCookieで個人を認証できないか、など
  • 参加機関はいつでも募集中!
    • 千葉大学附属図書館:ir@office.chiba-u.jpに連絡を
  • 質疑
    • 東北大・ヤナギサワさん:ドイツのOASはどうして広く使われていない? 公にできないから?
      • まだ公開していないせい。利用機関を募る段階にたどり着いていないよう。ROATは使って欲しいと既にアピールしているが、OASは形が出来るまで内部で試行錯誤したいらしい。
    • しかしプレゼンスを高める上で、いいことばかり起きるわけではない。研究者が離反しないことはとても大事な注意事項と思うが。実は研究者が見ている世界と、情報から浮かんでくる世界は必ずしも一致しない。一致しないのは謙虚に見れば研究者にとっては変わるチャンスのはずだが、プライドが傷つけられることもあるのではないか? 情報は1人歩きするのは避けられない。そのさせ方。ドイツが注意しているのはそういうところも埋めながらやろうとしているのでは?
    • 逸村先生:ドイツの場合はナチスドイツの情報政策の動きが今日にも影響、EUの中でも頑なな要件もあってログの解析も厳しい。しかしやることはやろうとしている。
    • 民博・高橋さん:これは誰のための統計解析?
      • 統計解析して紹介すると言うより、各機関が自分のところでログを精査するのは大変なので、生データをいただければ精査して整理して渡すので、あとは使って下さい、というもの。図書館員やリポジトリ管理者の背景にあるといいシステムと思う。
    • 研究者の方からの反応は?
      • 直接、研究者に届けるものではない。各機関でどう使っているかまでは存じない。千葉大学では研究者へのフィードバックはしていないので先生方に戻すのはこれからの課題。

機関リポジトリ収録文献のビジビリティ向上(野中雄司さん、北海道大学

  • 発足のきっかけ・・・
    • 研究者から、WoS等からもリポジトリにアクセスできるようにしたい、との意見
    • リポジトリをより自然な情報探索行動の中に位置づけるには?
  • HUSCAP*3へのアクセス経路
    • 結局、英語論文に対してはほとんごがGoogle経由
    • リンクリゾルバを通じて文献に利用者を導けないか?
  • AIRwayの画面説明:Web of Scienceの場合
    • WoSの検索結果で、リンクリゾルバにアクセスした際、その文献がリポジトリに入っていればそちらにもナビゲート出来る
  • AIRwayの詳細説明
    • 通常の研究者の探索経路ではリポジトリにはアクセスしない
    • AIRwayはこれを打開するもの
  • AIRwayの現況
  • AIRwayの今後
    • リポジトリ上の文献の視認性向上は実現
    • 世界的に対応するにはメタデータの充実が世界レベルで実現しないと無理
    • むしろこの成果を踏まえて別のアイディアが必要・・・?
      • JEEPway
      • 識別子を使って、異なる版へのアクセスを・・・とか?
  • JEEPway
    • ゾルバを使用して曖昧な情報から文献を特定する
    • 論文タイトル、雑誌タイトル、著者を検索してサービスプロバイダを検索、結果を中間窓に
    • ハーベスタがいらない。AIRwayは「これでしょ?」と提示、JEEPwayは「違うかもしれないけど、これ?」の代わりにハーベスタがいらない
  • 質疑
    • 北海道大学・逸見先生:使われているの?
      • 実際どれだけ使われているかの計測が困難。何故かと言うと、AIRwayにヒットした回数はわかるのだが、リゾルバの中間窓をクリックした回数は企業側はわかっても北大ではわからない。ただ、S・F・Xには全てではないが、一部アクセス数計測の仕組みを作っていて、月に少なくとも1,000件以上がクリックされていることはわかっている。今後もやっていきたい。
    • 日本動物学会・永井さん:(異なる版の話のところで)出版者版と違うDOIを付けたりするのはやめて欲しいが、必要性はどの程度?
      • AIRwayでやりたいのは出版者版とは違うバージョンのものにnavigateしたい。その識別がしたい。DOIは同じ表現かどうかも出せるので、背番号をつけてしまうのがいいのではないか、ということ。同じ内容で違うDOIは嫌、というのもわかるがテクノロジーでなんとかできるのではないか。

ZSプロジェクト:学術成果の拡大(永井裕子さん、筑波大学大学院図書館情報メディア研究科/日本動物学会事務局長)

  • プロジェクトの背景
    • 一昨年のDRFICでプレゼンテーション
      • http://ir.library.osaka-u.ac.jp/metadb/up/DRFIC2008/Nagai.pdf
      • あるジャーナルがリポジトリに入ったらどんなパフォーマンスをするかを徹底的に調べることが重要である
      • 科研費を受けて発行してきたジャーナルとしても、コンテンツを抱え込むのではなくリポジトリに入れてパフォーマンスを見ることが責務と考えていた
      • 『Zoological Science』が読めていなかった人にも届くといいな、と考える
    • 北大、京大、筑波、関係する先生各位に御礼を申し上げたい
  • プロジェクトの概要
    • 機関リポジトリに限定的に着目した文献引用向上効果に関する調査
    • この2年間で471の雑誌『Zoological Science』掲載論文を北大・京大・筑波のリポジトリに登録
      • うち171論文のログの詳細分析に基づいて今日の話
  • 再考すべきこと
    • リポジトリに載せた論文は研究者に届いているのか?
      • アメリカetcも言うように一般の人に届けることも大きなミッションだが・・・
        • 学会/研究者の要求を満たすには研究者が読んでいるのか否か、というのはある
    • 良い論文はどこにあろうが読まれるのか?
    • それまで読めなかった論文が読まれるようになったのか?
    • 研究者にとってリポジトリは必要なツールなのか?
  • 『Zoological Science』について
    • BioOne.2*4、UniBioにより電子版を公開
    • インパクトファクターが2008⇒2009で落ちたのでちょっと凹んでいる
      • Eigenfactorは上がってきている
  • アクセス数、被引用数の関係等
    • リポジトリ掲載分は米国、JStageでは日本・中国、被引用数では日本
    • HINARI*5にも入っているが、全然アクセスはされていないのでここでは無視していい
  • ユーザとは?
    • 当初は研究者だといいな、と思っていたが、一般人か研究者か・・・
    • BioOne.2は研究者であるはず。JStageは?
      • BioOne.2のオープンアクセス分に誰が来ているのか?
    • 機関リポジトリユーザってなんなのか?
  • 機関リポジトリは(今は)研究者に必須のツールではない
    • 物理、化学、生物等分野によってリポジトリの使われ方が違う?
    • 研究者は商業出版者の快適な環境下にいる。ほとんどの論文は読めている、わざわざ機関リポジトリまで探すだろうか?
      • しかしリポジトリ拡大のために購読をやめる、ということもないだろう
  • 今後の課題
    • 論文数を増加させたい。個別研究者の許諾なしでも登録できるようにする手順を踏む
    • 研究者の研究活動から考える必要がある?
  • 質疑
    • 名古屋大学・伊藤先生:機関リポジトリが研究者に必須の道具ではないのはその通りで、研究者は保守的。また網羅性が低いので、それを研究者に使わせるのは難しい。それよりは補完しているか、論文にアクセスできなかった人を補完しているかで今は満足するしかないのでは? そこを分析しないと、今のトップの世代の研究者に手法を変えろとか使ってくれとか言っても難しい。
      • 正しいご指摘だと思う。1970年生まれの人間が今年40歳になり、社会科学の世界ではここがドラスティックに変わるだろうと言われていた。今のトップの行動は変わらないだろうが、少し下の世代ではアクセスが多いことが嬉しい、とのコメントが多い。そのことは言うべき。それがちょっと年上になると受け取り方が変わる。嬉しそうではあるが、意味がよくわからないということもあるらしい。それは仕方ない。ただ、どこからかは全員がコンピュータやアクセスログとは何かを知っている時代が来ると思う。
    • 北海道大学・逸見先生:研究者の必須のツールには一般的に言ってならない。そういう目標を僕は掲げていない、それは無理な話。研究者は関連論文を探すときには機関リポジトリは探さない。僕も使わない。専門家ならば誰でもそう。その論議自体無理がある。僕の一番新しい論文を引用したのは朝日新聞の記者。それはGoogleで探して、リポジトリから引用した。そういう使われ方をするもの。僕はテーマとしては皆が載せること。今日の話は技術偏重で面白くなかったが、この話はテーマが間違っていると思う。ツールにならないのは当たり前。
      • 今のところはなんとも言いようがないが・・・購読出来ている状況や、ビッグ・ディールがどうなるか、あるいはテクノロジーが私たちの想像を超えればもうちょっと違った話があるかとは思うが・・・ただ、今の段階ではおっしゃる通り議論すること自体がどうか、というのはあるかも。

質疑応答・意見交換・まとめ(コーディネータ・逸村裕先生)

  • 静岡大学・杉山さん:特に岩井さんと武内さんに。某新聞社の大学ランキングで機関リポジトリについても論文数とダウンロード数のランキングがある。逸村先生もダウンロードの標準化が出来ていないと書かれていたが、どうやって信頼度を高めていったらいい? ご意見を伺いたい。
    • 千葉大学・武内さん:大学ランキングの基準まで把握していないが、ROATは標準化を目指している。例えば分析する際に、各大学が個々で見るとロボット等の基準がまちまちになる。AがBより10件多い、となってもその10件に意味があるか。同じ基準で出された数字かを疑うことが重要。登録数はIRDBで今はわかる*6。ダウンロード数も同じように同じ手順で分析して比較するよう、みなさんにご活用いただいて基準を作って、そこで比較していただければ。
    • 信州大学・岩井さん:武内さんと同意見。ああいった調査をする側、新聞社さんがダウンロード統計の標準化の問題への認識がない。そこに事情を知ってもらうことも、情報を広めることも今後必要。大学ランキング等のようなもの全体がそうだが、数字がどういった意味を持っているかを含めて作られるのが、そして読者に情報を出すことが必要。
    • 逸村先生:編集者は標準化の問題は知っている、とのこと。昨日シンポジウムのあったTHEのランキング等も調べている人。あのデータの元は、朝日新聞社が大学に問い合わせて、大学が出してきたものは酷い代物。それを新聞社なりに編集して出せたのがあのデータ。その2年分でも全然違う。如何に、個々の大学が自分のデータに責任を持っていないか。そこから先は今の武内さんと岩井さんの議論のまま。また、大学の規模やコンテンツの種類、主題によるばらつきを踏まえて今後どうして行くか。朝日新聞がわざわざ機関リポジトリ大学図書館を並べているのは関心がある、ということでポジティブにとらえている。
  • 逸村先生:岩井さんに。ダウンロード数と被引用数を並べて見る、これはZSプロジェクトでもやっているが、何か特徴的なもの、例えば引用が多くてダウンロードが多いものはわかるが、引用が少なくてもダウンロードが多い、あるいは逆の特徴って何かわかる?
    • 信州・岩井さん:相関をとってもゆるい。しいて言えば、日本語の論文はダウンロードは英語論文に比べて多い。それは日本の大学で出しているので日本から見に来ているのだろうが。英語論文は大雑把に見て、引用が多いものはダウンロードが多そうな傾向はあるが、関係はよくわからない。日本語は引用数は関係ない、出版年も関係なく英語に比べてダウンロードが多い。



このセッションは自分が直接的に関係していたり扱っているテーマが多かったですね。
最後の岩井さんの質疑でダウンロード数と被引用数の相関の弱さが指摘されていますが、この点は自分のこれまでの分析でもそうだったり。
研究者の行動の変化の話についてはちょうど一昨日に発行された『カレントアウェアネス』に自分も電子リソースと研究行動に関する論文を書いていますが*7Googleの利用が広まってくると機関リポジトリを探すということはなくても結果的に機関リポジトリコンテンツを使う、ということにはなるかも知れません。


この後、昼食&ポスターセッションを挟んで午後は口頭発表とパネルディスカッションです。
続きは次エントリにてー。