かたつむりは電子図書館の夢をみるか(はてなブログ版)

かつてはてなダイアリーで更新していた「かたつむりは電子図書館の夢をみるか」ブログの、はてなブログ以降版だよ

「試されるリポジトリ」(国立情報学研究所平成22年度CSI委託事業報告交流会「クラウド時代の機関リポジトリ」参加記録 part 2)


CSI委託事業報告交流会エントリ第2弾。


お昼休み、ポスターセッションを挟んでの第3セッションは「試されるリポジトリ」、8人の皆さんがそれぞれ10分ずつ発表、その後40分のディスカッションでした。
以下、記録です・・・が・・・昨日、ちょっと以上に寝不足だったことと、昼食後のセッションであることで、かなーり途切れ途切れになっています・・・(汗)
その点は何卒ご容赦願いますm(_ _)m



「デジタルリポジトリオーバーレイによって実現するサブジェクトポータルと付加価値サービス」(北海道大学・行木孝夫先生)

  • 日本にはおよそ400の数学論文を載せた大学紀要・雑誌・コンテンツがある
    • うち68がDMLに搭載されている
    • JAIRO, IRDBを経由すると思いもよらないコンテンツがMathematical Reviewsのデータベースから発見される
  • 「数学文献は古くならない」
    • ライフサイエンスなどでは積み重ねの中で知見が古くなることがあるが、数学では一度出た成果はずっと使われうる
    • 国際数学連盟・・・コミュニティベースの数学系ジャーナル電子化プロジェクトを提唱
      • DML-JP・・・その日本版がなかなか実現していなかった
        • 実現しない理由:ジャーナルの数が多く把握できない
        • なにがどこにあるか特定できない・・・小規模大学の小規模な紀要には少数の論文しか掲載されず特定ができない
        • 教養部内の数学紀要/工学部等の中の数学講座の論文が載る紀要
        • 紀要交換で海外紀要を確保するために、数学教室があるところには紀要がある。結果、小規模のものが多数ある
      • その解決のために・・・リポジトリオーバーレイによるサブジェクトリポジトリの実現
  • DML-JP:
  • このようなオーバーレイによるサブジェクトリポジトリ構築はどの分野でもできること
    • 誰かが決断すればできる

「博士論文発信支援パッケージ開発プロジェクト」(東京大学吉田幸苗さん)

  • JAIROで紀要論文と学位論文の割合を調べると・・・
    • 紀要約54%、学位論文3%くらい
    • 学位論文はまだ入手しづらい文献の一つである
    • 学位論文への需要はある。図書館Q&Aでも学位論文を読みたい時の方法が載っている/問合せも来る
  • 博士論文の登録を推進するには?
    • 東大の経験を伝える
    • 博士論文登録ツールの作成・公開
    • 博士論文の利用を促進する検索インタフェースの作成
  • 東大の経験を伝える:
    • 所属大学院生に対し資料の配布・とりまとめを依頼
    • 電子化発注時の仕様書の公開
  • 博士論文登録ツールの作成・公開
    • 代理登録が前提・・・DSpaceは本人登録がしづらい
    • 汎用性/半自動でのインストール機能
    • 登録者は博士論文のメタデータのことだけ考えれば良い
  • 博士論文の利用促進
    • 博士論文特有の項目でも検索できるテスト版を作成
      • テスト版は作成したが改良の余地あり
    • 博士をとった直後は職が不安定
      • システムが就活の訳にも発つのではないか
  • 今後の課題:
    • Webでの公開
    • 別の形での仕様書の作成




「『文献自動収集・登録ワークフローシステムの開発』:平成22年度成果『教員問合せシステム等の開発と著作権処理の標準化』について」(九州大学・吉松直美さん)

  • 背景:「登録する教員はセルフアーカイブは面倒と考えている」
    • 面倒さがセルフアーカイビングの障害
    • 担当者にとって著作権処理は負担
    • 負担は軽くなり、みんなが使えるシステム化はできないか?
      • 若手職員のアイディアから生まれた構想
      • 一橋大学でも時を同じくして同様の発想・連携
  • 毎日のワークフローをシステム化できないか?
    • 書誌情報を各種データベースから取り出したい
    • 著作権についても既存のデータベースから確認したい
    • 書誌情報・著作権情報を組み合わせてリポジトリに登録するデータを作る
    • 計画は3年計画・・・今年度はそのうち教員問合せシステムを開発
著作権処理の標準化について」(一橋大学・坂口幸治さん)
  • 目的・趣旨
    • 多くの機関にとって有益なシステムを作るには、各リポジトリで行っている雑誌論文の著作権処理を標準化する必要がある
  • 著作権処理方法の調査
    • 2010.8 全国アンケート調査項目のために近隣大学にヒアリング調査
    • 2010.10〜 全国アンケート調査
  • 調査でわかたこと
    • やっていることはほぼ同じ
    • 著者と出版者双方の許諾がないと公開できない
    • 開発仕様へ

「トータル研修による機関リポジトリ普及活動と次世代XooNIps」(慶應義塾大学・五十嵐健一さん)

  • XooNIps利用期間を中心としたコミュニティによる機関リポジトリ普及活動
    • 構築/運用などのシステム面支援
    • 豊富なマニュアルの作成と公開
  • 3度のワークショップを開催
    • 実際にPCにXooNIpsをインストールし、サーバを構築する
      • 構築に利用したPCは持ち帰りサービスあり
    • 熊本学園大学のWSの例
    • 近畿大学で「つくる」「うごかす」「入力する」:講義を開催
    • 毎回20名以上の参加/実際に手を動かすことが評価されていた
  • 次世代XooNIpsの開発
    • XooNIps:理化学研究所で開発/元々は脳科学の研究者向けプラットフォーム
    • 機関リポジトリとして使う期間が10を超えている
    • XooNIps自体も古くなってきている
      • 次回バージョンアップで・・・機関リポジトリとしての機能も入れてつくり直す
    • XooNIps・・・XOOPSを改修した物/バージョンアップ後はXOOPSの最新機能も
  • さいごに:
    • library module/更新・マニュアル・ツール類

「著者の識別に向けて:オープンアクセス環境下における同定機能導入のための恒久識別子実証実験(金沢大学・守本瞬さん)

  • 著者の識別に向けて:
    • 同姓同名処理
    • 同名異表記処理
    • 各大学の業績データベースからNIIの方に情報を取ってくる・・・それとJAIRO等の情報を結びつける
  • DSpace 1.6を利用して、金沢大学の機関リポジトリでは・・・
    • 自分自身の名前を検索/すでに登録されているものはすぐ出てくる
    • ない場合は典拠として科研費データベースを見に行く
      • 金沢大学はすべての研究者が科研費番号を取ることが義務化されている
      • 登録のたびにて入力する、ということはなくなった
      • 著者名・識別子の対応表を作成
  • 金沢以外に広げるには・・・
    • DSpace 1.6以上へのバージョンアップの補助
    • 登録済みコンテンツに著者識別子と一括登録できるプログラム

クラウド環境における電子出版・リポジトリ連携実証実験」(名古屋大学山本哲也さん/連携先は一橋大学

  • ここでは機関リポジトリは登場人物の一つに過ぎない
    • 報告内容・・・
    • 電子出版彩都が増える・・・機関リポジトリコンテンツも増えて嬉しい
  • クラウドコンピューティングの特徴
    • 自前サーバがいらないので初期投資はいらない/従量課金なので少しずつかかる
    • バックアップをどうとる? けっこう悩むかも
    • 操作ミスが致命的/仮想コンピュータなのでコンピュータごと消え去るかも?/そうならない操作手順
  • スターターキット(計画)
    • 大学図書館研究』の成果をふまえてすぐに導入できるようにパッケージ化する
    • カスタマイズ(最小に)
    • ドキュメント整備
    • 仮想コンピュータの利点を生かす・・・コピーすればすぐ増やせる強みを生かす
  • SWORD対応システム
    • たくさんできる予定の電子出版システムから機関リポジトリの方に内容を移すシステム
    • 実装中・・・SWORD投稿システムに入れたデータを一発で機関リポジトリに入れられるようにはした
    • OJSからデータを貰って送る部分を今年度でなんとかする
    • SWORD投稿システムとOJSからのデータ送信部分を独立で作ってあるので、他のものもSWORD投稿システムを使って自動投稿できるようになるかも

「いっしょに "ものさし" 作りませんか?」(千葉大学森一郎さん)

  • ROATプロジェクト:
    • DRFメーリングリストでアクセス数とランキングの話が盛り上がっている・・・コメントしたい話を押さえて今日を迎えた
      • まさしくそういった方面の話
    • ROATとは?
  • 平成20年度から・・・学術j応報基盤実態調査の中で機関リポジトリに関する調査がある/『大学ランキング』でもリポジトリの項目がある
    • 『大学ランキング』におけるダウンロード件数/論文搭載件数・・・見ていると色々浮かんでくる
    • 佐藤義則先生がしばしば見せる図・・・インパクトが強すぎた?
      • ROATは真のアクセスログまで剥くことが目的ではない/共通でどこを基準にするか考えましょう、というプロジェクト
    • 並べるのであれば何かしらの基準がいる
  • 平成22年度の活動:国際セミナーの開催*1
    • 連絡をとりあう中で・・・重複クリックとサーチエンジンのクローラ削除、ということで方向性はずれていないことは把握している
    • ROATで考えること・・・なにを数えるか。特定の大学だけで決めるのはまずいこと。皆さんのご意見が欲しい、それには一度使って欲しい
      • ただしXooNIpsには未対応

「全国遺跡資料リポジトリ」(島根大学・矢田貴史さん)

  • 発掘調査報告書とは?
    • 埋蔵文化財の発掘調査内容をまとめたもの
    • 行政資料であると同時に歴史・考古学分野の基本資料
    • 少部数発行/寄贈・交換が中心で入手しにくい灰色文献
    • 研究者、学生、一般の愛好家等、需要は広い・・・グリーン化のニーズ
    • 専門分野の特性もあり、従来のリポジトリシステムでは対応しきれない
  • リポジトリシステム:Earmas/VMware上で起動
    • 都道府県単位で各大学がサーバを管理する場合と、NIIのクラウドで行う場合がある
    • コンテンツの収集から公開・・・各自治体と大学図書館の連携による
      • 収集:大学から提供依頼を行う/冊子体発行時に業者に電子データも納品させることを推奨
        • 冊子から電子化する場合・・・印刷・保存用には高精細なものが必要/軽量化と同時に研究に利用できる程度の品質がいる
      • 登録・公開:大学による代行処理と自治体によるセルフアーカイブ
        • いずれの場合も奈良文化財研究所の抄録データやWebcat Plusの書誌データを活用するなどの省力化を図る
        • 大学図書館の職員では対応できないような専門的な書誌の作成が必要な場合も(古いデータ)
    • 検索・利用システム・・・報告書検索/マップ表示/横断検索
  • 平成22年度の事業成果:
    • 対象地域の拡大
      • 平成20年度:5大学⇒平成22年度は20の府・県域にまで拡大
    • クライド導入など管理・利用のための回収
      • 共同サーバ上のクラウドを活用する/新規参加の敷居が下がる
      • 昨年度の新規参加大学はすべてクラウド利用
    • 自治体での電子化
    • オープンカンファレンスの開催
      • 一般参加もあり
    • 外部資金によるコンテンツの充実
      • CSI科研費の獲得
      • 合計9000冊以上の資料が電子化
      • 長野県では1500冊超の報告書が電子化される/地元新聞でも取り上げられる
      • 全国の発掘調査報告書は6万冊であると言われている。プロジェクトで6分の1弱が電子化されたことになる
  • 今後の展望・課題
    • 対象地域の拡大・コンテンツの充実
    • 自治体主体のセルフアーカイビング支援
    • 検索・利用面・・・ユーザから見える部分
    • 関係機関でのコミュニティ形成の強化
  • 大学図書館発のプロジェクトから一般の認知度・関心も向上。今後は・・・
    • 今後も長く社会に貢献するために、将来の事業モデルを考えるステージに入ってきている
    • 委託事業終了後の運用方法
    • 各大学・自治体の事情を考慮した複数の参加モデルの構築

質疑応答

  • Q. 東大へ。予稿集p.68で博士論文の利用促進について触れているが、博士論文特有の項目での検索は便利と思うのだが、改良の必要とは? テスト版は完成したが改良がいるとしているが、具体的には?
    • A. 一つはまだ簡便なインストールができない。手間がかかる。あとは、これは今すぐ改良するかは考えているところだが、東大は博士論文のメタデータはdescriptionのところにべた書きでいれている。それをフィールドとして、個々の報告番号や学位の種類のフィールドを設けて、検索インタフェースではそれらのフィールドを指定して探せるようにしたいと考えている。
  • Q. コーディネータ・山地さんから。Open Repositories 2011でイギリスからの参加者も、博士論文登録のために独自のwebインタフェースを作り、それに加えてSWORDを使ってリポジトリに入れる、さらにWebアプリケーションではシボレス認証で著者を特定する、というような話もあった。領域2ならもっと挑戦してもらってもいいと思うが、興味はない?
    • A. 興味がなくはないがお金次第。NIIさんのご指示と皆さんのご意見をお待ちしている。
  • Q. 遺跡資料リポジトリに。自大学でも発掘調査報告書をたくさん持っているので参加したいと思っている。考古学協会の反応を知りたい。埋蔵文化財センターは自治体と近いものの別に活動している。そこが動いてくれないと広がらないのでは?
    • A. 考古学会や埋文センターとの関係については、はじめは図書館の一人歩きであったが、最近は学会誌の中で取り上げられたり、電子化して流通させることが脚光を浴びた。オープンカンファレンスによって一般の認知度もあがっているが、持続可能なものにするには図書館だけではなく研究者や学会との連携が重要になる。今後も連携は密にしていきたい。
  • Q. 細かい話になるが、遺跡資料報告書抄録について。抄録を見ても役に立たない、という本音がある。その改変やグレードアップは検討している?
    • コーディネータ:役にたたないとは具体的には?
  • Q. 項目が少なすぎる。これで検索をしても実用性がない。
    • A. 抄録の付与が推奨されたのは1994年以来。それ以前は抄録がないし、それ以降も表記のゆれがあったり、分かち書きなどの問題に苦慮している。過去分の遡及入力も含めて大学図書館では対処できないこともあり、自治体によるセルフアーカイブを推奨すればいくらかはデータベースとして使えるのではないかと思う。抄録のバージョンアップは提言などはしたいがプロジェクトの埒外ではある。
    • コーディネータ:図書館発のデータリポジトリは希少なので頑張ってほしい。考古学文書の海外流出の話は逆に言えば海外にもニーズがある。電子化して流通すれば日本の考古学を研究している人にとってもusefulであるということ。ぜひしていって欲しい。
  • Q. ROATについて。ぜひ大学ランキングみたいなところの数値を標準化して欲しいと願っている。場合によっては文科省の調査も標準的なダウンロード件数の指針を示して、各大学から数値を上げてもらえればいい。そこについてのこれからの活動予定、実現するにはどういうことをお考えですか?
    • コーディネータ:ROATについては気になっていて、本年度の差分、新たな成果と、今後の展開についてもっと言及して欲しい。
    • A. まず差分についてだが、先程も紹介したセミナー。今年度の目標は国際連携だったのでセミナーを主眼としていた。
    • コーディネータ:国際標準とのすり合わせやROATの見方の反映、というのはあったというが、具体的にどんなことがあった?
    • A. 運用面で難しいところもあるが、ROATではクローラの判別システムを不完全ながら持っている。それはドイツから素晴らしいのでリスト共有の要望は貰っている。フランスはまだアクセス統計を統一的な基準でとるところまでいっていない、というのが担当者の意見。まずはすり合わせからしたい、ということだった。その他にはROATの紹介をして、利用機関・・・なかなか伸びないのだが、平成22年度には4機関ほど増えたはず。
    • A. 難しい方の質問への回答。報告中でも申し上げたが一大学が基準を決める・・・特定の大学が決めることではない。そのためには色んな大学のご意見をもらわないといけないのだが、どうも今はROATは千葉大学のイメージが強すぎる。そこを脱却しないといけないのかと思う。他力本願のようで申し訳ないがNIIの支援をいただいて、協力しながら方向を示せればいいかと思う。昨年度末に会議の場を設けて話をさせていただいているところ。
    • コーディネータ:各大学でやるとなると、新しい工数が増えるのでなにがいいのかわからない。しかしたくさんの大学が参加しないと効果が出ないので鶏・卵になる。そこでトップダウンがいる、ということ? NIIとの話ではどういった結論がでた?
    • NII・森いづみさん:運用的に千葉大学が代表機関としてやっているROATを使ってもらうアプローチだと、今のところ50機関が実際に参加して試しにやってみている。機関リポジトリは200以上あるので、あとの機関にも使っていただくには「千葉大学のROATです」では、大学のログを他大学のサーバに載せるのに抵抗がある。そこでNIIのサーバなら抵抗が少ないのでは、ということで載せ替えることを考えている。
    • コーディネータ:50機関というのは継続的に使ってくれそうな機関の数?
    • A. 日常的に使っているところは10あるかないか。
    • コーディネータ:自分のところで数を使うためにやっている? それともそこで標準化された数をどこか別の報告書で使っている?
    • A. 各大学がなにをもってアクセスとするかの問題。要はクローラも含めて利用だと言うのなら、日本全体がそうであればROATで頑張っても仕方がない。コンスタントに使っている大学についてはROATの基準は完璧ではないにしても的を射たものと判断して使っているのだろう。
    • NII・森さん:標準が必要という機運を大学の方から高めてもらうことも必要だし、実態調査を出すときには何かしらの標準が必要である、と言ってもらえるように「こういうものがあります」というのを示すことがいるかと思う。
  • Q. 今の話の続き。クローラは何%くらい、というのはパターンで示せる?
    • A. 他所の大学の結果も千葉大学は見られるが、エチケットとして見ないようにしている。「どうしてもできないのでやって」と言われたときに触れることはあっても、普段は見ないようにしている。アクセスログは基本的に見ない。なので何%、と答えるのは難しい。大学によってクローラの率はけっこう違うことはわかっている。どこが何%かの数字はわからなくはないが出していない。
    • コーディネータ:例えば千葉大学の例だと?
    • A. 今、数字を手元に持っていない。
    • コーディネータ:ではDRFメーリングリストででも。
  • Q. 今の続き。ROATに一点。ROATに参加してもクローラチェックは目視で各機関でやらないといけないのではないか?
    • A. 正確にやろうとすれば目視が必要になるだろうが、大まかな数であればだいたいはわかる。AWstatsを使っていて、「何件」というのは出てくる。
  • 佐藤先生のお話では機関ごとに個別のクローラがいる、とのお話だったが?
    • 日々、クローラは増えているので「かなり」がどこまでかは答えにくい。なかなか難しい問題ではある。メンテナンスは手作業でやらざるをえないのでなかなか進まない。
  • Q. 金沢大学に。著者IDの同定について、国内の話は出ていたが国際対応はどう考えられている?
    • A. 今現在はまだ国内をメインに置いている。入力した著者識別子をOAIsterに持って行ってもらう、というようなことは目下は考えていない。著者識別子については欧米でもどういう体系で作るかという話も出ているので、そちらに日本もコミットして連携をとるか、同じ体系をとるか考えたい。ただ、特定の体系のIDしか受け付けないようにはしたくない。何かしら同定できるデータさえあれば何かしら著者を同定できるようにはしたい。著者も番号を持っている人と持っていない人が一つの大学の中に混ざり合っている。そこをうまく解決する方向で、国際化も視野に入れたい。
    • NII・武田先生:国際化に関連してORCIDについて補足。ORCIDはもともとはElsevierやNPGのような大手学術出版者が、それぞれ管理する著者IDを世界統一したいということで、大学も混じえてオープンに使えるIDを提供しようという動き。一昨年の終わり頃から始まって去年から具体的な組織が作られている。最新の予定では来年の夏には最初のサービス受付を始めることを考えている。なにをするか、煎じ詰めれば世界中の科学論文の著者にユニークなIDをつけること。DOIよりももっと時間はかかるだろうから長い目でみなければいけないが、そういう世界がいずれ来る。その中で今の論文をどうするか、過去の論文をどうするかはリポジトリ等で考えること。世界的にはそういうことで、その中で日本は科研費のIDがある。世界的には国レベルでこういうふうに研究者が把握されているところは少ない。日本は上手くいっているほうなので、連携すれば日本の論文のビジビリティが上がる。先んじてできるのではないか、ということで期待しているし、日本中のリポジトリで論文にIDをつけて出すことをやっていって欲しい。ちなみに私がこういう話をするのは私がORCIDのNPOの理事でもあるから、ORCIDはかなり有力な動きでもある。
  • Q. 研究者リゾルバが金沢大学のプロジェクトの連携としても走っているのでそれについて。ORCIDや国際連携、それとローカルな話がどう絡むか考えると、Open Repositoriesカンファレンスの中でDSpaceの開発者ミーティングに出たときにも著者IDについての話が出ていた。そこでもORCIDの発表が当然あった。グローバルな世界の中でもリポジトリーには著者IDがつけられるだろう。一方で我々のリポジトリでは著者に独自に様々な番号を付けている。さらにIDの運用という意味ではそれぞれの機関を超えて著者名寄せをするには、どの番号とどの番号が同じ著者のものか、ローカルを超えて名寄せしないといけない。そこで研究者リゾルバがIDマッピングテーブルの代表として必要なのだろうと考えている。その中でORCIDというのはある著者のIDがORCIDの番号としてはどういうものか、をひもづけられれば国内外のマッピングができる。つまり研究者リゾルバが国内の番号と海外のORCID番号の対応表ができるようになればいい。そのためには機械学習や研究者同定をしなければいけない。
  • Q. 東京大学に。ご説明いただいた流れによれば、登録された論文と審査の対象になった論文の一致はどの程度、考えられている? 違っても構わない?
    • A. 違っている可能性というのは・・・正直あまり考えていなかった。おっしゃっているのは、最終的な博士論文を提出する人もいるだろうが、途中のものを出す人間がいるということ?
  • 他に後で気づいて修正を施したファイルを提出することもあり得るのでは?
    • おっしゃるように実際に一週間ぐらい置いて直したファイルを登録しなおしたい、という問合せもある。その時は「登録したいものを」というのが我々のスタンス。本人が不満足なものを登録しっぱなしにする必要性はないと考えている。
  • 本学でも昨年度から登録を大学の方針にし、オプトアウトでルール化している。その場合、大学のリポジトリに登録するときに学位授与の根拠となったものと違うものを登録するのはまずいだろう、という話になった。図書館員はセルフアーカイビングだから提出されたファイルを登録しようと考えていたが、大学の方針では国会に出す物・大学に保管するものと一致しなければいけない、となった。馬鹿げているかも知れないが保管用の冊子をばらして電子化して登録している。
  • Q. NIIに。学位論文も遺跡発掘資料も従来は紙の資料として図書館に来ていたもの。NACSIS-catに登録するにも「こんなものでいいのか」と疑問を持ちつつ登録してきた。一方で著者名典拠については紙の時代にやってきたわけだが、そこにこの中で触れられないというのは紙との間の議論はない、とのこと?
    • NII・大向先生:あとで話したい。公式見解は武田先生から。
    • NII・武田先生:いい質問。一方でNACSIS-catをやり、CiNiiをやり、リポジトリをやりと色々やっている。catは紙ベース、CiNiiは中間、リポジトリは全くの電子。3つの世界で色々やっていて、我々としてはそれを全部まとめたいと真剣に思っている。その中の一つの鍵が著者、人であることも強く認識している。そこで研究者リゾルバなど、色々作って、名前でどうやってつなぐか・・・という努力をしている。NACSISの著者名典拠や、CiNiiではCiNiiの著者名寄せもしている。CiNiiの名寄せには元のソースは科研費報告書から出た名前を使っている。注意深く見てもらえると名寄せしたIDの中で科研費名寄せできているものがある。著者はいいとっかかりで、そこから全部つなぐことは順次進めている。



感想は最後にまとめて!