「試されるリポジトリ」(国立情報学研究所平成22年度CSI委託事業報告交流会「クラウド時代の機関リポジトリ」参加記録 part 2)
CSI委託事業報告交流会エントリ第2弾。
お昼休み、ポスターセッションを挟んでの第3セッションは「試されるリポジトリ」、8人の皆さんがそれぞれ10分ずつ発表、その後40分のディスカッションでした。
以下、記録です・・・が・・・昨日、ちょっと以上に寝不足だったことと、昼食後のセッションであることで、かなーり途切れ途切れになっています・・・(汗)
その点は何卒ご容赦願いますm(_ _)m
「デジタルリポジトリオーバーレイによって実現するサブジェクトポータルと付加価値サービス」(北海道大学・行木孝夫先生)
- 日本にはおよそ400の数学論文を載せた大学紀要・雑誌・コンテンツがある
- うち68がDMLに搭載されている
- JAIRO, IRDBを経由すると思いもよらないコンテンツがMathematical Reviewsのデータベースから発見される
- 「数学文献は古くならない」
- ライフサイエンスなどでは積み重ねの中で知見が古くなることがあるが、数学では一度出た成果はずっと使われうる
- 国際数学連盟・・・コミュニティベースの数学系ジャーナル電子化プロジェクトを提唱
「博士論文発信支援パッケージ開発プロジェクト」(東京大学・吉田幸苗さん)
- JAIROで紀要論文と学位論文の割合を調べると・・・
- 紀要約54%、学位論文3%くらい
- 学位論文はまだ入手しづらい文献の一つである
- 学位論文への需要はある。図書館Q&Aでも学位論文を読みたい時の方法が載っている/問合せも来る
- 博士論文の登録を推進するには?
- 東大の経験を伝える
- 博士論文登録ツールの作成・公開
- 博士論文の利用を促進する検索インタフェースの作成
- 東大の経験を伝える:
- 所属大学院生に対し資料の配布・とりまとめを依頼
- 電子化発注時の仕様書の公開
- 博士論文登録ツールの作成・公開
- 代理登録が前提・・・DSpaceは本人登録がしづらい
- 汎用性/半自動でのインストール機能
- 登録者は博士論文のメタデータのことだけ考えれば良い
- 博士論文の利用促進
- 博士論文特有の項目でも検索できるテスト版を作成
- テスト版は作成したが改良の余地あり
- 博士をとった直後は職が不安定
- システムが就活の訳にも発つのではないか
- 博士論文特有の項目でも検索できるテスト版を作成
- 今後の課題:
- Webでの公開
- 別の形での仕様書の作成
「『文献自動収集・登録ワークフローシステムの開発』:平成22年度成果『教員問合せシステム等の開発と著作権処理の標準化』について」(九州大学・吉松直美さん)
- 背景:「登録する教員はセルフアーカイブは面倒と考えている」
「トータル研修による機関リポジトリ普及活動と次世代XooNIps」(慶應義塾大学・五十嵐健一さん)
- XooNIps利用期間を中心としたコミュニティによる機関リポジトリ普及活動
- 構築/運用などのシステム面支援
- 豊富なマニュアルの作成と公開
- 3度のワークショップを開催
- 次世代XooNIpsの開発
- さいごに:
- library module/更新・マニュアル・ツール類
「著者の識別に向けて:オープンアクセス環境下における同定機能導入のための恒久識別子実証実験(金沢大学・守本瞬さん)
- 著者の識別に向けて:
- 同姓同名処理
- 同名異表記処理
- 各大学の業績データベースからNIIの方に情報を取ってくる・・・それとJAIRO等の情報を結びつける
- DSpace 1.6を利用して、金沢大学の機関リポジトリでは・・・
- 金沢以外に広げるには・・・
- DSpace 1.6以上へのバージョンアップの補助
- 登録済みコンテンツに著者識別子と一括登録できるプログラム
「クラウド環境における電子出版・リポジトリ連携実証実験」(名古屋大学・山本哲也さん/連携先は一橋大学)
- ここでは機関リポジトリは登場人物の一つに過ぎない
- クラウドの話:PJS on Amazon EC2
- 商用クラウドサービス、Amazon EC2を利用
- 1年いじっていて運用ノウハウを得る/物理的にサーバを持つのとはかなり違うノウハウが要る
- 電子出版システム:OJS
- 早稲田大学が日本語化したもの
- 実際にやってみる・・・『大学図書館研究』で実現
- EC2の上で動かす/IPアドレスも固定できるのでドメイン名までつけている
- http://www.jcul.jp/ でAmazon EC2+OJSを使っているシステムが動いている
- 商用クラウドサービス、Amazon EC2を利用
- クラウドコンピューティングの特徴
- 自前サーバがいらないので初期投資はいらない/従量課金なので少しずつかかる
- バックアップをどうとる? けっこう悩むかも
- 操作ミスが致命的/仮想コンピュータなのでコンピュータごと消え去るかも?/そうならない操作手順
- スターターキット(計画)
- 『大学図書館研究』の成果をふまえてすぐに導入できるようにパッケージ化する
- カスタマイズ(最小に)
- ドキュメント整備
- 仮想コンピュータの利点を生かす・・・コピーすればすぐ増やせる強みを生かす
「いっしょに "ものさし" 作りませんか?」(千葉大学・森一郎さん)
- ROATプロジェクト:
「全国遺跡資料リポジトリ」(島根大学・矢田貴史さん)
- 発掘調査報告書とは?
- リポジトリシステム:Earmas/VMware上で起動
- 都道府県単位で各大学がサーバを管理する場合と、NIIのクラウドで行う場合がある
- コンテンツの収集から公開・・・各自治体と大学図書館の連携による
- 収集:大学から提供依頼を行う/冊子体発行時に業者に電子データも納品させることを推奨
- 冊子から電子化する場合・・・印刷・保存用には高精細なものが必要/軽量化と同時に研究に利用できる程度の品質がいる
- 登録・公開:大学による代行処理と自治体によるセルフアーカイブ
- いずれの場合も奈良文化財研究所の抄録データやWebcat Plusの書誌データを活用するなどの省力化を図る
- 大学図書館の職員では対応できないような専門的な書誌の作成が必要な場合も(古いデータ)
- 収集:大学から提供依頼を行う/冊子体発行時に業者に電子データも納品させることを推奨
- 検索・利用システム・・・報告書検索/マップ表示/横断検索
- 平成22年度の事業成果:
- 対象地域の拡大
- 平成20年度:5大学⇒平成22年度は20の府・県域にまで拡大
- 対象地域の拡大
- 今後の展望・課題
質疑応答
- Q. 東大へ。予稿集p.68で博士論文の利用促進について触れているが、博士論文特有の項目での検索は便利と思うのだが、改良の必要とは? テスト版は完成したが改良がいるとしているが、具体的には?
- A. 一つはまだ簡便なインストールができない。手間がかかる。あとは、これは今すぐ改良するかは考えているところだが、東大は博士論文のメタデータはdescriptionのところにべた書きでいれている。それをフィールドとして、個々の報告番号や学位の種類のフィールドを設けて、検索インタフェースではそれらのフィールドを指定して探せるようにしたいと考えている。
- Q. コーディネータ・山地さんから。Open Repositories 2011でイギリスからの参加者も、博士論文登録のために独自のwebインタフェースを作り、それに加えてSWORDを使ってリポジトリに入れる、さらにWebアプリケーションではシボレス認証で著者を特定する、というような話もあった。領域2ならもっと挑戦してもらってもいいと思うが、興味はない?
- A. 興味がなくはないがお金次第。NIIさんのご指示と皆さんのご意見をお待ちしている。
- Q. 遺跡資料リポジトリに。自大学でも発掘調査報告書をたくさん持っているので参加したいと思っている。考古学協会の反応を知りたい。埋蔵文化財センターは自治体と近いものの別に活動している。そこが動いてくれないと広がらないのでは?
- A. 考古学会や埋文センターとの関係については、はじめは図書館の一人歩きであったが、最近は学会誌の中で取り上げられたり、電子化して流通させることが脚光を浴びた。オープンカンファレンスによって一般の認知度もあがっているが、持続可能なものにするには図書館だけではなく研究者や学会との連携が重要になる。今後も連携は密にしていきたい。
- Q. 細かい話になるが、遺跡資料報告書抄録について。抄録を見ても役に立たない、という本音がある。その改変やグレードアップは検討している?
- コーディネータ:役にたたないとは具体的には?
- Q. 項目が少なすぎる。これで検索をしても実用性がない。
- A. 抄録の付与が推奨されたのは1994年以来。それ以前は抄録がないし、それ以降も表記のゆれがあったり、分かち書きなどの問題に苦慮している。過去分の遡及入力も含めて大学図書館では対処できないこともあり、自治体によるセルフアーカイブを推奨すればいくらかはデータベースとして使えるのではないかと思う。抄録のバージョンアップは提言などはしたいがプロジェクトの埒外ではある。
- コーディネータ:図書館発のデータリポジトリは希少なので頑張ってほしい。考古学文書の海外流出の話は逆に言えば海外にもニーズがある。電子化して流通すれば日本の考古学を研究している人にとってもusefulであるということ。ぜひしていって欲しい。
- Q. ROATについて。ぜひ大学ランキングみたいなところの数値を標準化して欲しいと願っている。場合によっては文科省の調査も標準的なダウンロード件数の指針を示して、各大学から数値を上げてもらえればいい。そこについてのこれからの活動予定、実現するにはどういうことをお考えですか?
- コーディネータ:ROATについては気になっていて、本年度の差分、新たな成果と、今後の展開についてもっと言及して欲しい。
- A. まず差分についてだが、先程も紹介したセミナー。今年度の目標は国際連携だったのでセミナーを主眼としていた。
- コーディネータ:国際標準とのすり合わせやROATの見方の反映、というのはあったというが、具体的にどんなことがあった?
- A. 運用面で難しいところもあるが、ROATではクローラの判別システムを不完全ながら持っている。それはドイツから素晴らしいのでリスト共有の要望は貰っている。フランスはまだアクセス統計を統一的な基準でとるところまでいっていない、というのが担当者の意見。まずはすり合わせからしたい、ということだった。その他にはROATの紹介をして、利用機関・・・なかなか伸びないのだが、平成22年度には4機関ほど増えたはず。
- A. 難しい方の質問への回答。報告中でも申し上げたが一大学が基準を決める・・・特定の大学が決めることではない。そのためには色んな大学のご意見をもらわないといけないのだが、どうも今はROATは千葉大学のイメージが強すぎる。そこを脱却しないといけないのかと思う。他力本願のようで申し訳ないがNIIの支援をいただいて、協力しながら方向を示せればいいかと思う。昨年度末に会議の場を設けて話をさせていただいているところ。
- コーディネータ:各大学でやるとなると、新しい工数が増えるのでなにがいいのかわからない。しかしたくさんの大学が参加しないと効果が出ないので鶏・卵になる。そこでトップダウンがいる、ということ? NIIとの話ではどういった結論がでた?
- NII・森いづみさん:運用的に千葉大学が代表機関としてやっているROATを使ってもらうアプローチだと、今のところ50機関が実際に参加して試しにやってみている。機関リポジトリは200以上あるので、あとの機関にも使っていただくには「千葉大学のROATです」では、大学のログを他大学のサーバに載せるのに抵抗がある。そこでNIIのサーバなら抵抗が少ないのでは、ということで載せ替えることを考えている。
- コーディネータ:50機関というのは継続的に使ってくれそうな機関の数?
- A. 日常的に使っているところは10あるかないか。
- コーディネータ:自分のところで数を使うためにやっている? それともそこで標準化された数をどこか別の報告書で使っている?
- A. 各大学がなにをもってアクセスとするかの問題。要はクローラも含めて利用だと言うのなら、日本全体がそうであればROATで頑張っても仕方がない。コンスタントに使っている大学についてはROATの基準は完璧ではないにしても的を射たものと判断して使っているのだろう。
- NII・森さん:標準が必要という機運を大学の方から高めてもらうことも必要だし、実態調査を出すときには何かしらの標準が必要である、と言ってもらえるように「こういうものがあります」というのを示すことがいるかと思う。
- Q. 今の話の続き。クローラは何%くらい、というのはパターンで示せる?
- Q. 今の続き。ROATに一点。ROATに参加してもクローラチェックは目視で各機関でやらないといけないのではないか?
- A. 正確にやろうとすれば目視が必要になるだろうが、大まかな数であればだいたいはわかる。AWstatsを使っていて、「何件」というのは出てくる。
- 佐藤先生のお話では機関ごとに個別のクローラがいる、とのお話だったが?
- 日々、クローラは増えているので「かなり」がどこまでかは答えにくい。なかなか難しい問題ではある。メンテナンスは手作業でやらざるをえないのでなかなか進まない。
- Q. 金沢大学に。著者IDの同定について、国内の話は出ていたが国際対応はどう考えられている?
- A. 今現在はまだ国内をメインに置いている。入力した著者識別子をOAIsterに持って行ってもらう、というようなことは目下は考えていない。著者識別子については欧米でもどういう体系で作るかという話も出ているので、そちらに日本もコミットして連携をとるか、同じ体系をとるか考えたい。ただ、特定の体系のIDしか受け付けないようにはしたくない。何かしら同定できるデータさえあれば何かしら著者を同定できるようにはしたい。著者も番号を持っている人と持っていない人が一つの大学の中に混ざり合っている。そこをうまく解決する方向で、国際化も視野に入れたい。
- NII・武田先生:国際化に関連してORCIDについて補足。ORCIDはもともとはElsevierやNPGのような大手学術出版者が、それぞれ管理する著者IDを世界統一したいということで、大学も混じえてオープンに使えるIDを提供しようという動き。一昨年の終わり頃から始まって去年から具体的な組織が作られている。最新の予定では来年の夏には最初のサービス受付を始めることを考えている。なにをするか、煎じ詰めれば世界中の科学論文の著者にユニークなIDをつけること。DOIよりももっと時間はかかるだろうから長い目でみなければいけないが、そういう世界がいずれ来る。その中で今の論文をどうするか、過去の論文をどうするかはリポジトリ等で考えること。世界的にはそういうことで、その中で日本は科研費のIDがある。世界的には国レベルでこういうふうに研究者が把握されているところは少ない。日本は上手くいっているほうなので、連携すれば日本の論文のビジビリティが上がる。先んじてできるのではないか、ということで期待しているし、日本中のリポジトリで論文にIDをつけて出すことをやっていって欲しい。ちなみに私がこういう話をするのは私がORCIDのNPOの理事でもあるから、ORCIDはかなり有力な動きでもある。
- Q. 研究者リゾルバが金沢大学のプロジェクトの連携としても走っているのでそれについて。ORCIDや国際連携、それとローカルな話がどう絡むか考えると、Open Repositoriesカンファレンスの中でDSpaceの開発者ミーティングに出たときにも著者IDについての話が出ていた。そこでもORCIDの発表が当然あった。グローバルな世界の中でもリポジトリーには著者IDがつけられるだろう。一方で我々のリポジトリでは著者に独自に様々な番号を付けている。さらにIDの運用という意味ではそれぞれの機関を超えて著者名寄せをするには、どの番号とどの番号が同じ著者のものか、ローカルを超えて名寄せしないといけない。そこで研究者リゾルバがIDマッピングテーブルの代表として必要なのだろうと考えている。その中でORCIDというのはある著者のIDがORCIDの番号としてはどういうものか、をひもづけられれば国内外のマッピングができる。つまり研究者リゾルバが国内の番号と海外のORCID番号の対応表ができるようになればいい。そのためには機械学習や研究者同定をしなければいけない。
- Q. 東京大学に。ご説明いただいた流れによれば、登録された論文と審査の対象になった論文の一致はどの程度、考えられている? 違っても構わない?
- A. 違っている可能性というのは・・・正直あまり考えていなかった。おっしゃっているのは、最終的な博士論文を提出する人もいるだろうが、途中のものを出す人間がいるということ?
- 他に後で気づいて修正を施したファイルを提出することもあり得るのでは?
- おっしゃるように実際に一週間ぐらい置いて直したファイルを登録しなおしたい、という問合せもある。その時は「登録したいものを」というのが我々のスタンス。本人が不満足なものを登録しっぱなしにする必要性はないと考えている。
- 本学でも昨年度から登録を大学の方針にし、オプトアウトでルール化している。その場合、大学のリポジトリに登録するときに学位授与の根拠となったものと違うものを登録するのはまずいだろう、という話になった。図書館員はセルフアーカイビングだから提出されたファイルを登録しようと考えていたが、大学の方針では国会に出す物・大学に保管するものと一致しなければいけない、となった。馬鹿げているかも知れないが保管用の冊子をばらして電子化して登録している。
- Q. NIIに。学位論文も遺跡発掘資料も従来は紙の資料として図書館に来ていたもの。NACSIS-catに登録するにも「こんなものでいいのか」と疑問を持ちつつ登録してきた。一方で著者名典拠については紙の時代にやってきたわけだが、そこにこの中で触れられないというのは紙との間の議論はない、とのこと?
- NII・大向先生:あとで話したい。公式見解は武田先生から。
- NII・武田先生:いい質問。一方でNACSIS-catをやり、CiNiiをやり、リポジトリをやりと色々やっている。catは紙ベース、CiNiiは中間、リポジトリは全くの電子。3つの世界で色々やっていて、我々としてはそれを全部まとめたいと真剣に思っている。その中の一つの鍵が著者、人であることも強く認識している。そこで研究者リゾルバなど、色々作って、名前でどうやってつなぐか・・・という努力をしている。NACSISの著者名典拠や、CiNiiではCiNiiの著者名寄せもしている。CiNiiの名寄せには元のソースは科研費報告書から出た名前を使っている。注意深く見てもらえると名寄せしたIDの中で科研費に名寄せできているものがある。著者はいいとっかかりで、そこから全部つなぐことは順次進めている。
感想は最後にまとめて!