かたつむりは電子図書館の夢をみるか(はてなブログ版)

かつてはてなダイアリーで更新していた「かたつむりは電子図書館の夢をみるか」ブログの、はてなブログ以降版だよ

RIMS研究集会「数学におけるデジタルライブラリー構築へ向けて」・ 1日目

京都3日連続イベント2日目はRIMS研究集会、兼2009年第3回SPARC Japanセミナー1日目です(ややこしい)。

今回は自分も話したわけですが・・・あがった・・・(大汗)
数回声が裏返った時は天地も引っくり返ればいいのにと思いました。
かえってNIIとかの大ホールの方が参加者の反応があんまり見えないから気軽かも・・・空気が! 空気が痛い!


では以下、前日同様のメモです。
いつものように聞き取れた/理解できた/書きとれた範囲のメモなのでその点ご了承願います。



「東京日光シンポジウム(1955)講演音声テープのデジタル化とその活用方法」(麻生和彦さん、東京大学数理学研究科)

  • 自己紹介
    • 京産大理学部物理学科で量子力学をしていた
    • 京大理学部で技術職員
    • その後・・・東大助手⇒助教(至る現在)
      • ネットワーク管理
      • 数理ビデオアーカイブ
      • eラーニング(教育工学)
  • 音声テープデジタル化の事例紹介(東大数理の場合)
    • テープが発見された!
      • 2008年の夏・東大数理図書室でオープンリールテープを発見
      • 共同で調査開始・・・ラベルを見てもどういった講演かわからない
        • 数学史の先生に協力してもらった
      • オープンリールとカセットあわせて298本
      • 東京日光シンポジウム(1955)の講演記録が含まれている
      • 他にも大きな国際会議が3つ含まれている
    • 何から始めたか・・・まず整理する
      • ナンバリング/写真入りの目録作成
      • 箱の中には既に図書カードがついていた!
        • 別のところにもラベルが・・・整合性が取れてない(タイトルが違う/ナンバリングが時系列に沿ってない)
      • テープの状態は良好⇔テープがくっついてしまっているものはいくつかあったが処理
        • 豆知識:オープンリールテープを袋に入れておくのは保存に良くない
    • デジタル化
      • オープンリールのデッキはもう売ってない!
      • 秋葉原でジャンクは見つけたが怖いのであきらめた・・・「外注しよう」
    • 外注にはお金がかかる
      • だいたいn万円(数字は「忘れてください」とのことなので忘れました)
      • グローバルCOE「数学新展開の研究教育拠点」の支援で予算確保
    • 業者の選定・・・ピンからキリまで
      • どこに頼んでもややこしい処理は日本で1〜2社に回される。デジタル化は安く済むが修復できる人が少ない/高い。
      • デジタル化は1本3,000円くらい。修復は1本10,000円くらい。
    • 仕様の作成
      • 音楽CDとしての形式/WAV音声ファイルの2種類で納品
      • 業者もWAVからCDに焼いているので交渉次第で2つ作っても安く済む
    • 納品されたファイルの編集
      • テープにまたがった講演の結合が思いのほか難しい(できない)
      • 誰が何をしゃべっているのかわからない。同じようなテーマの話をされているので内容をくっつけるのが難しい
      • テープがのびていて音声のピッチが変わっている。同じ人でも声が変わる
      • テープラベルの箱書きも本当かうそかわからない・・・くっつけるのは手間
      • 音声の裏写り(磁性体なのでくっついてると別のテープからノイズが入っちゃう)
    • 資料収集
      • Googleだとすぐにはひっかからない
        • みんな好き勝手なタイトルで入れる
        • 参加者の著書でも好き勝手なタイトルが書かれている
      • プログラムも手に入らない
      • なんとか報告集を入手。「Proceedingsがあるらしい」
        • 探しても見つからない・・・数学会の年会でテープの話をしたら「僕持ってるよ」と言う人がいた
        • 年会では写真を持っているという人も
  • デジタル化の流れ
    • 京大数理研で発見したテープもデジタル化。機械的にデジタル化までは出来るように
    • 公開作業までのながれ・・・
      • 自前VS外注
      • 自前でも普通にはできるが、百年をにらむバックアップは大きなところでないときつい
    • 音声テープの保存
      • 今はサーバ室においている
      • デジタル化はしているんだしテープはもう再生しないものとしてもいいかも?
    • 権利処理
      • 対外的にはない
      • 講演者の許諾申請
      • 収録組織はどこ?(テープはあるが誰がとったのかまったく記録がない)
      • 許諾条件の管理(個人では無理、組織として管理しないといけない)
      • クレジット(どうやってかける?)
    • デジタル化作業の特徴・・・短期的、責任はなし
    • 公開作業・・・長期的、責任あり、組織じゃないとだめ
    • 個人で出来ることは誰でも出来ることが多い
    • 組織でやるべきことは・・・全体のマネージメントはテープを持っている所属(研究科)くらいしかできない?
  • まとめ
    • 発見から公開までの作業は分類した。デジタル化まではサクッといける
    • デジタル化までと公開までの話は別物として分けないといけない
    • デジタル化は誰かががんばればできる。音声テープは有限なので(今後増えはしないので)、誰かがやってしまえばいける
    • 問題は公開作業・・・これも学内の組織を寄せ集めればなんとかなる
    • 権利処理は制度的にも技術的にもまだ決まっていない
    • デジタル化作業全体をマネージメントする新たな組織が必要?
      • ネットワーク管理も当初は学生ボランティアだったのがきちんとした組織が必要になった
      • これからビデオとか本以外のコンテンツが出てくる・・・それをデジタル化する組織が必要では?(特に権利関係)
    • 人材の確保には、より強い理由が必要
      • 数学史での利用
      • 教育での利用:他メディアとの融合/アニメーションの利用(T2Vとか。だいぶ前にC-Japanシンポジウムでも紹介されていたな)
  • 今後の課題
    • 数学に関するあらゆる資料の電子化
      • 数学模型
      • 写真
      • 人:ここが一番大事・・・一流の数学者が話すことは面白い。大爆笑。それをちゃんと残すのは大事
        • 研究者だけじゃなくて秘書の人も。いろいろな面白い話を知っている人の話のデジタル化も進めないといけない
  • 質疑
    • 模型のデジタル化って?
      • 3Dで見せるとか、石膏を金属にするとか
    • 京大・古賀先生:総研大が数年前から学問分野のデジタル化とかオーラルヒストリーとかもやっている。そういう総研大の実践から得られることもあるかも
    • ミズノ(?)先生:(いろいろ情報提供)。学会レベルでの取り組みの例もある

「図書館の電子ジャーナル化事業:KURENAIの数学文献を中心に」(西村暁子さん、京都大学附属図書館情報管理課)

  • 機関リポジトリとは?
    • うちのブログの読者の方なら知っているであろうということで基礎的なところは省略! ググるといろいろ出てくるよ!
    • Googleから探せる、と言うのが大切な意味合い
    • 情報の発信・管理に目が行きがちだが保存の機能も重要
    • 2005年当時、日本の大学で機関リポジトリがあったのは3大学・・・今や122機関に!(IRDBコンテンツシステム準拠)
  • 京都大学学術情報リポジトリKURENAIの紹介
    • 京都大学内で生産された電子的な知的生産物を永続的に蓄積し、誰もが無料で読めるようにweb上で公開するもの
    • 漢字のロゴマークを作っているのは京大のKURENAI(「紅」)の特徴。なかなかよいよね?
    • 実際にKURENAI(Kyoto University Research Information Repository: ホーム)の画面を見ながら説明
    • KURENAIの役割
      • 中期目標・中期計画・・・研究成果の社会への還元と説明責任
      • 卓越した知的成果の蓄積・発信
    • 2009年6月現在のデータとアクセス数
      • 本文件数は3月に30,000件、7月に40,000件を達成
      • コンテンツの大半(71%)は紀要論文
    • 2008年によく読まれたもの・・・1位はMANGA Kyoto University、2位はヒトiPS、3位は医療短期大学部の紀要論文、4位は博士論文、5位は小林・益川先生のノーベル賞受賞論文、以下紀要とか学位論文とか前総長の著書とか
  • 電子ジャーナル化事業について
    • 京都大学発行電子ジャーナルの紹介
      • 紀要ページのリンクをクリックするとメタデータのページに飛ぶ
      • リポジトリを使うというより電子ジャーナルを使うよう?
    • 紀要の流通は限られる・・・大学・研究機関・ごく一部の公共図書館への寄贈のみ
      • 個人での入手は困難(金を出せば買えるものではない)
      • 電子化すると必要な人に届く機会が増えるのでは?
      • 予想もつかなかったような利用(ブログからのリンク/質問応答サイトでの利用/Wikipediaからのリンク)
    • KURENAIが電子化をサポートします!
      • 紙からの電子化やサーチエンジンから検索しやすくもします!
      • 著作権処理・サーバ管理・データ保管等もします!
    • 電子化紀要の発行元からの声・・・
      • 少人数でやっているので電子化は難しいかと思っていたが、図書館のサポートで出来ましたという喜びの声
  • 今後の展開
    • 編集段階のサポート:Open Journal Systemsを用いて応用哲学会の紀要の電子化をサポート中
  • お知らせ:数理研講究録のデータを8/3に追加しました!
  • 質疑
    • DspaceとE-printsを紹介されていたが、京大はDspaceを使っていると思う。決め手は?
      • シェアと使い勝手。シェア的には国内では普及している
    • OJSはE-prints系だよね?
      • PKPなのでまた別。
    • 電子ジャーナルとリポジトリとの違いは?
      • 電子ジャーナルと言うと出版社が雑誌ごと・・・リポジトリの方は論文単位で登録して行く感じでばらけている。(見せ方を)雑誌単位でまとめている。
    • 見せ方が違うだけで技術的にはリポジトリ
      • そのとおり。
    • 機関リポジトリの各articleのURLは今後ずっと変わらないですむことを保証する?
      • 保証するための仕組みがある。handle識別子が一つのデータについて一つ、固定させて変えないサービスがある。こちらを引用などには使って貰えれば、永続的に保証する
    • 各articleにDOIはつけないの?
      • 不勉強なのでそこまでは把握できていないが触れたらいいなとは思っている。
    • 北大・杉田さん:handleはDOIと同じ仕組み。海外のCNRIというところがhandleシステムを作ってその上のアプリがDOIなので、現在すでにDOIがあるのと同じ効果はあるんだけど、北大のリポジトリについても雑誌とその論文としてDB上で識別してもらうにはhandleとは別にDOIをつけたいとは思っている。現在、国内の代理店の話を進められないか試みている。うまくいけば来年・再来年にはDOIを持ちたいと担当としては思っている。

「機関リポジトリアクセスログ解析:分野別傾向」(佐藤翔、ブロガー(タグで消す)筑波大学図書館情報メディア研究科)

  • さすがに発表しながらメモは取れないから先回りしてすりかえておいたのさ書いておいたよ!
  • ZSプロジェクトについて
  • アクセスログ解析とは?
    • 機関リポジトリに限らずwebサイトを使うとサーバにアクセスログが残る
      • それを細かく見て分析していく
      • メリット:質問紙調査等と違っていちいち集める必要もない、人の意志も介在しない、全記録が残るのでサンプリングも要らない
      • デメリット:個人を特定できない(特定出来るのはPCだけ)、プログラムを介したアクセス等のノイズを除去する必要がある
      • COUNTERにのっとったモデルでフィルタリングを行っている(詳しくはリンク先参照:http://current.ndl.go.jp/ca1666:tile
  • 4つの機関リポジトリのログ分析
    • 京大、北大、筑波大、アジア経済研究所のリポジトリアクセスログを分析してみた
    • リポジトリを丸ごと見ると・・・利用の大半はneドメイン、みんなGoogleからきている、多くは日本国内からのアクセス
    • 論文単位で見ると・・・平均ダウンロード数は英語>日本語、英語は海外ドメイン、日本語は国内ドメインから利用される
    • 日本語はGoogle以外からもアクセスがある、英語はGoogle一辺倒
      • 英語論文はGoogle以外にアクセス経路がない?
  • まとめ
    • リポジトリ掲載でアクセスの垣根が下がっている?
      • 研究者じゃなくても読める/自宅からでも読める
    • 英文誌が国際的に再発見される
    • なんで数理研講究録はサーチエンジンから使われない?
      • ここがわからないので意見が欲しい
  • 質疑(ここはあとから/記憶が頼りなので誰か会場でメモを取られていた方がいたらフォロー願います!)
    • 理研講究録の使われ方について、数学系の方々からご意見
    • NIMS・高久さん:多様なソースがあるのでリポジトリ以外のところにGoogleだと行っていることもあるのでは?



イベント終了後、さらに参加されていた(かつ質疑にご参加下さった)数学者の皆さんから色々とご意見もいただけました。
理研講究録は他と違って新しい論文に利用が集中している・・・という話を途中でしたんですが、その理由としては数理研講究録は最終成果物というよりそこに出したものをさらにどこかでまとめて発表するもの(Working paper的なもの)なので、古くなると別のところで発表されているからそっちを読むのではないかとか。
お話をうかがう限り、やはり今の数理研講究録のメインユーザは国内・数学系の研究者(もしくは学生)という感じがします(伝統的な/大学等が購読ベースで使う電子資料に近い利用動向になっている感じがします)。
所属ドメインもさらっと流しましたがacドメインからのアクセスが規模に対して多いですし。
あとは講究録の中でもアクセス上位文献の分野は偏っているとの話があったので、そのあたりメタデータと照らしわせても面白いかもですね・・・


自分の発表はそのくらいにして、全体の感想は2日目のご講演もお聞きしてからあらためてまとめたいと思います。
・・・2日目は英語発表3件ありますが、メモははたして取れるのか・・・?!




2009-09-10追記

当日、会場にいらしていたid:kany1120さんから自分の発表の質疑のメモをご提供いただきました!
kany1120さん、本当にありがとうございますm(_ _)m
以下、いただいた質疑のメモ(ご本人の許可をいただいた上で転載)です。

質疑応答(「講究録」はなぜサーチエンジン経由ではなく、直接リポジトリに来て検索される

ことが多いのか?)

くなっているところも多い。

  • 数学は一般的な用語を使うことが多いから、その影響では?(麻生さん)
  • GoogleとGoogleScholarは分けて考えた方がよい。研究者が文献を探すときはGoogleScholarを

使う。

  • 数学会?ジャーナルの電子化に携わったタサワさん。「講究録」には広い分野のものが掲載さ

れているからでは?

  • 数学の日本語論文を探すのは、「講究録」or「数学」(岩波)に限られている
  • 「講究録」の論文を見るのは、誰かから「「講究録」に載ってたよ」と聞いて見ることがほと

んどな気がする。