RIMS研究集会「数学におけるデジタルライブラリー構築へ向けて」・ 1日目
京都3日連続イベント2日目はRIMS研究集会、兼2009年第3回SPARC Japanセミナー1日目です(ややこしい)。
今回は自分も話したわけですが・・・あがった・・・(大汗)
数回声が裏返った時は天地も引っくり返ればいいのにと思いました。
かえってNIIとかの大ホールの方が参加者の反応があんまり見えないから気軽かも・・・空気が! 空気が痛い!
では以下、前日同様のメモです。
いつものように聞き取れた/理解できた/書きとれた範囲のメモなのでその点ご了承願います。
「東京日光シンポジウム(1955)講演音声テープのデジタル化とその活用方法」(麻生和彦さん、東京大学数理学研究科)
- 音声テープデジタル化の事例紹介(東大数理の場合)
- テープが発見された!
- 2008年の夏・東大数理図書室でオープンリールテープを発見
- 共同で調査開始・・・ラベルを見てもどういった講演かわからない
- 数学史の先生に協力してもらった
- オープンリールとカセットあわせて298本
- 東京日光シンポジウム(1955)の講演記録が含まれている
- 今回報告するテープ
- 「代数的整数論に関する国際会議」・・・日本が強い分野
- 国際数学連合と日本学術会議の共催
- 日本で開催された最初の数学についての国際会議
- 会議中に発表された「谷山・志村予想」がフェルマーの最終定理の証明に寄与
- 他にも大きな国際会議が3つ含まれている
- テープが発見された!
-
- 何から始めたか・・・まず整理する
- ナンバリング/写真入りの目録作成
- 箱の中には既に図書カードがついていた!
- 別のところにもラベルが・・・整合性が取れてない(タイトルが違う/ナンバリングが時系列に沿ってない)
- テープの状態は良好⇔テープがくっついてしまっているものはいくつかあったが処理
- 豆知識:オープンリールテープを袋に入れておくのは保存に良くない
- 何から始めたか・・・まず整理する
-
- デジタル化
- オープンリールのデッキはもう売ってない!
- 秋葉原でジャンクは見つけたが怖いのであきらめた・・・「外注しよう」
- 外注にはお金がかかる
- だいたいn万円(数字は「忘れてください」とのことなので忘れました)
- グローバルCOE「数学新展開の研究教育拠点」の支援で予算確保
- 業者の選定・・・ピンからキリまで
- どこに頼んでもややこしい処理は日本で1〜2社に回される。デジタル化は安く済むが修復できる人が少ない/高い。
- デジタル化は1本3,000円くらい。修復は1本10,000円くらい。
- 仕様の作成
- 音楽CDとしての形式/WAV音声ファイルの2種類で納品
- 業者もWAVからCDに焼いているので交渉次第で2つ作っても安く済む
- デジタル化
-
- 納品されたファイルの編集
- テープにまたがった講演の結合が思いのほか難しい(できない)
- 誰が何をしゃべっているのかわからない。同じようなテーマの話をされているので内容をくっつけるのが難しい
- テープがのびていて音声のピッチが変わっている。同じ人でも声が変わる
- テープラベルの箱書きも本当かうそかわからない・・・くっつけるのは手間
- 音声の裏写り(磁性体なのでくっついてると別のテープからノイズが入っちゃう)
- 納品されたファイルの編集
-
- 資料収集
- Googleだとすぐにはひっかからない
- みんな好き勝手なタイトルで入れる
- 参加者の著書でも好き勝手なタイトルが書かれている
- プログラムも手に入らない
- なんとか報告集を入手。「Proceedingsがあるらしい」
- 探しても見つからない・・・数学会の年会でテープの話をしたら「僕持ってるよ」と言う人がいた
- 年会では写真を持っているという人も
- Googleだとすぐにはひっかからない
- 資料収集
- デジタル化の流れ
- 京大数理研で発見したテープもデジタル化。機械的にデジタル化までは出来るように
- 公開作業までのながれ・・・
- 自前VS外注
- 自前でも普通にはできるが、百年をにらむバックアップは大きなところでないときつい
- 音声テープの保存
- 今はサーバ室においている
- デジタル化はしているんだしテープはもう再生しないものとしてもいいかも?
- 権利処理
- 対外的にはない
- 講演者の許諾申請
- 収録組織はどこ?(テープはあるが誰がとったのかまったく記録がない)
- 許諾条件の管理(個人では無理、組織として管理しないといけない)
- クレジット(どうやってかける?)
- デジタル化作業の特徴・・・短期的、責任はなし
- 公開作業・・・長期的、責任あり、組織じゃないとだめ
-
- 個人で出来ることは誰でも出来ることが多い
- 組織でやるべきことは・・・全体のマネージメントはテープを持っている所属(研究科)くらいしかできない?
- まとめ
- 発見から公開までの作業は分類した。デジタル化まではサクッといける
- デジタル化までと公開までの話は別物として分けないといけない
- デジタル化は誰かががんばればできる。音声テープは有限なので(今後増えはしないので)、誰かがやってしまえばいける
- 問題は公開作業・・・これも学内の組織を寄せ集めればなんとかなる
- 権利処理は制度的にも技術的にもまだ決まっていない
- デジタル化作業全体をマネージメントする新たな組織が必要?
- ネットワーク管理も当初は学生ボランティアだったのがきちんとした組織が必要になった
- これからビデオとか本以外のコンテンツが出てくる・・・それをデジタル化する組織が必要では?(特に権利関係)
- 人材の確保には、より強い理由が必要
- 数学史での利用
- 教育での利用:他メディアとの融合/アニメーションの利用(T2Vとか。だいぶ前にC-Japanシンポジウムでも紹介されていたな)
- 今後の課題
- 数学に関するあらゆる資料の電子化
- 数学模型
- 写真
- 人:ここが一番大事・・・一流の数学者が話すことは面白い。大爆笑。それをちゃんと残すのは大事
- 研究者だけじゃなくて秘書の人も。いろいろな面白い話を知っている人の話のデジタル化も進めないといけない
- 数学に関するあらゆる資料の電子化
「図書館の電子ジャーナル化事業:KURENAIの数学文献を中心に」(西村暁子さん、京都大学附属図書館情報管理課)
- 機関リポジトリとは?
- 京都大学学術情報リポジトリKURENAIの紹介
- 京都大学内で生産された電子的な知的生産物を永続的に蓄積し、誰もが無料で読めるようにweb上で公開するもの
- 漢字のロゴマークを作っているのは京大のKURENAI(「紅」)の特徴。なかなかよいよね?
- 実際にKURENAI(Kyoto University Research Information Repository: ホーム)の画面を見ながら説明
- KURENAIの役割
- 中期目標・中期計画・・・研究成果の社会への還元と説明責任
- 卓越した知的成果の蓄積・発信
- 2009年6月現在のデータとアクセス数
- 本文件数は3月に30,000件、7月に40,000件を達成
- コンテンツの大半(71%)は紀要論文
- 2008年によく読まれたもの・・・1位はMANGA Kyoto University、2位はヒトiPS、3位は医療短期大学部の紀要論文、4位は博士論文、5位は小林・益川先生のノーベル賞受賞論文、以下紀要とか学位論文とか前総長の著書とか
- 電子ジャーナル化事業について
- 今後の展開
- 編集段階のサポート:Open Journal Systemsを用いて応用哲学会の紀要の電子化をサポート中
- お知らせ:数理研講究録のデータを8/3に追加しました!
- 質疑
- DspaceとE-printsを紹介されていたが、京大はDspaceを使っていると思う。決め手は?
- シェアと使い勝手。シェア的には国内では普及している
- OJSはE-prints系だよね?
- PKPなのでまた別。
- DspaceとE-printsを紹介されていたが、京大はDspaceを使っていると思う。決め手は?
-
- 機関リポジトリの各articleのURLは今後ずっと変わらないですむことを保証する?
- 保証するための仕組みがある。handle識別子が一つのデータについて一つ、固定させて変えないサービスがある。こちらを引用などには使って貰えれば、永続的に保証する
- 各articleにDOIはつけないの?
- 不勉強なのでそこまでは把握できていないが触れたらいいなとは思っている。
- 北大・杉田さん:handleはDOIと同じ仕組み。海外のCNRIというところがhandleシステムを作ってその上のアプリがDOIなので、現在すでにDOIがあるのと同じ効果はあるんだけど、北大のリポジトリについても雑誌とその論文としてDB上で識別してもらうにはhandleとは別にDOIをつけたいとは思っている。現在、国内の代理店の話を進められないか試みている。うまくいけば来年・再来年にはDOIを持ちたいと担当としては思っている。
- 機関リポジトリの各articleのURLは今後ずっと変わらないですむことを保証する?
「機関リポジトリのアクセスログ解析:分野別傾向」(佐藤翔、ブロガー(タグで消す)筑波大学図書館情報メディア研究科)
- さすがに発表しながらメモは取れないから先回りして
すりかえておいたのさ書いておいたよ!
- ZSプロジェクトについて
- ZSプロジェクトの説明。詳しくはこちらを参照:(つくばリポジトリ)
- アクセスログ解析とは?
- 機関リポジトリに限らずwebサイトを使うとサーバにアクセスログが残る
- それを細かく見て分析していく
- メリット:質問紙調査等と違っていちいち集める必要もない、人の意志も介在しない、全記録が残るのでサンプリングも要らない
- デメリット:個人を特定できない(特定出来るのはPCだけ)、プログラムを介したアクセス等のノイズを除去する必要がある
- COUNTERにのっとったモデルでフィルタリングを行っている(詳しくはリンク先参照:http://current.ndl.go.jp/ca1666:tile)
- 機関リポジトリに限らずwebサイトを使うとサーバにアクセスログが残る
- 4つの機関リポジトリのログ分析
- 「数理解析研究所講究録」とKURENAI収録紀要の分析
- まとめ
- 質疑(ここはあとから/記憶が頼りなので誰か会場でメモを取られていた方がいたらフォロー願います!)
イベント終了後、さらに参加されていた(かつ質疑にご参加下さった)数学者の皆さんから色々とご意見もいただけました。
数理研講究録は他と違って新しい論文に利用が集中している・・・という話を途中でしたんですが、その理由としては数理研講究録は最終成果物というよりそこに出したものをさらにどこかでまとめて発表するもの(Working paper的なもの)なので、古くなると別のところで発表されているからそっちを読むのではないかとか。
お話をうかがう限り、やはり今の数理研講究録のメインユーザは国内・数学系の研究者(もしくは学生)という感じがします(伝統的な/大学等が購読ベースで使う電子資料に近い利用動向になっている感じがします)。
所属ドメインもさらっと流しましたがacドメインからのアクセスが規模に対して多いですし。
あとは講究録の中でもアクセス上位文献の分野は偏っているとの話があったので、そのあたりメタデータと照らしわせても面白いかもですね・・・
自分の発表はそのくらいにして、全体の感想は2日目のご講演もお聞きしてからあらためてまとめたいと思います。
・・・2日目は英語発表3件ありますが、メモははたして取れるのか・・・?!
2009-09-10追記
当日、会場にいらしていたid:kany1120さんから自分の発表の質疑のメモをご提供いただきました!
kany1120さん、本当にありがとうございますm(_ _)m
以下、いただいた質疑のメモ(ご本人の許可をいただいた上で転載)です。
質疑応答(「講究録」はなぜサーチエンジン経由ではなく、直接リポジトリに来て検索される
ことが多いのか?)
- サーチエンジンではなく、MathSciNet、ScienceDirectを使って論文を探すことが多い
- サーチエンジンを使わないことはない。地方国公立大学ではAMSサービス(MathSciNet)を使えな
くなっているところも多い。
- 数学は一般的な用語を使うことが多いから、その影響では?(麻生さん)
- GoogleとGoogleScholarは分けて考えた方がよい。研究者が文献を探すときはGoogleScholarを
使う。
- 数学会?ジャーナルの電子化に携わったタサワさん。「講究録」には広い分野のものが掲載さ
れているからでは?
- 数学の日本語論文を探すのは、「講究録」or「数学」(岩波)に限られている
- 「講究録」の論文を見るのは、誰かから「「講究録」に載ってたよ」と聞いて見ることがほと
んどな気がする。