かたつむりは電子図書館の夢をみるか(はてなブログ版)

かつてはてなダイアリーで更新していた「かたつむりは電子図書館の夢をみるか」ブログの、はてなブログ以降版だよ

「デジタルアーカイブの最前線:現状と未来」(第4回情報資料保存シンポジウム)


情報保存研究会と日本図書館協会の共催イベント、「デジタルアーカイブの最前線:現状と未来」(第4回情報資料保存シンポジウム)に行って来ました!


国立公文書館国会図書館での実践や教育利用等の観点からの提言等、一口に「デジタルアーカイブ」と称されるものについて多様な切り口で考えるきっかけになるシンポジウムでした。


以下、いつものようにmin2-flyによるメモです。
例のごとく、自分が聞きとれた/理解できた/書きとれた範囲の内容となっております。
特に今回、午後は疲労でメモ速度が落ちています・・・(汗)、ご利用の際はその点、ご理解いただきますようお願いします。
誤字脱字、事実誤認などありましたらコメント欄等を通じてご指摘いただければ幸いです。


では、まずは情報保存研究会の紹介から!



情報保存研究会・あいさつ(八木和久会長、情報保存研究会)

  • 情報保存研究会(JHK)・・・日本図書館協会と共催で、毎年シンポジウムを開催している
  • 今年・・・昨今、進展著しいデジタルアーカイブを取り上げる
    • 現状と将来への取組みの紹介
    • 講演者はそれぞれの分野の知識・実績の豊富な人
      • 参考になる話をしていただけるものと思う
  • 今年はJHK設立10周年の年でもある
    • これを記念して、資料保存実演講座を開催
    • 会員企業によるプレゼンテーション。展示コーナーも別にある
  • 公文書館はじめの資料・・・保存だけでなく、活用も望まれる
    • 資料の保存・活用には個々の企業が専用の製品・ツール・システム・ノウハウにより機関に貢献
    • しかしさらに大きく貢献したい・・・そこで企業が集まってJHKを設立
      • JHKではシンポジウムの開催やダイレクトリ発行、webによる情報発信を実施(URL: http://www.e-jhk.com/html/index.html
        • 質問箱コーナーもあるので遠慮なく質問して欲しい
        • 分野のエキスパートが回答するのでお役に立てるものと思う
  • マリナーズイチローは10年連続200本安打達成
    • 10年と9年は1年違いだが重みが違う
    • JHKは10周年。10年を迎えられたのも情報保存機関とその支援のたまもの。御礼申し上げたい
    • JHKでは10年、20年、その先の情報保存を考え、参加企業が皆様方に大きく貢献するための絶え間ない道を歩む所存。引き続きご支援願いたい

特別講演「国立公文書館デジタルアーカイブ」(八日市谷哲生さん、国立公文書館業務課電子情報係)

プロフィール紹介(司会より)
はじめに
  • 国立公文書館・・・国の公文書を預かり、保存し、利用に供する
    • 内閣府所管の独立行政法人
    • 設置から時間は経っているが、諸外国に比べると小規模。去年、公文書管理法が成立したことを受け、新しい仕組み作りを進めている
  • 国立公文書館の所蔵資料は約120万冊
    • 当たり前だが紙資料。紙の資料のためにまず目録を作り、データベースをインターネットで検索できるようにする
    • そこに紙からデジタルに変換したものが貼りついてくる、というのがここでいうデジタルアーカイブの中身
    • デジタルアーカイブの意味は多様だが・・・国立公文書館ではデータベース+紙をデジタル化した画像
デジタルアーカイブ事業の背景
  • そもそもなんでデジタルアーカイブ
    • 書庫にはたくさんの所蔵資料
    • 地方在住だとなかなか利用できない・・・インターネットですぐに探したり見れたりすると使いやすい
  • 1990年代後半・・・インターネット環境が整備される
    • 2000年代から、要請に応える基盤が確立される
      • 国のIT制作、e-Japan戦略にも記述される
      • 公文書管理を検討する懇談会でもデジタルアーカイブ化を進める、という議論
      • 公文書管理法でも言及
国立公文書館デジタルアーカイブの特徴
  • コンセプト:
    • 「いつでも、どこでも、だれでも、自由に、無料で」
      • 所蔵資料は国民のもの
    • 「利用と保存」という観点
      • デジタルデータも利用だけでなく保存も考えて作業する
    • ユビキタス」社会への対応
  • そのコンセプトに合わせた特徴と機能:
    • 目録・画像・なんでもISOに準拠する
      • それによってシステム・サービスの互換性、情報の相互利用を図る
    • 機能面・・・公文書館資料は1点しかない
      • 必ずいつ、どこで、誰が、なんのために作った資料か、という情報を持っている
      • そうした情報を持ちながら使えるように・・・
        • 分類項目から探せる・表示できるなどの工夫
      • 図書館の情報サービスとは若干違うところ?
  • 対象:多岐にわたる
    • それぞれに適したデジタル化を行う
国立公文書館デジタルアーカイブシステムの紹介
  • http://www.digital.archives.go.jp/
  • 利用者の2つの目的:
    • 調査・研究者向け・・・データベース
    • 「とりあえず何があるのか」を知りたい一般の方向け・・・キーワード検索等ではない、GUI
    • それぞれの使いやすさを念頭に置く
  • 目録データについて
    • 資料の構造的な情報を目録データにうまく入れたい・・・EAD-ISAD
      • できるだけ標準的な、情報の構造を格納できる仕組みをシステムに反映する取組み
      • 完全に標準化するのは難しいが、基本的な部分は取り入れて対応する
    • 情報化すると、たくさんの情報が目録データに入る
      • 一般利用のためになる情報/保存者のために必要な情報など、多様な目的の情報
      • それらをうまく整理する、という試み
        • 裏側では職員がメンテナンス等をするシステムも動いている
    • デジタルアーカイブの左側には資料のTree構造を出すようにしている
      • カテゴリを辿ることでの検索も可能
  • 画像データ
    • 目録を探していった、後に出る
    • 従来・・・紙からマイクロフィルムを作っていた
      • まずはマイクロフィルムからデジタル画像を作成する。現在の画像の大半はフィルムから作成
    • デジタル画像には色々な形式があるが、何を使うと利用・保存を両立できる?
      • JPEG2000を選択
      • 国際標準規格であり、利用・保存両方の要求に1つで応えられる
      • 小さいものも大きなものも1つのフォーマットで扱える、などの利点
      • まず保管用データを作る・・・提供用にストレージを移して提供
      • 保管するデータはデータロスしないように可逆、提供用は圧縮
  • 利用者の声
    • 「目録情報は探す手掛かりになるが、官公庁名で探すときに名前がころころ変わっているので探せない」
      • 官公庁の組織変遷をデジタルコンテンツにして、それをたどりながら探せる仕組みを作る、等の試みも
データのやり取り
  • 図書館世界では当たり前だが・・・
    • 各機関のデータを相互に連携して、一方にないものを他方で探すことは容易に
    • 公文書館でも実現したい・・・横断検索はシステム構築時から入れている
    • できるだけ多くの機関と接続していきたいと考えている
  • 他方、公文書館の情報は個々が長い年月をかけて作成して現在に至っている
    • 情報のかたちはそれぞればらばら、一つにするのはなかなか難しい
    • 図書館は出版物なので統一されている。公文書館でそれをしては意味がない
    • 統一する項目は最小限に抑えよう、という取り決めをしている
  • デジタルアーカイブを全国の公文書館に接続したい
    • 必要最小限の目録項目だけでも作ってもらって、各館を接続しよう、という取組み
    • わざわざ国立公文書館に来てもなかった資料が郷土の資料館にある、ということも。少なくとも所在情報は一つの入り口で探せるといい
多彩なデジタルコンテンツ
  • もっと色々な年齢層にも使ってほしい・・・コンテンツ作りの努力
    • 日本史の教科書等を調べて、年表をweb上に作成。そこから関係する公文書画像がすぐに出てくるコンテンツの作成
      • 中高生等もコンテンツを使う機会を増やす目的
  • 他にも・・・
    • 月替わりのテーマ紹介
    • 館で行っている特別展資料のデジタル化
デジタルアーカイブの今後
  • 歴史資料の基盤として地道に作ってきた
    • いろいろな仕組みを付与してできるだけ価値を高めようとしてきた
    • 今後も公文書管理法の「情報の利用の促進」を担う仕組みとして中身の充実を図る
  • ここまでは「従来のデジタルアーカイブ」の話
  • 紙の電子化に四苦八苦するうちに・・・生まれたときから電子である「電子公文書」が出現する時代になった
電子公文書への対応
  • 世の中にはどれくらいの種類の電子情報があるのか? 形式は何パターンある?
    • 多すぎる。1億を超えるとも言われている
  • 保存媒体は?
    • こちらも雑多・大量にある。当面は一般にも使うものくらいしか対応できない?
  • つかみどころがない中で・・・
    • どうやって保存を考えていけばいいのか?
    • 当面は・・・量があり、対応可能で、対応すべきものを絞る必要がある
  • 内閣府による検討・・・平成17・18年度に行われる
    • 電子的な記録については・・・
      • 色々な媒体に変換せず、電子媒体のまま保存しては
      • 完全な記録を維持するのは困難、証拠的な価値の確保に不可欠なエッセンスを保存しては
      • 作るときから保存と利用を考え管理すべきでは
  • 平成19年・・・より具体的な検討
    • 長期保存のためにはメタデータを取得し、元のデータとともに保存することが必要
    • オフィスで使われているような文書は、PDF/Aに変換すると対応可能である
    • 音声・画像・動画については結論は得られていない
  • 平成20年は実証実験、平成21年から具体的なシステムの準備に取り掛かる
    • 来年以降、具体例を話せるようになるかも
  • どういうことを考えてやっていく?
    • 使われているものには一定の形がある・・・それらのフォーマットはPDF/Aに変換して取っておくように
    • 長期的保存の「長期」は、何年あるかわからない「長期」
      • DVDベンダの「長期」は10〜30年くらいと考えていると言うが、歴史資料を保存する公文書館における「長期」は半永久
        • それを裏付けるものは第一は紙、次はマイクロだが、電子はまだ決定的なものがない
        • そこで標準的なもの、変換可能なものにしておけば対応可能だろう、と考えている
  • 歴史資料と行政文書との大きな違い・・・
    • 行政文書は一つの文書の中に多数のドキュメントを含み、それらが複数の電子ファイルを持つ
    • 基本は行政文書ファイル単位でシステムを作っていく
  • 後世の利用のためにメタデータを作成する
    • 現用時の書誌情報
    • 電子記録がどのようなファイルなのか(アプリケーション、OS等)の技術的情報
    • 保存・管理の為のアーカイバメタデータ
    • 全体をコンテナメタデータとしてパッケージング、元の記録とワンセットで保存
    • 重要なのは、その保存・管理法が記録として、誰にでもわかる形であること
      • 担当者がいなくなるとどうやっていたかわからない、となってしまえば情報の喪失につながる
      • 仕組み全体を、何年たってもアクセス・管理できる仕組みを考えている
国立公文書館デジタルアーカイブに入っているコンテンツの紹介
  • 所蔵資料中、デジタル化されているものは1割に満たない
    • 優先順位を付けてデジタル化。国の基本にかかる公文書、重要文化財に指定されている歴史資料をまずは中心にしている
    • 戦後の主な公文書はデジタル化済み
      • 日本国憲法の原本
        • 政策決定過程がわかる資料もあわせてデジタル化
    • 重要文化財
      • 全防空図解:戦時の啓蒙ポスター
      • 戊辰戦争時の官軍の旗のイラスト
      • 天保国絵図:広げるだけで大きな部屋が必要、デジタル化でようやく一般の目にも触れるように
      • 桜町殿行幸図:長さが20m以上だがフルデジタル化で最後まで見られるように
      • 江戸城天守絵図
      • 「見たい」という要望が多数あったもの。デジタル化で提供できるように
さいごに
  • これからもデジタル化を進める中で・・・
    • ボーン・デジタルにも対応
    • 紙⇒デジタル、デジタル⇒デジタルのアーカイブを1つに統合して運用することになる
    • 出口のところでは元の媒体は関係ない。媒体のまま保存する場合も、デジタル提供する出口は1つにまとめて提供されるのではないか
      • バックヤードには紙とマイクロとデジタル、それぞれが特性を持って管理・運用される。うまく折り合いをつけて、長期保存を進めることが重要な仕事

特別講演「デジタル・アーカイブとデジタル・アーキビスト:百年後への伝言」(坂井知志さん、常磐大学コミュニティ振興学部教授)

プロフィール紹介(司会より)
はじめに
  • 自由利用マーク*1を知っている人は・・・?(会場の挙手を募る)
    • 文化庁が推奨しているマーク。他にもCreative Commons等、色々なマークが出ている
    • 今日話すのは、デジタルアーカイブを構築しても、利用のことを考えないと、公的な資金を出すことへの理解は得られないだろう、ということ
    • 利用しやすくするために著作権や個人情報についても考える必要
    • 文化庁のwebで自由利用マークについても是非見て欲しい
    • デジタルアーカイブを構築しても、これらのマークがないといちいち了解を取る必要がある(例外はある)
なぜ、デジタルアーカイブ
  • 坂井さん自身の興味・・・病院、少年院、ホスピス等での移動ミュージアム
    • 学校教育の範囲外になり、著作権制限の対象にならない?
    • 老人ホームでの認知症の進行についての研究で様々な取組みが進行を遅らせることがわかっているが、そこで使う資料をコピーして配ることは著作権権利制限の対象外
    • 「いつでも、どこでも、誰でもが」というが・・・
      • それは省庁の範囲を超える
  • もう1つの背景・・・フィリピンや中国残留孤児へのインタビュー
    • そのデータについて、著作権、発話者の勘違い、公開できないような発言の処理を悩ましく考えている
    • 将来に提供するには、技術と制度の両方の問題を追い掛ける必要がある
    • フィリピンのミンダナオ島で邦人自決の慰霊碑を、iPhoneで撮影したが・・・
      • 最大で2km、地理情報に誤差。GPS等も正確性は難がある。慰霊碑がいつか壊れたら、どこにあったかわからなくなる?
  • デジタルアーカイブを必要と考えた個人的理由・・・大学時代に感じた不安
    • 東洋史の授業:「現代史は歴史ではない」と話す教員
      • 歴史の3兄弟の逸話・・・皇帝の悪行について、長男が正確に書いて殺される/次男も正確に書いて殺される/三男も同じように書いたので、皇帝は諦めた
      • 「現代史は歴史ではないと言っているが、今の逸話は中国では現代のことを歴史として書いていた、ということでは?」と質問したら、教員が解答に詰った
      • 中国では現在のことを歴史として記録する仕組みがあるのに対し、日本にはないのではないか、との不安をここで覚える。そこに興味
  • もう1つ:客観的状況
    • 常磐大学ミュージアム専門の学部と大学院を持つ
      • MLA連携についての議論。デジタル情報では、図書館・博物館・公文書館の境目の意味がなくなると考えられる
      • 欧米では議論されている
      • 日本では、博物館も図書館もそれなりに数はある。一方で、公文書館は県ですらないところもあるし、市町村では持っている方が稀。欧米と同じ土俵で議論できる状況にない。日本はMLA連携に参加しにくい状況
      • 記録のないところから現在の政策を考えることのむなしさ。政策・地域の意志決定の「積み重ね」が利用しにくい、全くないところもある
        • 地方分権なんか本当にできるのか? お金と法律だけで地方分権ができるわけではない
        • 問題の背景:「記録」への認識不足。このシンポジウムに来ないような人にどう普及していくのか?
日本はそもそも記録に興味がないのか?
  • 沖縄・那覇市・久米では何百年の歴史が記録されている。沖縄戦もくぐりぬけている
  • 宮本常一の問題提起・・・
    • 寄り合いの記録を丹念に見ていく。『忘れられた日本人』という単行本にまとまっている

忘れられた日本人 (岩波文庫)

忘れられた日本人 (岩波文庫)

    • 業種別・地域別に丹念に記録を取っているところもある。自分たちの地域の記録がなかったわけではない
  • フィリピンではバランガイ、という自治体のようなものが行政の最小端末としてものごとを進めている
    • 寄り合い・バランガイから学ぶべきところがあるのでは?
  • 公文書館の数が足りない日本で、どのように地域の記録を残していく?
    • 公民館。日本に16,000ある。中学校区に1館(ただし東京23区は練馬以外にはない)
    • 役所だけではなく、地域の映像や祭り等を地域の方が残すところを公民館ができないか?
    • まちづくりを一生懸命している人がやりっぱなしで記録しないのではなく、記録の仕方を学び、公民館に残せば、分散型・ネットワーク型のMLA連携のカギになり、地方分権にもなる?
デジタル・アーキビスト
  • 岐阜女子大の現代GP*23年間の研究で出来た資格
  • 養成課程での話・・・
    • 学校教員、図書館員、学芸員、会社員(時には社員全員も)等の受講者に話すこと
    • 学校のwebサイト・・・
      • 昔は卒業アルバムが載っていたり、名札や顔のついた写真をアップしたりされていた。リスクを考えていない?
      • しかしそれらは現在、どんどん消えている。顔は写さず手元だけ写す、など
      • リスクを考えると正しいが、記録自体がそうなってしまうと、21世紀の日本の記録には子供の活動の写真が映像として残らない
        • 背中や手元しかなくていいのか? 良くない。
        • 記録は記録として、色々な角度から質を考えて取っておくことを考えよう
        • 公開に際しては、時代時代の法令を遵守すべき。公開と記録を分ける
        • 100〜200年後には、いも掘りをしている子供が連れ去られるようなリスクはほぼ消えている
    • 現在、公開できるためには著作権、個人情報保護等の知識が要る。将来のために、撮影やデジタル技術の知識の理解がいる。両方を求めていかなければいけない
ネットワーク化
  • 少し前まで・・・権利者は著作権についてあまりうるさくなかった
  • ネットワークにより・・・CDなら、1枚買われればコピーされて流通してしまいかねない。敏感になった
    • 書籍も、医学書などの小部数の世界だと、誰かが買ってスキャン・共有されてしまうともう成り立たなくなる
  • 他方、「いつでも、だれでも」を考えるなら・・・小中学生に対してもわかりやすいこと等の配慮が要る
    • 博物館の展示説明が、1枚でだれしもを対象にすることの不自然さ。デジタル技術をそこで活用できないか?
    • 学習指導要領の変化で、すべての強化で著作権等についても触れていくことになった
    • デジタルアーカイブの活用も、小中学校や高校で活用されるためには教育手法を確立して、小学校なら授業案や板書計画がないと使ってくれない
      • 高校は逆に授業案があると使ってくれない
      • 「日本全国どうぞ使ってください」では、実際は誰も使ってくれない。
      • eラーニング教材としての工夫を積み重ねていかないといけない
コンプライアンスの問題
  • 例えば・・・著作権法上の特例措置、例外的無断利用への正確な理解が必要
    • JAXAの静止画・動画の利用規約はよく出来ているが、報道と学校教育(正規教育)には使えても、例えば少年院の矯正教育には使えない
    • 天文学会でJAXAの方に質問すると、「問い合わせするといつでもOK」という。しかし「問い合わせる時点で仕組みになっていない」
    • デジタルアーカイブ構築者は適切に著作者の許可を取る必要がある。この講演もそう。著作者は「嫌だ」ということはできる。勝手にやっていいことではない
    • デジタルアーカイブは様々な著作者の許諾を得て作っていかなくてはいけない
    • 平成16年に著作権法は教育現場で大きく変わった。教員⇒生徒、だけではなく生徒⇒生徒もOKになった。逆にその前までは違法だった
    • 「いつでも、だれでも、どこでも」なんて本気で考えているのか、という仕組みはどこにでもある。考えていかないといけない
著作権法の原則
  • 許諾が原則
    • 教育関係者は教育のための権利制限を無制限に拡大解釈しすぎ?
  • 無許諾でできることは例外
    • 例外にも制限・範囲やルールがある
    • 著作物の利用について、どのように利用されたいのかを決定するのは創始者
      • 子供の落書きも著作物。それを本にしようとした教員がいたが、その子の死後50年まで生きている。その子を探すのは非常に大変
      • 創作物を作るときに、どのようなものに利用するのか、老人ホームや少年院でも使っていいのかを、自分で考えて、正確に何をOKとするのか説明
デジタル・アーカイブの必要性
  • 学会が作成するガイドラインが必要なのでは?
    • 例えば・・・著作権法第35条のガイドライン日本書籍出版協会のwebで公開している
      • 合意は得られていない
      • 大規模授業に使えない、授業参加者に配れない、学級通信に使えない、ということで利用者としては蹴っ飛ばした
    • 文部科学省ガイドライン・・・エル・ネット学習コンテンツ制作・契約ガイドライン
      • ポイント:企画からテキスト作成までの流れと著作権処理を対比的に紹介
      • 著作権には財産権と人格権が含まれるが、「人格権を行使しない」という文例を出している。
        • 文化庁に契約書を作ってくれるシステムもあるが、そちらは人格権のところがそのままになっている。そこはエル・ネットのガイドラインを参考に
デジタル・アーカイブは知的財産の塊
  • 著作権法特許法、意匠法のことを考えないで作ると、閉鎖せざるをえなくなる
    • 記録をどう使うか、を考えて作らないと国民の理解は得られないが、そのためには法律を知らなくてはならない
  • 今から作るもののガイドラインはあるが・・・
    • そのガイドラインが出ると、過去のものが公開できなくなる(許諾がないため
    • 映倫のような団体がいるのだろうが、それをみんなで集まって作って権威をつけていかないと効力が認められないだろう
  • 日本にはアーカイブを公開して利用して貰うしくみがない
    • 作っていかないと、記録が大事だと言う認識は日本で広まらない?



昼休み・企業展示



特別講演「国立国会図書館におけるデジタル化」(上綱秀治さん、国立国会図書館 企画課 電子情報企画室 課長補佐)

国立国会図書館の概要
  • 1948年設立。帝国図書館帝国議会図書館の蔵書を引き継ぐ
  • 職員890名、蔵書3660万(図書900万、雑誌900万)、予算211億円(平成22年度)
資料デジタル化の目的
  • 主に2つ:
    • 電子図書館サービスのためのデジタル化
      • 以前からやってきた事業。デジタル化の特性を生かしてどこからでも蔵書を閲覧するように
      • 「いつでも、どこでも、誰でも」
      • 1998年の電子図書館構想の策定⇒貴重書画像データベース⇒近代デジタルライブラリー
      • 蔵書を画像で提供する
      • 2004年に電子図書館中期計画。2007年にPORTA公開
    • 原資料保存のためのデジタル化
      • 新しい目的として追加された
      • 利用と保存の両立のためのデジタル化
  • 原資料保存のデジタル化が加わった背景
    • マイクロ化からデジタル化へ
      • 資料を他の媒体に変える際には媒体変換計画を立てる。その改定時に、今までは劣化資料はマイクロフィルム/フィッシュで提供していたものを、デジタル化の一般化、絵利便性、技術の進展を踏まえてデジタル化に変更する。館の決定
    • 著作権法改正
    • 提供方法は関係者と協議して決める、ということに。協議会を設置して検討
      • 合意形成ができた。所蔵資料が1点しかなければ同時アクセス人数は1点のみ、など
資料デジタル化の予算の推移
  • デジタル化自体は平成12年度から着手
    • 年間1〜2億円くらい。10年10億円くらいの予算
    • 平成21年度に127億円の補正予算で大規模デジタル化をすることに
    • 著作権法上の裏付けと予算の裏付け・・・デジタル化へ
      • 予算自体は平成21年度のものだが、1年では終わらないので平成22年度も
デジタル化の実施状況
  • デジタル化の対象
    • 図書は古いものから
    • 雑誌はタイトルごとに
  • 著作権処理をするもの・・・ネットで提供する
    • 大正期、昭和初期刊行図書、博士論文
    • 著作権者を洗い出して没年を調査。連絡先がわかれば外部機関を通じ許諾を得る
    • 著作権者のわからないものは公開調査したり、どうしてもわからなければ文化庁長官裁定で公開もできる
  • 公開・デジタル化の進行状況紹介
    • 戦後刊行物は館内のみでの利用にする予定
    • 国内雑誌・・・劣化しているもの、利用頻度の多いものを優先的にデジタル化する
大規模デジタル化の主な仕様
  • マイクロ資料・・・フィルムからデジタル化する
  • マイクロ化していないもの・・・原資料から直接デジタル化する
    • オーバーヘッド方式のスキャナで資料を撮影する(資料に触れない)
      • 自動めくりは使わない
  • 解像度・・・原資料に対しては400dpiでカラー
    • マイクロ資料は400dpiでグレースケール
  • フォーマット・・・保存用:JPEG2000、提供はJPEGまたはJPEG2000
    • サムネイルは別に作る。表紙の利用を館内外のサービスとしてできるように
  • 目次データのテキスト化
    • 本文はフルテキスト化しない
    • 雑誌についても目次データを作る
  • 新聞・地図の仕様も固まる
  • 資料のデジタル化手引き・・・今回の知見を入れて改定する予定
デジタル化の作業フロー等の説明
  • 画像とメタデータのフロー
    • 納品時は画像と目次データはブルーレイ等、またはHDDで送られる
      • 保存用データはブルーレイまたはDVDで保存される。高精細で容量も大きい。将来に備えて書庫で保存
      • 表示用画像・・・保存用画像から作成。圧縮をかけたファイル。HDDで納品。データベースに登録する
海外の資料デジタル化の状況(去年のデータ)
デジタル化コンテンツの利用提供
  • 館内・・・一部はもう公開開始
    • 順次、デジタル化の済んだものから提供していく
    • 本格的な開始にはシステムの改修が必要。平成24年度以降を想定
    • デジタル化したものは原則、原資料の利用は停止
  • ネット提供するもの(戦前期刊行図書等)・・・順次公開
  • その他・・・図書館間貸出をデジタル化資料でどうするか?
    • デジタル化したものはコピーが容易。他の図書館にデータを渡すことには強い懸念の表明が権利者等からなされている
    • 現在協議中
全文テキスト化実証実験
  • 図書館の夢・・・全文検索もしたい
    • 実証実験を今年度中にする
    • アクセシビリティ確保と全文検索サービスの実現が目的
      • OCR等を用いて画像資料をテキスト化、読み上げソフト等で読みあげられないかの実証実験
      • OCRの精度向上と効率化の実験
    • 背景・・・著作権法の改正により許諾なく行えるようになった、という背景
    • 検索・・・過去から現在までの幅広い資料を対象に
      • 過去のものも検索できるか?
      • できるだけ幅広く実験する
  • 出版社などにも呼び掛け:
    • 紙で出される出版物についても、版下データや電子書籍用データをいただいて、そこからテキスト抽出できないか
      • 実現すれば100%に近い精度
    • テキストデータの構造の標準化・共通化の検証
  • 検証はあくまで館内で行う
    • 館外には出さない。技術的可能性の実証実験
    • 検証には出版社・障害者にも立ち会っていただく
    • 一部のデータはAPIで出版社にも渡すことを想定している
国立国会図書館提供データベースの紹介
さいごに
  • 2年で127億円は国立国会図書館にとってもはじめての体験
  • 今年度で終了予定だが、作業は容易ではない。我々以上に受注業者のおかげで成り立っている
    • 作業はほとんど、入札にかけて落札した業者が施設を使ってやっている
    • 外に出せない貴重書等も業者が受注してやっている
    • 原本からのこの規模のデジタル化は、NDLだけでなく日本においても初めてのこと
      • 開始当初はスキャナ自体が国内にはほとんどなかった。海外ベンダにはあったが国内にはほとんどない
      • 2年で機械を含めて調達、デジタル化のスキームを作って、実作業をしてもらっている
      • NDLだけでなく業者もプライドを持って作業している

資料保存実用講座

所要のためここで中座


午後はここ数日の睡眠不足がたたってかなり記述が抜けているかと思います(汗)
寝不足でお昼ご飯を食べたのはかなり厳しかった・・・(大汗)


国立公文書館公文書館、MLAのA)と国立国会図書館(図書館、MLAのL)という、異なる特徴をもつ大規模デジタルアーカイブそれぞれの実践例を前後に紹介しつつ、坂井先生からデジタルアーカイブの構築にあたって、特に利用に供する点で注意しなければいけない権利関係の問題等への提言が行われる、という構成は非常に興味深かったです。
そういう意味では、今日の国立公文書館国立国会図書館の事例紹介はともに「閲覧に供する」という意味での利用のお話はありましたが、そこから再利用・再配布するというような利用についての言及はあまりありませんでした。
今日は特に実践例の紹介の部分を前面に出したため、ということもあるのだと思いますが、そのあたりの配慮が各々でどうなっているのか、も気になるところです。


また、地域の公文書のかわりになるものとして坂井先生からは公民館の可能性が指摘されていましたが、そのお話を聞いていて自分がぱっと思いついたのは山中湖情報創造館の取組でした。

地域づくりのNPOや地域の公共図書館デジタルアーカイブに取り組み始めている。アカデミックで学術的なものとしてではなく、その土地ならではの記録として、地域の普通の人たちが撮影し残した写真や映像がある。しかしながら、どうしてもそれらの記録は失われ散在しがちだ。地域の公共図書館が、地域の市民活動といっしょになって、地域の記録を保存し後世に伝え残したい。
そう、図書館は地域の記憶装置なのだから。


公民館に比べると数は少ないですが、公共図書館がこういうところを担っていく際の注意点等を考える上でも、興味深いイベントでした。


また、NDLの大規模デジタル化の実際、特に日本で初めてという規模でのデジタル化ということで、環境を切り開いて行った点の解説等も興味深かったです。
やろうって思っても、そもそも国内にそれを請け負えるところを育てて一緒にやって・・・ということから始めていくわけで、それで業者にノウハウが培われて行けば他でもいかせるわけですし。
それだけにご苦労も多大なのだろうと思いますが(汗)




さて、明日からは東大・知の構造化センターのpingpongシンポジウムに参加してきます。

しばらくまたイベント記録が続きそうですが・・・台風は大丈夫かなあ・・・