「デジタルアーカイブの最前線:現状と未来」(第4回情報資料保存シンポジウム)
情報保存研究会と日本図書館協会の共催イベント、「デジタルアーカイブの最前線:現状と未来」(第4回情報資料保存シンポジウム)に行って来ました!
国立公文書館、国会図書館での実践や教育利用等の観点からの提言等、一口に「デジタルアーカイブ」と称されるものについて多様な切り口で考えるきっかけになるシンポジウムでした。
以下、いつものようにmin2-flyによるメモです。
例のごとく、自分が聞きとれた/理解できた/書きとれた範囲の内容となっております。
特に今回、午後は疲労でメモ速度が落ちています・・・(汗)、ご利用の際はその点、ご理解いただきますようお願いします。
誤字脱字、事実誤認などありましたらコメント欄等を通じてご指摘いただければ幸いです。
では、まずは情報保存研究会の紹介から!
情報保存研究会・あいさつ(八木和久会長、情報保存研究会)
- 情報保存研究会(JHK)・・・日本図書館協会と共催で、毎年シンポジウムを開催している
- 今年・・・昨今、進展著しいデジタルアーカイブを取り上げる
- 現状と将来への取組みの紹介
- 講演者はそれぞれの分野の知識・実績の豊富な人
- 参考になる話をしていただけるものと思う
- 今年はJHK設立10周年の年でもある
- これを記念して、資料保存実演講座を開催
- 会員企業によるプレゼンテーション。展示コーナーも別にある
- 公文書館はじめの資料・・・保存だけでなく、活用も望まれる
- 資料の保存・活用には個々の企業が専用の製品・ツール・システム・ノウハウにより機関に貢献
- しかしさらに大きく貢献したい・・・そこで企業が集まってJHKを設立
- JHKではシンポジウムの開催やダイレクトリ発行、webによる情報発信を実施(URL: http://www.e-jhk.com/html/index.html)
- 質問箱コーナーもあるので遠慮なく質問して欲しい
- 分野のエキスパートが回答するのでお役に立てるものと思う
- JHKではシンポジウムの開催やダイレクトリ発行、webによる情報発信を実施(URL: http://www.e-jhk.com/html/index.html)
特別講演「国立公文書館デジタルアーカイブ」(八日市谷哲生さん、国立公文書館業務課電子情報係)
はじめに
- 国立公文書館・・・国の公文書を預かり、保存し、利用に供する
- 国立公文書館の所蔵資料は約120万冊
- 2つの大きなプロジェクト:
- 本館の所蔵資料のデジタルアーカイブ化
- アジア歴史資料センターのアジア歴史資料のデジタル化・提供
- いずれもこの先続けていかなければいけない事業。鋭意、がんばっているところ
デジタルアーカイブ事業の背景
- そもそもなんでデジタルアーカイブ?
- 書庫にはたくさんの所蔵資料
- 地方在住だとなかなか利用できない・・・インターネットですぐに探したり見れたりすると使いやすい
- 1990年代後半・・・インターネット環境が整備される
- 2000年代から、要請に応える基盤が確立される
- 国のIT制作、e-Japan戦略にも記述される
- 公文書管理を検討する懇談会でもデジタルアーカイブ化を進める、という議論
- 公文書管理法でも言及
- 2000年代から、要請に応える基盤が確立される
国立公文書館デジタルアーカイブの特徴
- コンセプト:
- そのコンセプトに合わせた特徴と機能:
- 目録・画像・なんでもISOに準拠する
- それによってシステム・サービスの互換性、情報の相互利用を図る
- 機能面・・・公文書館資料は1点しかない
- 必ずいつ、どこで、誰が、なんのために作った資料か、という情報を持っている
- そうした情報を持ちながら使えるように・・・
- 分類項目から探せる・表示できるなどの工夫
- 図書館の情報サービスとは若干違うところ?
- 目録・画像・なんでもISOに準拠する
- 対象:多岐にわたる
- それぞれに適したデジタル化を行う
国立公文書館デジタルアーカイブシステムの紹介
- http://www.digital.archives.go.jp/
- 利用者の2つの目的:
- 調査・研究者向け・・・データベース
- 「とりあえず何があるのか」を知りたい一般の方向け・・・キーワード検索等ではない、GUI
- それぞれの使いやすさを念頭に置く
- 目録データについて
- 資料の構造的な情報を目録データにうまく入れたい・・・EAD-ISAD
- できるだけ標準的な、情報の構造を格納できる仕組みをシステムに反映する取組み
- 完全に標準化するのは難しいが、基本的な部分は取り入れて対応する
- 情報化すると、たくさんの情報が目録データに入る
- 一般利用のためになる情報/保存者のために必要な情報など、多様な目的の情報
- それらをうまく整理する、という試み
- 裏側では職員がメンテナンス等をするシステムも動いている
- デジタルアーカイブの左側には資料のTree構造を出すようにしている
- カテゴリを辿ることでの検索も可能
- 資料の構造的な情報を目録データにうまく入れたい・・・EAD-ISAD
- 画像データ
- 利用者の声
- 「目録情報は探す手掛かりになるが、官公庁名で探すときに名前がころころ変わっているので探せない」
- 官公庁の組織変遷をデジタルコンテンツにして、それをたどりながら探せる仕組みを作る、等の試みも
- 「目録情報は探す手掛かりになるが、官公庁名で探すときに名前がころころ変わっているので探せない」
データのやり取り
- 図書館世界では当たり前だが・・・
- 各機関のデータを相互に連携して、一方にないものを他方で探すことは容易に
- 公文書館でも実現したい・・・横断検索はシステム構築時から入れている
- できるだけ多くの機関と接続していきたいと考えている
多彩なデジタルコンテンツ
- もっと色々な年齢層にも使ってほしい・・・コンテンツ作りの努力
- 日本史の教科書等を調べて、年表をweb上に作成。そこから関係する公文書画像がすぐに出てくるコンテンツの作成
- 中高生等もコンテンツを使う機会を増やす目的
- 日本史の教科書等を調べて、年表をweb上に作成。そこから関係する公文書画像がすぐに出てくるコンテンツの作成
- 他にも・・・
- 月替わりのテーマ紹介
- 館で行っている特別展資料のデジタル化
デジタルアーカイブの今後
- 歴史資料の基盤として地道に作ってきた
- いろいろな仕組みを付与してできるだけ価値を高めようとしてきた
- 今後も公文書管理法の「情報の利用の促進」を担う仕組みとして中身の充実を図る
電子公文書への対応
- 世の中にはどれくらいの種類の電子情報があるのか? 形式は何パターンある?
- 多すぎる。1億を超えるとも言われている
- 保存媒体は?
- こちらも雑多・大量にある。当面は一般にも使うものくらいしか対応できない?
- つかみどころがない中で・・・
- どうやって保存を考えていけばいいのか?
- 当面は・・・量があり、対応可能で、対応すべきものを絞る必要がある
- 内閣府による検討・・・平成17・18年度に行われる
- 電子的な記録については・・・
- 色々な媒体に変換せず、電子媒体のまま保存しては
- 完全な記録を維持するのは困難、証拠的な価値の確保に不可欠なエッセンスを保存しては
- 作るときから保存と利用を考え管理すべきでは
- 電子的な記録については・・・
- 平成19年・・・より具体的な検討
- 長期保存のためにはメタデータを取得し、元のデータとともに保存することが必要
- オフィスで使われているような文書は、PDF/Aに変換すると対応可能である
- 音声・画像・動画については結論は得られていない
- 平成20年は実証実験、平成21年から具体的なシステムの準備に取り掛かる
- 来年以降、具体例を話せるようになるかも
- どういうことを考えてやっていく?
- 使われているものには一定の形がある・・・それらのフォーマットはPDF/Aに変換して取っておくように
- 長期的保存の「長期」は、何年あるかわからない「長期」
- DVDベンダの「長期」は10〜30年くらいと考えていると言うが、歴史資料を保存する公文書館における「長期」は半永久
- それを裏付けるものは第一は紙、次はマイクロだが、電子はまだ決定的なものがない
- そこで標準的なもの、変換可能なものにしておけば対応可能だろう、と考えている
- DVDベンダの「長期」は10〜30年くらいと考えていると言うが、歴史資料を保存する公文書館における「長期」は半永久
- 歴史資料と行政文書との大きな違い・・・
- 行政文書は一つの文書の中に多数のドキュメントを含み、それらが複数の電子ファイルを持つ
- 基本は行政文書ファイル単位でシステムを作っていく
- 後世の利用のためにメタデータを作成する
- ボーン・デジタルを含むデジタルアーカイブへ
さいごに
- これからもデジタル化を進める中で・・・
- ボーン・デジタルにも対応
- 紙⇒デジタル、デジタル⇒デジタルのアーカイブを1つに統合して運用することになる
- 出口のところでは元の媒体は関係ない。媒体のまま保存する場合も、デジタル提供する出口は1つにまとめて提供されるのではないか
- バックヤードには紙とマイクロとデジタル、それぞれが特性を持って管理・運用される。うまく折り合いをつけて、長期保存を進めることが重要な仕事
特別講演「デジタル・アーカイブとデジタル・アーキビスト:百年後への伝言」(坂井知志さん、常磐大学コミュニティ振興学部教授)
はじめに
なぜ、デジタルアーカイブ?
- もう1つの背景・・・フィリピンや中国残留孤児へのインタビュー
- デジタルアーカイブを必要と考えた個人的理由・・・大学時代に感じた不安
- 東洋史の授業:「現代史は歴史ではない」と話す教員
- 歴史の3兄弟の逸話・・・皇帝の悪行について、長男が正確に書いて殺される/次男も正確に書いて殺される/三男も同じように書いたので、皇帝は諦めた
- 「現代史は歴史ではないと言っているが、今の逸話は中国では現代のことを歴史として書いていた、ということでは?」と質問したら、教員が解答に詰った
- 中国では現在のことを歴史として記録する仕組みがあるのに対し、日本にはないのではないか、との不安をここで覚える。そこに興味
- 東洋史の授業:「現代史は歴史ではない」と話す教員
日本はそもそも記録に興味がないのか?
- 宮本常一の問題提起・・・
- 寄り合いの記録を丹念に見ていく。『忘れられた日本人』という単行本にまとまっている
- 作者: 宮本常一
- 出版社/メーカー: 岩波書店
- 発売日: 1984/05/16
- メディア: 文庫
- 購入: 49人 クリック: 366回
- この商品を含むブログ (218件) を見る
-
- 業種別・地域別に丹念に記録を取っているところもある。自分たちの地域の記録がなかったわけではない
- フィリピンではバランガイ、という自治体のようなものが行政の最小端末としてものごとを進めている
- 寄り合い・バランガイから学ぶべきところがあるのでは?
デジタル・アーキビスト
- 岐阜女子大の現代GP*23年間の研究で出来た資格
- 養成課程での話・・・
- 学校教員、図書館員、学芸員、会社員(時には社員全員も)等の受講者に話すこと
- 学校のwebサイト・・・
- 昔は卒業アルバムが載っていたり、名札や顔のついた写真をアップしたりされていた。リスクを考えていない?
- しかしそれらは現在、どんどん消えている。顔は写さず手元だけ写す、など
- リスクを考えると正しいが、記録自体がそうなってしまうと、21世紀の日本の記録には子供の活動の写真が映像として残らない
- 背中や手元しかなくていいのか? 良くない。
- 記録は記録として、色々な角度から質を考えて取っておくことを考えよう
- 公開に際しては、時代時代の法令を遵守すべき。公開と記録を分ける
- 100〜200年後には、いも掘りをしている子供が連れ去られるようなリスクはほぼ消えている
- 現在、公開できるためには著作権、個人情報保護等の知識が要る。将来のために、撮影やデジタル技術の知識の理解がいる。両方を求めていかなければいけない
ネットワーク化
コンプライアンスの問題
- 例えば・・・著作権法上の特例措置、例外的無断利用への正確な理解が必要
- JAXAの静止画・動画の利用規約はよく出来ているが、報道と学校教育(正規教育)には使えても、例えば少年院の矯正教育には使えない
- 天文学会でJAXAの方に質問すると、「問い合わせするといつでもOK」という。しかし「問い合わせる時点で仕組みになっていない」
- デジタルアーカイブ構築者は適切に著作者の許可を取る必要がある。この講演もそう。著作者は「嫌だ」ということはできる。勝手にやっていいことではない
- デジタルアーカイブは様々な著作者の許諾を得て作っていかなくてはいけない
- 平成16年に著作権法は教育現場で大きく変わった。教員⇒生徒、だけではなく生徒⇒生徒もOKになった。逆にその前までは違法だった
- 「いつでも、だれでも、どこでも」なんて本気で考えているのか、という仕組みはどこにでもある。考えていかないといけない
著作権法の原則
- 許諾が原則
- 教育関係者は教育のための権利制限を無制限に拡大解釈しすぎ?
- 無許諾でできることは例外
- 例外にも制限・範囲やルールがある
- 著作物の利用について、どのように利用されたいのかを決定するのは創始者
- 子供の落書きも著作物。それを本にしようとした教員がいたが、その子の死後50年まで生きている。その子を探すのは非常に大変
- 創作物を作るときに、どのようなものに利用するのか、老人ホームや少年院でも使っていいのかを、自分で考えて、正確に何をOKとするのか説明
デジタル・アーカイブは知的財産の塊
- 著作権法、特許法、意匠法のことを考えないで作ると、閉鎖せざるをえなくなる
- 記録をどう使うか、を考えて作らないと国民の理解は得られないが、そのためには法律を知らなくてはならない
- 今から作るもののガイドラインはあるが・・・
- 日本にはアーカイブを公開して利用して貰うしくみがない
- 作っていかないと、記録が大事だと言う認識は日本で広まらない?
昼休み・企業展示
特別講演「国立国会図書館におけるデジタル化」(上綱秀治さん、国立国会図書館 企画課 電子情報企画室 課長補佐)
資料デジタル化の目的
- 主に2つ:
- 電子図書館サービスのためのデジタル化
- 以前からやってきた事業。デジタル化の特性を生かしてどこからでも蔵書を閲覧するように
- 「いつでも、どこでも、誰でも」
- 1998年の電子図書館構想の策定⇒貴重書画像データベース⇒近代デジタルライブラリー
- 蔵書を画像で提供する
- 2004年に電子図書館中期計画。2007年にPORTA公開
- 原資料保存のためのデジタル化
- 新しい目的として追加された
- 利用と保存の両立のためのデジタル化
- 電子図書館サービスのためのデジタル化
資料デジタル化の予算の推移
デジタル化の実施状況
- デジタル化の対象
- 図書は古いものから
- 雑誌はタイトルごとに
- 著作権処理をするもの・・・ネットで提供する
- 公開・デジタル化の進行状況紹介
- 戦後刊行物は館内のみでの利用にする予定
- 国内雑誌・・・劣化しているもの、利用頻度の多いものを優先的にデジタル化する
大規模デジタル化の主な仕様
- マイクロ資料・・・フィルムからデジタル化する
- マイクロ化していないもの・・・原資料から直接デジタル化する
- オーバーヘッド方式のスキャナで資料を撮影する(資料に触れない)
- 自動めくりは使わない
- オーバーヘッド方式のスキャナで資料を撮影する(資料に触れない)
- 解像度・・・原資料に対しては400dpiでカラー
- マイクロ資料は400dpiでグレースケール
- 目次データのテキスト化
- 本文はフルテキスト化しない
- 雑誌についても目次データを作る
- 新聞・地図の仕様も固まる
- 資料のデジタル化手引き・・・今回の知見を入れて改定する予定
デジタル化の作業フロー等の説明
- 画像とメタデータのフロー
- 納品時は画像と目次データはブルーレイ等、またはHDDで送られる
- 保存用データはブルーレイまたはDVDで保存される。高精細で容量も大きい。将来に備えて書庫で保存
- 表示用画像・・・保存用画像から作成。圧縮をかけたファイル。HDDで納品。データベースに登録する
- 納品時は画像と目次データはブルーレイ等、またはHDDで送られる
海外の資料デジタル化の状況(去年のデータ)
- アメリカ議会図書館
- 所蔵資料のうちアメリカの歴史資料を電子化してwebで提供。1,500万点をデジタル化済み
- 大英図書館・・・・3万点
- 中国国家図書館・・・webで72万点、館内100万点以上
- 国際的な取組み・・・
- Europeanahttp://www.europeana.eu/portal/
- World Digital Libraryhttp://www.wdl.org/en/
デジタル化コンテンツの利用提供
- 館内・・・一部はもう公開開始
- 順次、デジタル化の済んだものから提供していく
- 本格的な開始にはシステムの改修が必要。平成24年度以降を想定
- デジタル化したものは原則、原資料の利用は停止
- ネット提供するもの(戦前期刊行図書等)・・・順次公開
- その他・・・図書館間貸出をデジタル化資料でどうするか?
- デジタル化したものはコピーが容易。他の図書館にデータを渡すことには強い懸念の表明が権利者等からなされている
- 現在協議中
全文テキスト化実証実験
- 図書館の夢・・・全文検索もしたい
- 出版社などにも呼び掛け:
- 検証はあくまで館内で行う
- 館外には出さない。技術的可能性の実証実験
- 検証には出版社・障害者にも立ち会っていただく
- 一部のデータはAPIで出版社にも渡すことを想定している
国立国会図書館提供データベースの紹介
- 近代デジタルライブラリー
- 貴重書画像データベース
さいごに
- 2年で127億円は国立国会図書館にとってもはじめての体験
- 今年度で終了予定だが、作業は容易ではない。我々以上に受注業者のおかげで成り立っている
- 作業はほとんど、入札にかけて落札した業者が施設を使ってやっている
- 外に出せない貴重書等も業者が受注してやっている
- 原本からのこの規模のデジタル化は、NDLだけでなく日本においても初めてのこと
- 開始当初はスキャナ自体が国内にはほとんどなかった。海外ベンダにはあったが国内にはほとんどない
- 2年で機械を含めて調達、デジタル化のスキームを作って、実作業をしてもらっている
- NDLだけでなく業者もプライドを持って作業している
資料保存実用講座
所要のためここで中座
午後はここ数日の睡眠不足がたたってかなり記述が抜けているかと思います(汗)
寝不足でお昼ご飯を食べたのはかなり厳しかった・・・(大汗)
国立公文書館(公文書館、MLAのA)と国立国会図書館(図書館、MLAのL)という、異なる特徴をもつ大規模デジタルアーカイブそれぞれの実践例を前後に紹介しつつ、坂井先生からデジタルアーカイブの構築にあたって、特に利用に供する点で注意しなければいけない権利関係の問題等への提言が行われる、という構成は非常に興味深かったです。
そういう意味では、今日の国立公文書館、国立国会図書館の事例紹介はともに「閲覧に供する」という意味での利用のお話はありましたが、そこから再利用・再配布するというような利用についての言及はあまりありませんでした。
今日は特に実践例の紹介の部分を前面に出したため、ということもあるのだと思いますが、そのあたりの配慮が各々でどうなっているのか、も気になるところです。
また、地域の公文書のかわりになるものとして坂井先生からは公民館の可能性が指摘されていましたが、そのお話を聞いていて自分がぱっと思いついたのは山中湖情報創造館の取組でした。
地域づくりのNPOや地域の公共図書館がデジタルアーカイブに取り組み始めている。アカデミックで学術的なものとしてではなく、その土地ならではの記録として、地域の普通の人たちが撮影し残した写真や映像がある。しかしながら、どうしてもそれらの記録は失われ散在しがちだ。地域の公共図書館が、地域の市民活動といっしょになって、地域の記録を保存し後世に伝え残したい。
そう、図書館は地域の記憶装置なのだから。
公民館に比べると数は少ないですが、公共図書館がこういうところを担っていく際の注意点等を考える上でも、興味深いイベントでした。
また、NDLの大規模デジタル化の実際、特に日本で初めてという規模でのデジタル化ということで、環境を切り開いて行った点の解説等も興味深かったです。
やろうって思っても、そもそも国内にそれを請け負えるところを育てて一緒にやって・・・ということから始めていくわけで、それで業者にノウハウが培われて行けば他でもいかせるわけですし。
それだけにご苦労も多大なのだろうと思いますが(汗)
さて、明日からは東大・知の構造化センターのpingpongシンポジウムに参加してきます。
しばらくまたイベント記録が続きそうですが・・・台風は大丈夫かなあ・・・