かたつむりは電子図書館の夢をみるか(はてなブログ版)

かつてはてなダイアリーで更新していた「かたつむりは電子図書館の夢をみるか」ブログの、はてなブログ以降版だよ

「学術出版とXML対応-日本の課題」・・・SPARC JAPANセミナー2008


某所でも予告していましたが、昨日はNIIで開催された第2回SPARC JAPANセミナー2008に行ってきました。

(資料も公開されています)


80人くらいの参加者がいたそうで、会場は割とぎゅうぎゅうな感じ。
以下、超簡単にレビューと感想。


XMLの到達点と学術出版(福重青史さん)

XMLに関するこれまでの流れと現状、それにWord2XML等のツールの紹介について。
なんとか情報専門学群とかいうところに通っていたくせにXMLとかに詳しくない自分としては大変有り難かった。
XMLから自動組版するシステムとかがあるなんて知らなかったらかなり新鮮(業界の人にとっては当然なのやも知れないけれど)。
しかしそうか、もうXML勧告があってから10年になるのか・・・

物理系ジャーナルの場合(太宰達三さん)

応用物理学会日本物理学会のジャーナルを刊行されている物理系学術誌刊行センターの太宰さんから、Japanese Journal of Applied Physics、Journal of the Physical Society of Japanを例に物理系ジャーナルとXML対応について。
現在はマークアップ組み版+WYSWYGで出版されているとのことで、著者からくるファイルはほとんどはLaTeXXML組版への移行については必然性が高まれば考えるが現在はあまり必然性が感じられない、とのこと。
全文データの活用の要があまり思いつかない(現在のところXMLデータが必要とすればCrossRefに渡すためだけ)とか、印刷側の組版ソフトの問題もあってXML化はしにくい、とか。
「Elsevierみたいな海外大手出版社や大学会(APSとか?)がXML化するなら印刷所もペイするだろうけど、日本の小規模学会のためにXML組版導入して印刷所はペイするのか?」という・・・もっともと言えばもっともな・・・
あるいは海外大手についてはインドにXML化作業を依頼するなど「学術プランテーション」のような手も使えるだろうが、JJAPやJPSJレベルではそれも難しい、ということで、「今回は(物理系学術誌刊行センターは)followerになる」と明言。
その上で、次の発表者の林さんに振る、という・・・なんという前振り(笑)

化学系ジャーナルの場合-WordからXMLを作る試み-(林和弘さん)

今回の司会でもある日本化学会の林さんから、主にプラグインソフトを用いてWordから直接XMLを出力する方法について、実演も交えてかなり詳しい紹介。
組版ソフトって、マークアップ指定されたものを本当に誌面みたいにして出力できるんだ・・・というのをはじめてみた(汗)
てっきりIndesignとかにコピー&ペーストで流しこんだりしているものかと・・・そうか、全然違うんだなぁ・・・
学会出版関係の人にしてみれば当たり前のことなんだろうけど、自分みたいに舞台裏を知らない人間から見ると限りなく新鮮。
XML対応って本文をHTMLで表示したりその他の2次的な使用に用いる以前に、組版もそれで出来るってことだったのかー・・・ふ〜む・・・

質疑応答

質疑では日本動物学会の永井さんからBioOneでの例についての紹介もあったり(Word2XMLは安いらしい)しつつ、より具体的な話へ。
出てきた話題としては、

  • 学術的な付加価値のあるタグ付けまでするのか?
    • (林さんから)イギリス化学会では化合物にタグを付けてデータベースにリンクさせるような試みもあるが、リンク先データベースの標準化等が定まらないうちに乗るのは難しい。優先順位としては文章の構造化にとどまっている。
  • XMLはauthoring toolかと思っていたが、著者によるタグ付けが必ずしも信用できない(人によってタグの使い方が異なったりする)とするとどうすればいいのか?
    • (永井さん)現段階で著者によるタグ付けを求めれば投稿数が減ると思う。ただ、2010年頃には著者によるタグ付けもありうるのでは、と思う。
  • 著者の許可なしに本文にタグ付けをするのは著作権侵害では?
    • (林さん、永井さんとも)投稿時の著作権情報で(暗黙のうちに)了解を得ている前提。
    • (永井さん)逆にタグ付けをしていない方が可視性が下がり怒られる?
  • 全文をXHTML化して、ブラウザで見られることに意味があるの? アブストラクト程度ならわかるが。
    • (林さん)欧米大手はHTMLで公開している。付加価値?
                                      • -

などなど。
時間いっぱいまで質問が出て来てかなり盛り上がっていた。


最後の質問に関しては、林さんからも言及があったが、日本では倉田敬子先生たちが医学研究者のメディア利用について最近調査されていて*1その中ではそもそも電子ジャーナルを画面上で読む、という割合が全体の10%に満たず、電子ジャーナルを使う場合でもほとんどはプリントアウトしたものを読んでいることが明らかになっている。
文字を読む場合の媒体として今の段階では紙の方がディスプレイに勝っていることは自分も幾度となく言及しているので*2論文を「読む」場合としてはそりゃそうかな、と。
日本化学会の林さんがweb上のニュースを例に「"続きを読む"のリンク先がPDFだったらどう思う?」ということもおっしゃっていたが・・・webで読み切る心づもりの場合はもちろんPDFだったらいらっとくるが、反面、はなから印刷して読むつもりの場合はどうせPDF版の方を刷るし別にいいかな、という気もするのは確か。
逆に読む/読まないの可否はタイトルとアブストラクトで決まっちゃうしね。
っていうかタイトル見て面白そうなのだけアブストラクト見て、そっちも面白そうで初めて本文読む、って感じ。
論文を「読む」場合に限れば確かにXHTML化は要らないのかも知れない。


ただ、じっくり最初から最後まで論文を読みたい場合でなく、あるキーワードに関する部分だけ抜き出したいとか、「結果とかどうでもいいから方法だけ読みたい」あるいはその逆という場合、そして参照文献のリンク先を辿りたい場合などには、いちいちPDF版を見るよりはHTML版があればそちらを見たいし、それぞ付加価値、という気もする。
いちいち参照されていた文献を手で打ち込んで探すとかメンドイし、自動でリンクはってくれてればそっち使うよ、とか。


さらに言えば閲覧に関しても人によってはもうブラウザで長文見るのが苦でない、ということもあるだろうし、RSSリーダでぶっ通しで読めるとかいうツワモノも今後出てくるかも知れない、そこら辺の好きな体裁で見られる可能性としてはやっぱりXML化は欲しいよなあ・・・とかなんとか。




しかし、組版したりXML作ったり・・・ってずいぶんな手間なんだな(汗)
「出版社なんか何もしてないのになんであんなに高いんだ!」とか良く言ってたし良く聞くが、そこら辺の作業を仲介してくれる人がいなくなった場合に研究者が費やさないといけなくなる時間とその分のコストを考えると結構なもんなわけで・・・もちろん、大手出版社はインドとかに「学術プランテーション*3かけてるから大したコストじゃない、って言い返せもするだろうが、(以前も同じようなこと言ったが)こういう場合は相手方が実際に負担しているコストではなくもし相手がそれをやってくれなかった場合に自分が負担しなければならないコストと比較せんといかんわけで・・・さてはて。


まあ、組版やめちゃってみんな全部ブログとかで書いて情報流通するってんなら確かにコストかからないけどさ。
実際のところそれを読みたいかと聞かれると・・・今だってあんまり長いエントリは読まれないという話なのに、論文の体裁で10ページある奴のブログ版とか、マジ見る気起きないんじゃないかとも思うが・・・俺がもう古い人間なのだろうか?