今日は筑波大学秋葉原キャンパスで開催されたディジタル図書館ワークショップに参加してきました!
いつもはワークショップの半分くらいは一般発表、もう半分が何かしらのイベント・・・という感じですが。
今回は前半はGoogleブックスについてGoogleの佐藤陽一さんからご講演、後半はCode4Lib Japanのスペシャルパネルという珍しい構成でした。
いつもは一イベント一エントリにすることが多いのですが、前後半でかなり話題の方向性が違ったので、今回は2つにエントリを分けたいと思います。
まずは前半、グーグル株式会社の佐藤陽一さんによるGoogle Booksに関するご講演です。
Google Booksを知らないという方はもういないと思いますし、その経緯や概観もこのブログを御覧の方ならだいたい知っているかと思いますが・・・
実際に中の人から、数字やデータと合わせて語られていくお話は(エントリタイトルに引いた言葉を見てもわかるように)なかなか刺激的でした。
以下、いつものように当日のメモです。
なお例によってmin2-flyの聞き取れた/書き取れた/理解できた範囲での内容ですので、ご利用の際はその点ご理解いただければ幸いです。
誤字脱字、事実誤認等お気づきの点がありましたらコメント欄等にてご指摘下さいm(_ _)m
「電子書籍、Googleブックス、クラウドコンピューティング」 (グーグル株式会社、佐藤陽一さん)
はじめに
Googleの使命とGoogle books
- オフライン=オンライン、は「無料公開」を必ずしも意味しない
- 検索可能にするには情報がどこにあるか示せればいい。飛んでいった先の有料・無料はコンテンツの持ち主が決めること
- Googleはあくまでどこに探す情報があるかを指し示すためにオンラインで検索できるようにしたい
クラウドコンピューティング
- Googleのサービスのほとんどはクラウドに乗って提供されている
- Gmail、Google Docs、カレンダー、マップ、YouTube、Picasa…
- あらゆるサービスはネット上のどこかにあるサーバ/データセンターから、ブラウザを通じてアクセスすることで使える
- その実現のために巨大なデータセンターやクラウドシステムそのものを作っている
- 別角度から見れば:ハードウェアからソフトウェア、ソフトウェアはクラウドへ
- クラウドはすでに生活の一部
- 気づく・気づかないに関わらず使っている
- 今目にしているのは・・・ウェブベースのクラウドコンピューティングへの移行
- アプリケーションをPCにインストールすること自体が減っていく時代の真ん中にいる
書籍のデジタル化:「GoogleとしてはePubに収斂するといい」
- 129,864,880:Googleエンジニアが数えてみた、現存する書籍の数。少なくともこれだけある
- 入手できる書籍の情報ソース、書誌データの重複を省き、本でないものを省き・・・としていって、ISBNの独立した書籍の数を数えたら約1億3千万だった
- デジタル化を現時点で終了しているのは約1,000万冊。10%。道まだ遠し。
- すでに発行された書籍
本の未来:「本っていったいなんだろう?」
- "20 things I learned about browsers and the web"(http://www.20thingsilearned.com/)
- Google Chromeのチームが作ってみた。webの中に本の体裁でコンテンツを作る、HTML5で作ってみた実験
- ささやかにアニメーションも含んでいる
- 本っていったいなんなんだろう?
- 紙のデジタル化は単純。ページのスキャン、OCR、検索
- 電子ブックも似たようなもの
- webサイト、web上での情報の展開に本が内包されるようになると、何を持って書籍とするかが今後のポイントになる
「ハリー・ポッターを検索できることにメリットはない」「旅行書・料理書は見せても売れる/見れなくても買わない」
再びGoogle booksの話
- パートナープログラム:出版社から本を提供してもらう
- libraryプロジェクト:図書館で電子化を進める
- フェア・ユースと考える理由:国内の書籍で流通しているのは5%、パブリック・ドメインは20%、残る75%は保護期間内だが流通していない、買えない
- 表示を工夫って?
- 出版社の要望はばらばら
- 例えばミステリ・・・謎解きのページだけは見せたくない
- 旅行書・料理書・・・見せたら売れないかと思ったが、見れなかったら買いに行くかというと、人は買いに行かない。無料のところに行くだけ
- 最近では「20%以上見せたい」という出版社も出てきた。ミシュラン旅行ガイドは100%見られる、でも売上には関係がない
「検索結果から書籍へ誘導する」「トラフィックのほとんどはweb検索から」
ここでGoogle booksのデモ
- トップページ
- トップページの「注目」はアクセス数が多い本をランダムで出しているだけ。ばらばらで面白い
- 日本語フィルタを強くかけているので日本語が多く出てくる
- シャラポワの写真集はずっと出っぱなしでなくならない。常に見ている人がいる?
- ジャンル別のトップページ表示は割とグローバル
- ただし日本のIPから多くアクセスされるものを出しているので日本語が多いこともある
- トップページの「注目」はアクセス数が多い本をランダムで出しているだけ。ばらばらで面白い
- 個別の書籍ページ
- 雑誌:日本ではスキャンしていないがアメリカではやっている
- 例えば『LIFE』は古いものをかなりスキャン、すべてのページを見れる年も
- トップページから探す以外にも:
- "Books Ngram Viewer"(http://ngrams.googlelabs.com/)
- Googleがデジタル化した書籍の中でどんな言葉が何年に出てきたか、統計的に処理したもの
- データはタブ区切りでダウンロード出来る。興味があればいじってみて欲しい
- 遊ぶには面白い
「お金を払ってくれるなら100%見せてあげる」「Apple, Amazonと違ってGoogleはオープン!」
Google e-books
- お金を払ってくれれば書籍を100%見せてあげるよ!
- 出版社が展開できるようにプラットフォーム機能を提供する
- Google booksの中にパートナープログラム(出版社提供)があり、その中で出版社が売ると決めたものがeBooksへ
- マルチプラットフォーム/ブラウザがあれば使えるしそれ以外でも使える
- より詳しくは:"introducing Google eBooks"
ディスカッション
- Q. 売れ筋は実用書が多い? エンタメよりも?
- A. 最大の理由はエンタメ系の本は入っていないから。書店の店頭では並ばないような、ニッチな本が大量に入っている。そこによってしまう
- Q. 常用外漢字や過去の言葉も現在の仮名遣いでヒットする仕組みがあるの?
Google book以外のサービスとの有機的結合
- Q. 英語の本でよく書籍の中の地名をGoogle map上に展開しているのを見るのだが、例えば将来、地図だけでなくタイムラインを抽出する、といった計画はある?
- Q. 『東海道中膝栗毛』はうまくいく?
- A. まだうまくいかない。池波正太郎のエッセイの中で昭和のレストランを紹介しているものを地図上に出す、とかもしたい。地図のチームとブックのチームが話すと盛り上がるのだが、「誰かやって」で止まっている。誰かやってくれる人が現れれば進む。
- Q. サービスをやられていて、予想しなかったような使い方、というのがあれば。
- A. 逆に予想したけどなかったものが多い。辞書がたくさん入っていて電子辞書として使われたら終わり、というのがあったのだが、言葉にドンピシャで行くわけではないので電子辞書としては使えなかった。電子辞書が普及している環境で紙の辞書の電子化は、見せることに意味がある。出版社が懸念するような使い方は意外に少ない。
- A. ただ、画像を自動的に引っ張り出して何かしようとする仕組みを開発する人は常にいる。それをこちらも防ごうとするわけだが、ITの世界のイタチごっこになる。
- A. 今はB2Cで設計しているが、図書館に対して年間購読のような形でコレクションを販売する話がアメリカでは出ている。日本でもそういう話が出てくる日が来るのではないか。
- Q. これからの「本の姿」の話があったが、クラウドの上で本が読めるとなると、クラウドの中はある種、利用者からは見えないところ。「わたしの読んでいる本が見張られているのではないか」という、紙では切れていた世界が常にネットで繋がっているので違う認識が出てくるのではないか。そういうところで議論があれば。
やっぱり和書についてはまだいまいち、その威力を体験できないGoogle Booksですが・・・
洋書を探しているときは最近はかなり存在感を強く感じるようになってきたなあ、と思っていました。
英語インタフェースでとある分析手法についてweb探索していたらヒットして・・・とか。
中身をかなり見られる本もあって、それに基づいて文献の引用の可否を決めたこともありましたし(そのときはしない、ということにしたのですが)。
やはり本の中身を検索できる、それが他の検索結果に混じって表示される、ということの威力は凄いです。
ディスカッションで話題になったサービスやGoogle eBooks等、ここでもアメリカ(というか英語圏)が進んでいて日本/日本語圏では提供されていないものが多かったりするのですが、日本語化されて提供されるようになるとより日常的に、書籍が電子化されたことで得られる新体験を体感できるのかなあ、とか思ったり。
後半、Code4Lib Japanスペシャルパネルについてはまた後ほど!