かたつむりは電子図書館の夢をみるか(はてなブログ版)

かつてはてなダイアリーで更新していた「かたつむりは電子図書館の夢をみるか」ブログの、はてなブログ以降版だよ

「アカデミックとリアルの谷を埋める道:知識情報社会でライブラリアンはどうあるべきか」(第13回図書館総合展参加記録その7)


図書館総合展参加記録シリーズ、最後の1本は、気になりつつも横目でじっと見ている人も多いであろう、マイニング探検会のフォーラムです!

  • 演目: アカデミックとリアルの谷を埋める道 ー知識情報社会でライブラリアンはどうあるべきかー
  • 日時: 2011/11/11(金) 15:30 - 17:00
  • 会場: 第6会場(アネックスホール206)
  • 講師:

清田陽司
岡本 真
三津石智巳
関戸麻衣
日高崇

  • 講師所属:

株式会社ネクスト リッテル研究所 所長
アカデミック・リソース・ガイド株式会社
筑波大学大学院
国立情報学研究所
有限会社スタジオ・ポットSD

  • 主催者(団体): (株)ネクスト (リッテル研究所)
  • 共催(団体): アカデミック・リソース・ガイド(株)、マイニング探検会
  • フォーラム番号: 11-6-3


今回のフォーラムの趣旨はまずマイニング探検会の経緯についての説明があった後で、実際に参加者が作ったシステムについてのプレゼンテーションを行う、というもの。
どのシステムも現在公開されているので、気になったものがあればぜひぜひ使ってみていただければっ。


ということで早速ですが以下、例のごとく当日のメモです。
いつものようにmin2-flyの聞き取れた/理解できた/書き取れた範囲のメモであり、ご利用の際はその点ご了解願います。
誤字脱字、事実誤認など、お気づきの点があればコメント等でご指摘いただければ幸いですm(_ _)m


では、まずは発起人のお1人、清田先生のご挨拶から!


基調講演「ネクスト・リッテル研究所のこれまで・これから」(清田陽司先生、株式会社ネクストリッテル研究所 所長)

自己紹介
  • 清田先生自身は情報分野の教員
    • 自然言語処理、大規模分散処理、webと図書館情報資源の融合
    • 京都大学で現・国会図書館長の長尾真先生に師事。東大情報基盤センター学術情報研究部門 助手・助教
      • 産学連携で起業、合併・・・現在へ
ネクスト・リッテル研究所のミッション
  • ネクスト・・・国内最大級の不動産ポータルを運営
    • 300万件以上の物件情報を持っている
    • データベースをユーザが提供できるサービスを提供
    • 不動産の他に生活全般に関する情報提供サービスへの展開を図る・・・地域、金融、医療、教育・・・
    • 図書館とあまり関係ない?⇔情報の非対称性解消は不動産分野の大きなテーマ。図書館ともつながる
  • デモ:
    • http://www.homes.co.jp/
    • みなとみらい駅に20分以内で通える物件を探す・・・10,436件ヒット
      • さらに賃料で絞り込む/間取り/駅からの距離/面積・・・どんどん絞り込める・・・86件に
      • OPACにおけるファセット検索とほぼ同じ。条件が図書館だと「ファセット」と呼ばれるものなだけ。技術的には共通する部分が多い
  • リッテル研究所
    • 株式会社リッテルを母体に2011.4に創設
    • 情報リテラシー向上を軸とした事業展開
      • リッテルナビゲーター
        • Wikipediaと図書館情報の融合によるナビゲーション・システム
        • 国内約10大学で利用
        • レファレンス支援・情報リテラシー教育
      • リサーチ・ナビ:http://rnavi.ndl.go.jp/rnavi/
        • リッテルナビゲーターのエンジンを使用
        • 調べ方のヒントを探すサービス
    • Hadoop構築支援
      • Hadoop・・・オープンソースの分散構築システム。ネット企業で使われている
      • 技術利用のためのノウハウ提供
    • 4月からネクストグループへ:
      • ミッション:「氾濫する情報の洪水の中から心からの「安心」と「喜び」を見出すには?」
      • ビジョン:付加価値の高い情報サービスが人々に大きな提供⇒その活用は個人の能力に依存
        • ユーザとシステムのインタラクションの中でユーザの感じていることを読取る⇒情報を探し、新たな価値を見つけるプロセスをいかに楽しませるか
  • なんで大学教員からビジネスへ?
    • 情報検索の本質に迫るには実運用が不可欠
      • 実運用評価は論文の生産性があまり良くない
        • 数が全てではないが研究者評価には使われる
      • 評価基準が明確なテーマならもっと論文が書ける?
        • 研究者としてはハンディになる
    • そもそも研究を選んだのは「みんなにとって役に立つシステムを作りたいから」・・・実運用へ
  • 大学の中だけの世界ではスピードが不足している・・・外部の力を借りたい
  • 起業のきっかけ
    • 学生時代のバイト先の社長と再会
      • 「出資するからぜひ一緒にやらない?」・・・リッテル起業への参加へ
マイニング探検会(マイタン)の活動
  • 図書館の未来を探る勉強会
    • 知識情報産業関係者を中心とする
    • 清田先生と岡本真さんが発起人、2010.4より毎月開催
    • メンバーは図書館・出版業界が多いが、枠を超えて新たなアイディアを語る場とする
  • 主な活動:
    • 要素技術の講習
    • メンバー自身による情報サービスの提案・開発
  • メンバーによる新たな活動
    • 本当に多岐にわたる
    • 例えば・・・情報APIを活用したサービス開発:CiNii、レファ協Twitter・・・
    • 既存ツールを組み合わせたサービス開発:GETAssoc、言選Web・・・
    • OPACログデータの活用
    • メタデータ連携Wiki・・・NDL、JST、NII等が独自に整備しているメタデータwikiエンジンを使って「ゆるく」つなぐ
  • 言選Web:http://gensen.dl.itc.u-tokyo.ac.jp/gensenweb.html
    • 文章中から専門用語を切り出すツール
    • 大規模データベースを持たずに重要と思われるワードを抽出できる
      • 前田さん@東大柏図書館を中心に開発
  • マイタンで意識していること:
    • メンバーひとりひとりが「情報サービスのプロデューサー」として活躍することを目指す
      • プログラミング技術は必ずしもなくてもよい
      • ひとりひとりがリーダー
    • 「所属組織」よりも「個人」としての立場を重視
      • バックボーンは組織にあるが、発言の責任はあくまで個人に帰属
      • 成果物も個人に帰属
  • 「共生プログラミング」の実践(マイタン+ネクストのエンジニア)
    • 4チームの開発物のうち3つを、このあとの時間で紹介
アカデミックとリアルの谷を埋める
  • 「枠」を超えて行動してみる
    • 情報検索システムのモデル・・・アカデミックの場合:
      • システムに質問を入力してヒットしたテキストの集合を評価
        • 実際のサーチエンジンの使い方にはあっていない
        • クエリはガンガン変わる。検索結果を見て新たな入力へとフィードバックする
        • リアルの検索システムはこれを意識する。アカデミックとのギャップ
    • こういうことを意識するのが「枠」を外すこと
  • 「組織」と「個人」の両面を意識する
    • 「組織」と「個人」の違い・・・それぞれ違う役割がある
    • 組織=クレジットの蓄積、個人=スピード
    • すべての人に両面があるのに「個人」は忘れられがち
      • 組織にどっぷり浸かると「個人」を忘れる
      • 往々にしてある傾向
    • 組織を構成する個人はそれぞれ異なる目的を持っていて当たり前
      • 同じ目的を持っていなくてもいい・・・組織に関わる中で自身の目的があるはず、それは異なって当たり前
      • お互いの目的へのリスペクト・・・組織と個人の強みが両立する
  • 「ルール」と「ガイドライン」の違い
    • ルール:「〜べきである」
      • 集団生活には欠かせない
      • 守ること自体が自己目的化する
    • ガイドライン:「〜のが望ましい」
      • 大まかな指針
      • 作った目的にそぐわなければ改めることを厭わない
    • Wikipedia・・・ガイドラインの精神の尊重
      • 「百科事典をつくる」という目的を最重要視
      • システムを現実世界で機能させる仕組み
        • 情報検索は現実の人間の営み。ある種のadhoc性が要る。それが入っている必要がある
        • 一方で、秩序維持の努力も要求される
      • 試行錯誤は避けられない
        • うまくいかなければ変える
        • ビジネスモデルとして成立するか?
  • リスクに対する考え方
    • Zuckrberg曰く:「最大のリスクは一切リスクを取らないこと」
      • 成功を保証する戦略はないが、リスクを一切取らないと絶対失敗する
    • やみくもにリスクを取ればいいわけではない
    • 必要なのはリスクの主体的なコントロール
おわりに
  • 図書館の「未来」は私たちひとりひとりの「いまこの瞬間」の行動にかかっている
    • 「やったらいいな」と思ったことを「暇になったら」とか「来年」にしない、いまこの瞬間にやることが未来を作る
  • ひとりでも多くの方が枠を超えて活動されることを期待します

マイタン成果報告/システム紹介

夏に合宿を実施、その後も定期的に集まって作業した成果についての発表

「Ref.Master:レファレンススキル広報ツール」(三津石智巳さん、筑波大学大学院/アカデミック・リソース・ガイド株式会社インターン

自己紹介
  • 筑波大学の大学院生
  • 開発チーム・・・外崎みゆき、河村俊太郎
    • 技術支援:ネクストリッテル研究所から2名
Ref.Masterとは?
  • NDLが提供するレファレンス協同データベースを活用
  • レファレンススキル向上のツール
  • 楽しみながらスキル向上ができる
  • 達成率に応じてレベルアップ⇒モチベーション維持
開発の背景
  • 授業だけじゃレファレンススキルは向上しない
  • どうやったら向上するのか?
    • 資料を読み込む?・・・スキルとの関係は不明
    • 実務・・・時間がかかる
  • モチベーション維持もスキル向上も大変
    • 実際のレファレンス事例を使ってモチベーションを維持できるツールを作れないか?
Ref.Masterで何ができるか?
  • OpenID採用・誰でも無料で使える
  • ユーザ用ポイントデータを管理:
    • ゲーム感覚で答えているとポイントが貯まる/ランクが上がる。モチベーション維持に?
  • 今のところはNDCの各ジャンルについて問題を出している
デモ
  • デモだよ!
  • レベル・・・採用、見習い・・・トップ、レジェンド
将来の展望
  • システム利用実験
    • 協力を!
  • ログデータ分析・表示
    • ログから利用統計のグラフを分析・表示
  • レファ協へのフィードバック
    • トップ・レジェンド級が複数人誤答する場合、レファ協の方が誤っているかも知れない

「ブクリス:ニュース×カーリル×OPAC + CiNii Books! 『気になる本』と出会える図書館サイト」(関戸麻衣さん、国立情報学研究所

はじめに
  • 図書館OPACにキーワード入れるの面倒くさくない?
    • リアルの図書館で本をさがす/本屋で本を探すのに比べて検索、というものが入ることで本との出会いを遠ざけている
    • そこで旬の話題の本のリストを自動でつくる・・・ブクリス
デモ
  • 中津川市立図書館バージョン・・・トップページに「こんな本はいかがですか」リスト
    • クリックするとOPACにつながる
  • こういうサイトを図書館ごとに作れる⇒ブクリス
サービスが目指したこと:公共図書館で実際に使える
  • 現場の声・・・「公共図書館ではレベルが高すぎる/こういうことがしたい」を盛り込む
    • 設定・日々の利用が難しくないこと/少しの設計変更で各図書館に対応すること
どうやって実現した?
  • 情報源(ニュースサイト等)からキーワードを作る
    • 定期的に更新されるものなら作れる
  • OPACにかける
    • ヒットしすぎる/少なすぎるキーワードは除く
  • 資料リストの出し方:OPACを使う/ブクリスにコピーするのは大変
    • そこで・・・カーリルローカルのAPIを利用/キーワードと図書館IDをセットして検索結果とOPACのURLが取得可能
  • 一館分のデータでできることは限界がある
    • 各図書館OPACに検索をかけないといけない。1リソースにつき100回とか検索することに
    • キーワードが長くなりがちでOPACにヒットする件数が少ない
  • そこで・・・キーワード抽出方法/を選ぶための共通フィルタ
    • 適切なキーワードの選び方:
      • 文章からキーワードを作る
        • 専門用語を切り出す、キーフレーズの抽出・・・オリジナリティがある語が出てくる
        • 形態素解析・・・短めになる。蔵書規模に応じて上の方法と切り替えられるように
      • キーワードからいいものを選ぶ
        • CiNii Booksに検索仕掛けて、本当にヒットするかをチェック
        • 情報源としてどういうものが使えるか・・・新聞、地域ポータル、Wikipediaはてなブックマークの地名タグ・・・
今後
  • 各図書館で使ってもらえるようにAPIを提供
  • 共通フィルタ拡充
  • すべての図書館サイトが「気になる本と出会える場」になる、ブクリス

「俺CiNii」(日高崇さん、株式会社スタジオ・ポットSD)

発端
  • 「自分が興味ある論文(だけ)を漏らさずチェックしたい(40代・国文学系出版社(笠間書院)勤務)」
    • 論文は本の卵なのでチェックするが、膨大すぎてチェックしきれない
    • CiNiiに検索かけて力技で解決しようとしていた・・・自動化したらビジネスチャンス?
  • 切り替え可能な「フィルタセット」による情報の立ち現れを楽しむサイトを作れないか
    • 国文学系の情報がどんどん入ってくる
それをどうやる?
  • SVMを使えばいいんじゃないか・・・激論
  • そこから色々あり・・・実証実験をとりあえずやる
  • Perl + シェルスクリプトのラッパー「Kajiki」作成
    • 被験者検証
    • まずまずの精度?
    • 上位100位の集合に、国分論文の80%が拾えている
    • 対象データは論文1,000本、うち国文は3.1%
      • 欲しいものを濃縮できた
もう一捻り欲しい
  • CiNiiからマッチするもの/しないものを自動分類するwebアプリ
デモ
  • 直近のCiNiiの論文200本を適合状況スコア順に並び替える
    • 自分の興味・関心順に論文の並びが変わる
    • 興味ないものは「今一つ」ボタンを押すとシステム側に情報を遅れる
  • ひたすらスコアを与えていくとシステムが賢くなる
    • 「訓練開始」を押すとモデルが再構築される
    • テストデータを1,000本入れた場合・・・適合度が非常に高いものがいっぱい出てくるように
まとめ
  • SVMを気軽に使えるものを作れればいい、とトライ
  • もう公開しているのでどんどん使える
  • ちょっと重たいがぜひ試してみて欲しい

パネル討論(司会:岡本真さん、アカデミック・リソース・ガイド)

  • 岡本さん:清田さんに。今回、かなり清田さんとリッテル研究所の技術者の貢献が多大にあった。シビアに見て、今回の3作品、あえて突っ込むならどこが課題?
  • 清田さん:順番に。
    • Ref. Master:プレゼンがうまかった。選択肢が課題。フィードバックで精度向上のルートがまだ不明確。
    • ブクリス:合宿の最初はどうなるかと思っていたが、終わるときには明確なものが出てきた。共生プログラミングの実践としていいと思う。実際の公共図書館のユーザ開拓をもっと頑張って欲しい。
    • 俺CiNii:現実的な割り切りをしているのがいい。精度にこだわると時間を食うので、そこをざっくりやったのは評価できる。あえて言うなら・・・我々ももうちょっとお手伝いできたかな、と思う。合宿以外お手伝い出来なかった。共生プログラミングの実践としてはもっとかかわれるとよかった。
  • 三津石さん:ご指摘のとおり。今回はゲーム作った話だが、ゆくゆくはフィードバックに繋げたい。ただ、僕自身、研究としてこういうことをやっているのだが、今回のは研究よりも実運用を目指している。多人数同時使用等に注力している。実運用の中で方向が見えると思う。
  • 関戸さん:最初どうなるか、というのは本当にそう思う。実はチーム内にコードを書く人間がいなかったので、要件整理からリッテル研究所の人とやっていく中でやりたいことも見えてきた。よかった。実際に使用してもらうことができなかったのは残念だが、ブースに出展すると「面白い」との声も。ぜひ実現に繋げたい。
  • 日高さん:今回の最大の収穫はどういう風にものを進めるか。ただ、後半で「ずっと俺のターン」になってしまったのは格好悪かったと思う。ただ、知り合いに「とんかつ理論」というのがある。小麦粉、キャベツ、豚肉、全部いいのがあれば美味しいとんかつが作れる。でもないときは? お好み焼きにしちゃえばいい。手持ちの材料でできることをやった。ただ、とんかつを作りたいときにはもっと違うアプローチをしたいと思う。
  • 清田さん:共生プログラミングの試みはネクストのエンジニアとしても刺激的だった。今の業務にも生きている。収穫は大きかった。もう1つは、アカデミックとリアルの谷、ということで、アカデミックからどこまでリアルに落とせるか。それがうまくいったところが成果になったのかな、と思う。
  • 岡本さん:「共生プログラミング」。「強制プログラミング」ではない>会場へ。京大の石田*1先生が提唱。作り手であるエンジニアと使うユーザ・発注主が一緒に考えて一緒に手を動かす。それをなるべく合宿として一晩やる、という開発手法。日本での実践は2011.01が初、という出てきたばかりのものだが、やってみるとお互いけっこういい勉強になる。これは清田さんにも各メンバーにも伺いたいが、得てして図書館関係の勉強会は色々やられているが、比較的閉じている。図書館員同士で勉強しあうことが多い。悪いことではないが、日高さんはじめ我々の勉強会は出版やweb関係の人もいる。あえて企業の側として、図書館の開発に関わる意味とは? 特にネクストは今回、完全に持ち出しだった。なんの意義がある?
  • 清田:社内の開発はそれぞれタスクがあって動かないといけないが、その枠に閉じると思考も閉じる。視野を広げる機会を設定するのは重要。特に合宿にしたのは良かった。枠を超えるといってもなかなかどうやればいいのかわからないし、外に出たら何が起きるのかもわからない。色んな業界にかかわれるのは良かった。もう1つは、社内への説明と図書館や出版の方に説明するときでは言葉遣いがぜんぜん違う。相手にわかるような言葉にする。プレゼンテーションの意識が高まったのも良かった。
  • 岡本さん:前の3人の中だとエンジニアとの付き合いが比較的あるのは2人。日高さんは自分でやる、三津石さんはCS。でも関戸さんは自分では作っていない。そういう立場から、どう?
  • 関戸さん:CiNii等もやりたいことをお伝えして作っていただく立場。概念的には今回と同じ。ただ、NIIで付き合う業者とはフォーマルな仲なので、フォーマルな会合や書類でのやり取りになる。距離感がある。合宿で膝を詰めて話すようなことができたのはコミュニケーションの意識が変わった。エンジニアも、こっちが本当に何をしたいかわかるとやり方が変わる。それが伝わらないといいものにならないことがよくわかった。
  • フロア:min2-fly:CiNii Booksにブクリス突っ込んじゃえば?
    • 関戸さん:早速やってみます!
    • min2-fly:できたら週に2回くらいは見ます!
まとめ(岡本さん)
  • マイニング探検会について:
    • 今年度ではじめてもう丸二年
    • 今回、こういう成果が出せてよかった
    • 最初の1年間は隠密に・・・メンバーを絞ってやっていた
      • 清田ゼミ、みたいな形、毎回参加できる方に限った
    • 1年目は座学、2年目は手を動かすことにしよう
      • コーディングしなくていいがやりたいことを伝えられるように
  • 知識情報産業にいる人に、技術をうまく活用することを知ってほしい
    • ウェブプロデュースやイベントの仕事はしているが、私はコードは1行も書いたことがない。それでも仕事はできる。
    • 今の図書館webサービスははっきり言って不良品レベル。9割くらいは。
    • 不思議でしょうがない。なんでこんなレベルのものを提供しちゃうのか? ベンダにはベンダの言い分もある。
    • 課題は、図書館の中の人が技術者とコミュニケーションする力・意思を持っていない
      • 気持ちはわかる。技術者はテクニカルタームがなんだか理解していない。「コンパイル」とか当たり前に言うが意味なんかわかるわけがない、手を動かさなければ
      • 技術者に日常用語で話せというのも難しい。そこでいいのが、自分たちがやりたいことを明確に言語化すること。
        • 綺麗なPPTを作るとかいうことでもない。紙に手書きのスケッチでもいい。何度もやっていればスケッチもうまくなるし、技術者も理解してくれる。
        • そうやっていれば技術者も相手がどういう表現をすればわかってくれるかという、言葉の使い方も努力してくれるようになる
  • マイタン第2期は実際に作れること、アイディアを形にできること、皆で考えて伝えてものを作ることを重視
    • これができるようになれば図書館のものつくりは変わるだろうし、図書館のwebサービスも変わるはず
    • 最近はカーリルが非常に人気。でもカーリルで衝撃を受けること自体、終わってる。彼らは当たり前のことをやっている
      • あれを特別視せず、図書館だってできるんだと思って、少しでも取り組んでいただけると嬉しい
    • アカデミックとリアルの谷を埋めるのはそういう皆さんの少しずつでもの努力
  • 最後にマイタンの紹介・・・詳しくはググって!
    • もう電源がないのです



最後が尻切れトンボになったのは申し訳ないですが(大汗)
3日間、記録とりっぱなしでこの子(ノートPC)ももう限界だったのです。
電源資源は有限。


なんだかんだ総合展後も忙しなく、まだ僕も紹介された各システムを詳細にはいじれていないのですが、話を聞く限りどれも面白そうで、使ってみたくなる魅力がありました。
特にリコメンデーション系は・・・なにせ「最近の趣味はAmazonのリコメンデーションを修正することです!」とかいうくらいにたんたんと「好き、嫌い・・・」ってクリックしているような日々なので(研究しろ)。
ブクリスも俺CiNiiも、使い出すとえんえんやってそうで恐ろしい・・・それでいくとRef.Masterもむきになってずっとやってそうですがw


その後のマイニングナイトも興味はあったのですが、さすがに3日間タイピングしっぱなし、かつボストンバッグいっぱいにもらったブース資料の重みで肩も限界、ということでその後はまっすぐ帰りました。
これにて図書館総合展記録シリーズ、全編アップ完了です。


3日間、お付き合いいただいた皆さん、ご挨拶させていただいた皆さん、フォーラムやブースで面白い話をきかせていただいた皆さん、ありがとうございましたm(_ _)m
おかげさまで大変楽しい3日間でした・・・来年は自分も参加イベントを増やしたいですね!
・・・って初日はたぶんいないのですが、日程的に(汗)


来年の総合展は11/20、21、22の3日間開催とのこと。
今年は参加できなかったみなさんも、あるいは今年なにか刺激を受けて来年は出そうと思っている皆さんも、今のうちから予定をあけたり準備を始められては、とかなんとか。
翌年、みなとみらいに再び立つまでが図書館総合展なのですよー。

*1:2011-11-13 岡本真さんのコメントを受け修正。大変失礼しましたm(_ _)m