かたつむりは電子図書館の夢をみるか(はてなブログ版)

かつてはてなダイアリーで更新していた「かたつむりは電子図書館の夢をみるか」ブログの、はてなブログ以降版だよ

2010年日本図書館情報学会春季研究集会に行ってきました


そろそろ春というより初夏の陽気、あるいは梅雨の気配も漂う昨今ですが(苦笑)、2010年日本図書館情報学会春季研究集会に参加して来ました!


今回は僕自身は発表担当はないのですが、研究室の後輩の発表に共著者として参加しています(内容の詳細は後述)。
会場は同志社大学今出川の新町キャンパスで、期間中は後輩ともども京都在住の先輩のおうちにお世話になっていました。
この場を借りてあらためて、先輩ありがとうございましたm(_ _)m
5月末の京都は天気も良く、実に気持ちのいい学会でしたー。


以下、いつものように発表等のメモ・・・ですが、今回は発表数も多いですし、かつ会場を移動する際にタイミングがずれて最初からメモできなかった発表等もあり(苦笑)
メモが上手くとれたものについてのみ、公開させていただきたいと思います(min2-flyが聞いた発表の全数ではないです)*1
特に午後の後半が全然メモが取れていませんが、これは主に前週からの疲労の蓄積で起きたままダウンしていたためです(汗)


また、メモの内容は例によってmin2-flyが聞きとれた/理解できた/書きとれた範囲のものであり、その点についはご了解いただければ幸いです。
正確/詳細な研究内容等の確認については要綱等を実際に閲覧していただくか、著者の方にご連絡いただくようお願い致します。
なお、記録の都合上、発表者の方の敬称はすべて「さん」で統一し、所属は省略させていただいています。
内容に誤りを発見された場合等はコメント欄などでご指摘いただければ幸いです。
また、公開に問題がある場合はメール等にてご連絡いただければと思います(メールアドレスはプロフィール参照)。




学際的研究領域の論文における引用パターンの変化(清川朝日さん、鈴木崇史さん、芳鐘冬樹さん)(第二会場午前1つめ)

  • 学際研究・・・分野が複合してなされる研究
    • 複雑した社会的問題への対応
    • 複数分野の共同による研究分野の高度化
    • 新領域
  • 学際研究そのものの研究も盛ん
    • ex) 研究領域の学際性を測定する
      • 研究者の学際性、研究分野の学際性、論文の学際性
    • 本研究では研究分野の学際性をいかに特徴づけられるかを分析
  • どうやって学際性を見る?
    • 学際研究・・・一意に「何」を定義することは難しい、一般的な定義はない
    • 本研究では定義はとりあえず置いておく。分野の学際性は分野の引用文献から特徴づけられる、とするアプローチ
    • 「学際的」とされる分野を分析してみる。どうやったら学際性を測れるか?
  • 学際性を測る先行研究も当然存在する
    • 分野の学際性・・・代表的なもの:引用関係にある分野の数(どれくらい多様な分野を引用しているか)/ネットワーク分析(全体の構造がどうなっているか)
    • 多くは引用している文献の属する分野の数の測定が中心
  • 問題意識
    • そもそも「学際性」の様態は変化するのではないか?
      • 主題/分野。数学分野の学際性と生物学の学際性は異なるのではないか。分野をまたいで学際性は比較できない
      • ある研究分野があったとして、研究背景、手法、目的意識が異なるのであればこれまでのやり方では不十分
  • 本研究の狙い
    • 学際的な研究分野を特徴づける傾向を探る
      • 分野の数以外に有用な指標はないか?
    • 学際性と言う動的な性質に関する知見
      • 時々に変化する学際性がどのように指標に表れるか?
    • これまで着目されなかった観点・指標の導入
  • 分析対象と導入した指標
    • データはScience Citation Indexから取得
      • 学際性の高い分野/低い分野を主題ごとに特定して分析
    • 導入した指標
      • 引用文献の属す分野の集中度:異なり数=絶対的集中度/プラットの尺度=相対的集中度
      • 引用文献の最新性:引用文献の平均年齢
  • 結果と解釈
    • 分野の異なり数・・・学際的とされるものはより多くの分野を引用している?/生物学の学際性が低いとされるものは多くの分野を引用している
    • プラットの尺度・・・非学際的分野は引用する分野が偏っている/学際的な分野の方が引用する分野は分散
    • 平均引用年齢・・・特にはっきりした傾向はなし。学際/非学際の区別には使えない
    • 分野の異なり数 V.S. プラットの尺度で散布図を作成・・・解釈を説明
    • プラットの尺度 V.S. 平均引用年齢の散布図・・・解釈に困る
  • 総括と今後の展望
    • 学際的分野の特徴
      • 引用している分野の異なり数は多い(既出)/引用分野の偏りは小さい
    • プラットの尺度
      • 図書館の蔵書の分類の偏りを示すもの
      • 学際的分野の方が偏りが少ない/異なり数だけで見られないものも見られる
    • 引用年齢については一貫した結果を得られず
      • 今後、同様の指標を用いる際にはどうすればいいか再検討
      • 経時的な分析についても同様に再検討
  • 質疑応答
  • Q:分野ごとの異なり数というのは、単純に足し合わせた? 引用数ごとの平均をとった?
    • A:SCI中でSCが出る回数。のべ回数ではなく異なり数。
  • Q:ものによって引用文献数が違うので単純に足すと引用数が多いと引きずられない?
    • A:今回の対象の中では極端な差はなかった。分野の異なり数はデータ数が小さくなると現れる回数が減ってくるので学際的でない方が上回ることもあるのかも。データが増えれば改善されると思う。
  • Q:一雑誌が複数分野を付与されているときは分野数が増えるのでは? 領域内が細かく分けられているときとか
  • Q:two step mapみたいなのと同じように、生物学分野のあるアトランダムに抽出した論文がどういう分野からひかれているか、の方が学際性が見やすいのでは? ある論文が引用しているものを見るのでいいのか?
    • A:今回の研究では何が何を「引用している」方のみを見ていたが、おっしゃる通り逆方向を組み合わせた研究もある。今回の研究ではそこまでのことはできなかった。データの問題もあるが、そのようなことを加味した方が多様な解釈が出来ると思うし、有用と思う。今回やりたかったのは、分野の数だけではない別の観点を取り入れたかったというのがあったので。
  • Q:被引用文献の中で原著論文だけ? レビューは入っていない?
    • A:原著論文だけ。レビューを組み入れることもできたが、原著に限定した。
  • Q:学際性の高低をどれだけ離れた分野から引用しているかと言う、分野間の距離を考える予定はある? 予稿集の注釈の中でSCIでなくSSCIやAHCIがカバーする文献は量が少ないので対象から外したとあるが、実は学際性が高いと言うのはそういうそもそも自然科学ではない分野からひかれているものの方が、素人考えでは学際性が高く思うが?
    • A:おっしゃる通り。今回は分析が間に合わなかったというのは言い訳にしかならないが、検出率(被引用文献の中で主題を特定できたもの)が3~6割にいかない。主題分野が特定できたものに限定したためこのような結果になったが、SSCIとAHCIも今後検討したい。

ブログやTwitterに書かれた疑問を収集・提供するウェブサイトの構築:レファレンスサービスのアウトリーチに向けて(荒井俊介さん、辻慶太さん)(第二会場午前3つめ)

  • 本研究で扱うのはブログ、Twitter
    • その中には日常的な疑問も多く含まれている
      • ex) 本の内容は覚えているがタイトルは思い出せない/おすすめの本はないか、etc…
      • その中で図書館のファレファレンスサービスが得意そうな質問に焦点を当てる
      • そうした質問でも放置されて誰も答えてくれないことはある
        • 質問がweb上に分散していて、回答してくれそうな人も質問にたどり着けていないから
        • 質問を収集すれば答えを得やすいのでは?
        • それを図書館員が答えればレファレンスのアウトリーチになるのでは? そこから交流も起きるのでは?
  • 関連する研究の紹介
    • web上の質問に図書館員が積極的に答えることは有効であると考えられる
    • 都道府県立図書館の職員はQ&Aサイトよりも高い回答能力を有するとの研究も
  • 調査・実験手法と結果について
    • 構築するwebサイトの有用性調査
      • ブログの中には疑問は書かれているのか?
        • サーチエンジンを使って調査。数は少ないが疑問の書かれたブログ記事もある。
        • 手作業での収集は困難である
      • 疑問があっても回答が難しいのでは?
        • サーチエンジンで発見した質問をdigital referenceとQ&Aサイトに投げてみる
        • 13件中8件でレファレンスから具体的な回答が得られる/Q&Aサイトでは6件に回答
      • 見知らぬ人が回答すると気味悪くないか?
        • 上で得た回答をブログのコメント欄に書いて見た
        • 5/8で著者から感謝のコメント。3件はブログの更新が停止していたもの。
      • 本研究で構築するwebサイトは有用である!
    • 疑問の書かれたブログ記事の収集
      • 学習用に2つのコーパスを用意
        • 疑問の書かれたブログ記事100件、それ以外を1,000件
        • コーパスから得た手がかりから機械的に疑問を収集したい
        • 疑問の書かれたブログ記事を自動的に収集してくるようなシステム
        • テキストの自動分類から構築
    • テクスト自動分類
      • クラスタリングとテキストカテゴライゼーション(後者を採用)
      • 分類ルールをコーパスから取得、それを各テキストに適用して分類
    • 抽出方法の説明
      • Naïve BayesとSVM
      • Naïve Bayes:疑問が書かれていないのに疑問が書かれているとされたものが3割。改良が必要
        • 得点に閾値を設定することで改善
      • SVM:2単語列を使うと非疑問ブログの誤判別率が低い。疑問の書かれたブログの抽出率も低いが、精度は高い
  • まとめ
    • 有用性調査より:作ろうとしているサイトは有用
    • 自動抽出の方法について検討
    • 今後はシステムの構築/Twitterへの適用などを検討
  • 質疑応答
  • Q:実際の図書館のレファレンスだと「探している本よりいい本がある」というようなことを図書館員と利用者でやり取りすると思うが、今回の回答でも同様のものはあったのか? また、ブログやTwitterで「タイトルが思い出せない」というのはどういう主題が多い? 小説なら選択肢は少ないが、自然科学や社会科学では幅があると思う。
    • A:具体的にある本を指定されたものがほとんど、1件だけ似たような違う本が答えられたものもあった。今後はそれも含めた方がいいかとも思う。2点目は、ブログやTwitterに含まれる質問はほとんどが小説。ある分野についてこういう本を探してほしい、というようなものは今回の研究では出てきていない。
  • Q:Naïve Bayesを使うのは妥当か? Bayesに多項分布と特徴量を使って、とかの方がいいのでは?
    • A:簡単でSVMに精度が劣らないと聞いたので試しにNaïve Bayesを適用した。今後は他の方法もやっていきたい。
  • Q:学習に用いるのは記事単位だと思う。今後Twitterをやられるとのことだが、Twitterだと他のポストで気になることを言って、その後質問、というような分割があると思うが、そこのアイディアはある?
    • A:質問の中でまた新しい質問ということ?
  • Q:気になるところを前に言って、その後質問になるとか。
    • A:そちらについては・・・。今回は記事単位で疑問が出てくることが多かったので抽出しなかったが、疑問の部分だけ切り取るというようなことはしようと思う。そこで分割した質問、というものも見つけられれば。
  • Q:今回の研究で対象としたのは各社のブログサービスを網羅的に見た?
    • A:全く網羅的ではない。Yahoo!Googleブログ検索で、検索ワードも指定している。
  • Q:だいたいどういったブログサービスが出てきた?
    • A:あまりそういったところは見ていなかった。
  • Q:もしブログサービスによって、例えばはてなアメブロだと傾向があるとかだと面白いと思ったが。
    • A:今後、考慮する。
  • Q:都道府県の図書館のサービス向上とのことなので、タイトルだけでなくそういうものもコーパスにあると面白い。

学術論文PDFの自動判定:学習用集合が判定性能に与える影響(宮田洋輔さん、安形輝さん、池内淳さん、石田栄美さん、上田修一さん)(第二会場午前4つめ)

  • 日本語学術論文PDF検索システムを開発している
  • システム(アレセイア)の構成
    • webから集めたPDFを機械学習で論文か、別のものか判定
    • 利用者は論文だけを検索できる
  • システムを運営するには・・・学習用集合が必要
    • 論文/非論文を学習するための、判定済みの論文/非論文の集合
    • 今回はこの学習用集合に焦点
    • 人手による学習用集合の作成は高コスト
      • 収集コスト:webから学習データを集めてくるコスト。クローリングor人手
      • 判定コスト:収集したファイルの分類。論文or非論文のラベルを付ける。人手or何かの基準で自動判定?
  • 研究目的:学術論文の判定に適した学習用集合の構築手法を明らかにする
    • そのために・・・コストの異なる4集合を作成、それらの集合の判定性能を検証
  • データ収集・論文判定について
    • 集合は機関リポジトリ、雑誌ディレクトリ、web、大学サイトの4集合
      • リポジトリはOAI-PMHで、webはサーチエンジン、他はロボットで
      • 判定はリポジトリは自動、他は人手
      • リポジトリはOAI-PMHを使って取ってきた104リポジトリメタデータからfulltext URLを抽出、574,374件のURLを取得
        • junii2のNIItypeから判定を実施
        • 全文ファイルから20,000件を無作為抽出、Journal Articleのみを論文として機械的に判定。3,115件の論文PDFを取得
        • 収集・判定ともに低コスト
      • 雑誌ディレクトリは旧DOAJJ、現「日本語学術雑誌情報源ナビ」からPDFリンクをロボットで取得
        • 3,562件のPDFファイルを取得、判定者が論文と非論文を判定。
        • 学術的なPDFファイルが中心。人手による判定ではあるが、web全体から収集した集合に対する判定に比べると判定コストも低い。
      • webは2005.5と2005.11にファイル取得。今回はサーチエンジンYahoo!)でファイルを取得。言語は日本語、ファイルはPDF。544,096件のファイルを取得
        • そこから20,000件を無作為抽出、判定者6人で論文/非論文を判定。371件が論文PDF
        • 機械的収集が出来るのでコストは低い/学術論文の割合は小さい。判定コストは高い。/学術論文以外の内容を含むことが機械学習に有効に働く可能性も
      • 大学サイトからの収集:2009.8に筑波大学のwebサイトをクローリング。29,595件のファイルを取得
        • 重複ファイルを除去し2,000件を無作為抽出。判定者3名で判定、17件が論文PDFファイル。
        • 雑誌ディレクトリ集合よりは幅広い内容を含む/web集合よりも学術的なコンテンツは多い。両者の中間くらいの位置付け
  • 判定実験
    • ルールベースによる特徴抽出・・・ファイルの属性/テキスト抽出
    • 判定手法はない―部ベイズ、判定対象は学習用集合を判定にも使う
    • それぞれ作った集合をぶつけ合わせる形で判定実験を実施。4*4 = 16通りの実験
    • 結果の評価はF値と判定制度。F値は論文だけ、判定制度は全体の判定結果を分析
    • 結果・・・F値:機関リポジトリで学習し、他を判定しても精度が低い。機関リポジトリから他も同様。
      • 判定制度でも同様。機関リポジトリではあまりうまくいかない。
      • 機関リポジトリはコストは低いが性能も低い。他は若干異なるが性能は高い。構築コストと性能を考えると雑誌ディレクトリや大学サイト等を学習用集合にするのが適切?
      • 我々の考えている論文と違う基準で論文か否かの判定が行われているのではないか?
  • 考察
    • 学術雑誌ディレクトリや大学サイト等のような学術的コンテンツを持つサイトを起点として、PDFファイルを収集し学習用集合とするのがバランスが取れるのでは?
  • 質疑応答
  • Q:機関リポジトリの機械判定でJournal articleを論文とするのは他の基準と違うのでは? 紀要論文や学位論文を論文としないのでは基準がずれていて、他と比較できる形になっていない
    • A:機関リポジトリの基準が全く違うことは最後にも述べたように気付いている。ただし、これが違っているだろうと思いつつ判定にうまくいくのであれば学習用集合にうまくいくんじゃないかと考えていた。比較自体は変なことではないかと思う。
  • Q:機関リポジトリにある学位論文は他では論文となるが、機関リポジトリでは非論文になる。
    • A:最終的な成果でうまくいくのではないかと考えた。また、紀要論文等を含めた判定も行ったが、こんどは判定がうまくいかなくなる。さっきよりももっと精度が落ちる。
  • Q:精度と再現率でどの程度の精度と再現率に基準を設定しているのか?
    • A:精度と再現率は得られればいいに越したことはないが・・・今回の研究では方法論的なところは関係なく、どれくらいの違いがあるのかが関心。ただしナイーブベイズを判定方法に選んだのはこれまでの成果からある程度の性能が得られる。
  • Q:機関リポジトリでどんなものが悪さをしているのか、ということが推測できないか。もう一つは、機関リポジトリ以外の集合でも正解セットを混ぜて使うとどんなことが起こるのか? その他は混ぜると性能が上がる、下がる?
    • A:失敗分析は今のところしていないので、今後やって実際にどういうものが悪さをしているのかを見て、調節すればうまくいくのではないかと思う。2点目は、全体を判定先として見た場合にどうかということかと思うが、今のところはやっていないが・・・数字のバランスは取れているように思うので、そんなに変わらないのかなとも思う。
  • Q:p.73の表2について、それぞれどう使われたのか?
    • A:ファイルサイズがどういうものは論文、等と言うような組み合わせを作って入れた。

OPACのFRBR化を目指した人手による著作同定作業:FRBR研究会の取組み(谷口祥一さん、上田修一さん、横山幸雄さん、鴇田拓哉さん、向當麻衣子さん、宮田洋輔さん)(第二会場午前5つめ)

  • FRBR OPACについて
    • 海外には実例多数
    • Worldcatの例。体現系に貼ってあるリンクをクリックすると、同一著作として判定されたものが出てくる。しかし機械的にやっているのでミスもある。それでも大胆に公開
  • 同じことをやりたいが・・・
    • JAPAN/MARC書誌レコードでやる。著作に関する情報が少ない
    • 簡単な例はうまくいくが難しい例は歯が立たない。該当する書誌レコードの数も多いし無理だ
    • 快適にやるのは無理?!・・・既存の書誌レコードに人手で著作同定作業を実施
      • 著作同定は一度行えば、繰り返し行う必要はない。複数機関で共有できる
  • 作業対象としたレコード
    • J-BISC DVD版で明治期から2009年3月までに収録されたもの
      • できるだけ包括的な検索で抽出されるもの
      • ノイズが多いのは承知で、"or"検索で候補レコード群を作成
        • 人手によって判定
  • 該当する著作のタイトルが出現する箇所を記録
    • 実際にやっている記録の例を表示
    • 単一の書誌レコードに複数の著作を同定することも認める
    • 紛らわしい例(同一著作としなかった例)も記録している
  • 著作同定の基準
    • 原則として書誌レコードのみ見る
    • 国会図書館のこれまでの方針と作業結果をできるだけ活用する
    • 古典著作に特化した基準
  • 集計結果
    • 必要な項目群全ての集計を進めている
    • 例:『源氏物語』・・・4,112の作業対象ファイル/1,044件の著作に属すると判定されたレコード。以下、判定レコードの詳細
      • タイトルが『源氏物語』ではないものも多数含まれる
      • 内容注記でもタイトルのバリエーションは多数
      • 責任表示もバリエーションは多数
      • 著者標目も紫式部が標目に出ないことも
      • 分類:913.366 「源氏物語-訳文」や913.36「源氏物語」も多いが、さらに上位の913.3やそれ以外も
      • 分類標目も分散する。分類記号で著作を絞り込むのは難しい
      • 出版年:コンスタントに『源氏物語』は出版されている
    • 例:『枕草子』・・・同様に各項目は多様
    • 例:『伊勢物語』・・・無著者の著作の例。
    • 例:近代著作・・・『一握の砂』(石川啄木
  • 今後の課題
    • 判定結果の妥当性、ある程度は信頼できるがダブルチェックや第三者確認をすべきか?
    • 細々やっているので作業が進まない。作業体制を拡充するにはどうすればいいか?
    • 持っているデータはJAPAN/MARCだけではない。他のものも同様に判定できないか? その方策は?
    • どこかで機械判定もいる。どうするのが妥当なのか?
  • 質疑
  • Q:web上の情報を参考にすることもあるとのことだが、どの程度どういうものがあった?
    • A:原則書誌レコードで判断、難しいものもあるがそこで決める。補助的に、より詳細な情報、かつ容易に見られるweb情報源を見ることもできる、と。該当するものがオークションにあればそれを見るのは禁じはしないが、全員がそれを照合しているわけではない。もっと使えるものがあれば教えて欲しい。
  • Q:書誌レコードにかけているデータの知見は得られていない? 何がwebで補えたかは得ていない?
    • A:説明が少しある。場合によっては開いた目次や中身の一部を画像で示しているページもあったりする。それらが場合によっては使える。
  • Q:作業に携わった方のスキルは? 研究者? どういう方? 作業者の養成についても含めて
    • A:今の体制は発表に名前の書いてあるメンバーだけ。目録を経験されている方から、実務としてはやったことがない人間までさまざま
  • Q:p.76に著作とするものと異なる著作とするものの判断基準があるが、「異なる著作」にするものは理由がある? 漫画は違うとするが、「あさきゆめみし」は源氏物語ではない?
    • A:原著作以外の人の付加的な知的行為がどの程度含まれるかによって決めている。漫画は漫画家の手がある。一方で、我々が探す側となるときにどこまでを見たいか。人によっては漫画もみたいだろうが、そういう両方を持って「えいや」と決めているところはある。微妙な部分は含んでいる。
  • Q:今回の作業結果の中に関連情報は記録されている?
    • A:ない。関連というのはある著作と、それと認めなかったケースがどういう関連かということかと思うが・・・
  • Q:「〜なので同一著作」などの記録
    • A:取っていない。同一著作とした場合も、しなかった場合も関係については記録していない。ある著作についてある方がやってみたというのはあるが、他の著作も全てやろうとすると難しくなるし、判断の揺れも大きくなる。現時点ではその点は放棄している。
  • 発表者:最後に追加で。今は人手による集計結果を蓄積している。その公開方法だが、一つはOCLCが実験的に機械的に同定した情報を見せるインタフェースを作っていた。それにしたがって集計情報を見せる、さらには同定したものの簡略書誌レコードを見せて、そのリンクをクリックするとNDL-OPACにつながるというような人間向けインタフェースを作りたい。もう一つは、APIで公開してISBNの情報なりを返すといった形での公開を考えている。これを使って何をどうするかは煮詰めていないが、色々な活用法があるのではないか。

NDC Finder:自由語からの主題検索機能を提供する図書館OPAC検索支援システム(松本聖さん、谷口祥一さん)(第二会場午前6つめ)

  • 研究背景と目的
    • 図書館で主題から資料を探す際の、「異常なまでの不便さ」
      • 目録は全て電子化され、OPACとして公開されている
      • しかし電子化された目録は目録としての機能を果たせているか?
        • 目録には未知の資料を主題から探す機能もある・・・しかしカード目録の頃から進歩していない/利用者には使いにくい
      • NDCを持つ図書館には主題からの検索に有意性がある
        • インターネット等の普及で図書館の存在意義への疑問も出ているが、図書館の有用性を認識し、十分に活用してもらうにはわかりやすい主題検索インタフェースが要る
    • 特段の知識がなく、主題検索をできるシステムを構築したい
      • NDCを活用する(本表+NDLSHと相関索引)
  • データとDBへの格納
    • データ・・・NDC機械可読9版
      • 分類記号の桁数を基準に分類深度を設定(000は0、010は1、012は2・・・など。不均衡記号、縮約記号も反映)
    • NDC相関索引/NDLSH
  • 作成した検索システム*2について
    • 利用者はwebブラウザを使ってシステムにアクセス
    • トップページでキーワードを入力、選択ページで適切なキーワードを選択、分類表から分類を確認、図書館システムで検索
    • デモ・・・なるほど、これは面白そうだ
    • システムの利用状況:公開から現在までにどのような利用があったか?
      • acドメインが全体の4分の1
      • アンケート結果から、図書館員や図書館情報学者ではない一般の利用者が3分の1を占める。
      • 利用者の多くがこのシステムを今後も使うとしている。
      • 「図書館員にとって使える」という自由記述と、「一般利用者には使いにくい」とする意見の両方があった
      • 「利用法の説明が不十分」とする意見と、「調べたいテーマの分類がわかってよい」という意見
  • 課題と考察
    • 検索ボックスに図書のタイトルや著者を入れてしまう例もある。NDC Finderではゼロヒットになるので、書誌データを合わせて検索できるようにすることもあるかも
    • 利用者の曖昧な調査主題を明確化するためにこのようなインタフェースにしたが、寄せられた意見からは分類表から利用者がテーマを選ぶのは困難とも意見も。分類を明示しないインタフェースも必要か?
    • 評価方法が自由記述やアンケートにより、数量的に行えていない。
  • 質疑応答
  • Q:相関索引の言葉のデータ処理をするにあたって、どのようなデータ処理を?
    • A:(ごめんなさい、min2-flyがNDC関係はへっぽこなので質問の意図と回答内容が理解できませんでしたorz 8類と9類がうまく動かないのでは、との指摘)
  • Q:シソーラスや分類からデータベースを検索する方法は従来から専門的なDBの中では利用されてきた。そういった面からの経験の蓄積や利用動向のトレンド等を、NDC Finderを作る際にどのように参考にされた?
    • A:今回システムを作った目的は主に公共図書館を対象に主題検索を補助したい。別の観点で大学図書館の研究者向けも考えているが、そちらはNDC Finderの対象ではない。大学図書館はファセットや件名から出来るのでは、と思うがまだやっていない。
  • Q:図書館に限って検討されているが、同じような機能は図書館以外の情報源にも用いられている。それは考慮されていない?
    • A:その通り。
  • Q:日本図書館協会から許可を得て公開したのだと思うが、恒常的に公開しているとNDCがいらなくなる。日本図書館協会はNDCを高いお金で売っているが、そのあたりはどうなる?
    • A:それは私はJLAの人間ではないのでなんとも言えないが、意見を言わせていただければ、冊子体か機械可読版でも変わる。冊子版は、NDCは図書館や専門機関で買っていると思うが、それぞれ適用細則を用いているので自館用がいると思うし、NDC Finder自体恒久的には公開しない予定である。研究が終われば閉じると思う。
  • Q:NDC suggestの開発をしている、似たようなシステムを作っている。OPACへの実装を考えられているとのお話だが、今のインタフェースでは画面的に出来ないと思う。OPACに実装する際のインタフェースの考えがあれば。
    • A:色んな観点で難しい。
  • Q:一般的なOPACは蔵書検索の結果を表示する、その一部に補助的に表示するのが普通と思うが、そういうインタフェースとして考えはある?
    • A:実際に利用者が使うにはいらない項目を省略して、左端に分類表を簡易表示、メイン画面で本自体を表示する、あるいは分類表で蔵書件数を表示して、そこからジャンプして蔵書一覧に移る、などを考えている。

図書館の遠隔利用者に関する調査手法の比較:国立国会図書館ウェブサイトを事例として(安形輝さん)(第二会場午後1つめ)

  • ここでの遠隔利用者とは?
    • 図書館webサイトの利用者
      • サイト利用者にサービスはきちんと行えているのか・・・図書館評価
      • 図書館がwebサイトにアクセスしているか・・・図書館広報
      • 遠隔利用者の調査手法の特徴を整理し、効果的な活用法を明らかにしたい
      • 国立国会図書館を例に各手法の結果を評価する
  • 遠隔利用者調査法
    • 利用者アンケート
      • 回答者がどの利用者層に属するかが不明
    • アクセスログ分析
      • サーチエンジンのクローラ等によるアクセスが膨大に含まれている(排除が困難)/分析のノイズになる
    • 調査手法の妥当性の検証には互いの比較が必要だが、アンケートとアクセスログ分析には共通する項目が設定しにくい
    • サイト分析ツールを手法の一つとして提案したい
  • 各手法の比較:データ収集
    • アンケート・・・利用者に調査
      • 来館者への紙/遠隔者へのフォームなど
      • アンケートに協力した人のみが対象となる
      • 項目としては属性、満足度、意見等。アクセスの詳細分析は困難
    • ログ分析・・・サーバの記録に基づく
      • 利用者のページ遷移等、詳細な部分がわかる
      • アクセスのほとんどはクローラ。たいていのwebサーバにアクセスするものはクローラ
      • ページ遷移分析は繊細で、クローラの影響を強く受ける
      • クローラの排除が最も重要になる/有名なクローラしか排除できない。商用・研究用で頻繁に新しいものが生まれる。COUNTERも新しいクローラには対応できない
    • サイト分析・・・ネット上のトラフィックサーチエンジンのログに基づく
      • 運営者が提供するのではない、第三者が提供するもの。Doubleclick Ad Planner、Alexa等
      • 無料ツールでもかなりのことがわかる
      • 学歴、年収など他では得られない利用者属性までわかることも(調査法は不明)
      • クローラの影響は受けにくい
      • 1日にアクセス数が1万以上ないと適用できない/データ収集法は非公開であり、研究に用いるには不向き
    • それぞれの対象が違う
      • 実施コストはアンケートは高い、ログ分析は低い、サイト分析ツールはほぼゼロ
  • 国会図書館への適用例
    • 利用者アンケート・・・NDLでは直近は2008年に実施
      • 結果はwebで公開されている
    • アクセスログ分析・・・2008.1-2009.12のNDLへのログを、AWStatsで加工済みのものを提供してもらった。クローラ排除はAWStatsブラックリストによる
    • サイト分析ツール
      • DoubleckickとAlexaを使用
      • 性別、年代、学歴、年収等のデータが出てくる
      • 学歴レベルで見ると・・・NDLは慶應より高卒以下が少なく(受験生が見ない)、情報処理学会より大学院卒が少ない
  • 共通項目の比較
    • 国別アクセス数:アクセスログ分析(TLD)とサイト分析ツールを比較
    • 日本が1位なのは共通/アクセスログは日本が低く出る。4位にルーマニアが入る
      • gTLDをアメリカとした影響もあるが、ルーマニアは説明がつかない。アクセスの時期も一時期に集中。クローラ排除に失敗?
    • アクセス数:ログ分析とサイト分析ツール
      • 結果はかなり重なりあう
      • サーチナビの有用性が示唆される(アクセス数が増えている)
    • 利用者の年代:アンケートとサイト分析ツール
      • アンケートでは30代が最頻、分析ツールは45-54歳が最頻
      • アンケートの回答者の年代に偏りがある?
  • 国会図書館への適用例からのまとめ
    • アクセスログはクローラに汚染されている/利用者アンケートは年代に偏りがある等がわかった
    • 複数の結果を比較することで得られることがある
    • サイト分析ツールの併用の有効性
  • 質疑応答
  • Q:ページ遷移分析がロボットでうまくいかないという図を見せていただいたが、どういう仕組みでどううまくいかないのか補足いただきたい。
    • A:クローラは機械的にアクセスするので、なんらかのアルゴリズムに基づいて移動する。NDLで言うと、NDL-OPACへの移動は設計者としてはメニューから行って欲しいと考えているが、多くの利用者は一度、「資料の探し方」に行っている。しかしロボットがそう動くことが多いのであれば、その経路だけ分析しようとするとクローラの深刻な汚染を受ける。
  • Q:ロボットのトラフィックを排除しないで遷移分析を見れば、太い遷移を排除すれば人間が見えるのでは?
  • Q:Alexaの結果について教えて欲しい
    • A:AlexaのデータはDoubleclickに比べて、インターネット全体の平均よりも高いか低いかで結果が出る。数字としては出ない。
  • Q:アンケートはコストがかかるので、ご紹介いただいたものがきちんと使えるなら資するところはあると思うが、信頼性は? 図書館評価に使うデータは信頼性が高くないと危険であって、やってない方がいいということもあると思うが。
    • A:「併用」と言っているのはそのため。メインはアンケートやログ分析であって、その結果が逸脱していないかの検証のために分析ツールを使うのはどうか、という提案。
  • Q:結局、ログ分析はログはわかってもユーザについてのそれ以上のことはわからない。サイト分析ツールはユーザに関するどんなことがわかって、それをインタフェースの改善等に使えるのか?
    • A:分析ツールはそのツールの方針にもよるが、かなり大雑把なもの。しかしながらDoubleclickはGoogleがやっているので、その検索結果はログ分析よりもいいかも。利用者の動きの分析等に使えるかは微妙。サイト分析ツールの中でもweb beaconという、ある種のタグを自分のサイトに埋め込むことでより詳細な分析ができるものもあるが、そちらを今回紹介しなかったのは、図書館webサイトにはあまりなじまないと思う。全てのデータを外部に握られてしまう。一サービスとして使えばコストはかからない。
  • Q:今回の結果をもとに今後の研究展望を簡単に補足いただければ。
    • A:もともとあまり図書館と言う言葉が入った研究をしていなかったのだが、第一部会で発表したくてこのテーマにした。夢破れて第二部会だが、次こそは向こうの部屋に行きたい。

図書館における情報探索行動(安蒜孝政さん、市村光広さん、佐藤翔、寺井仁さん、松村敦さん、宇陀則彦さん、逸村裕さん)(第二会場午後2つめ)

  • 背景
    • 電子情報源の発達・・・若年層の情報探索に変化が起きているのではないか?
    • 学生の情報探索行動についての研究が増えている
      • 寺井ほか(2008)、市村ほか(2009)など
      • 本当に学生固有の行動か/一般的なものなのかの検証は不十分。検証したい。
    • 情報探索行動に影響するもの・・・検索技術の有無/年代(digital nativeか否か)
      • 今回の対象はスキルのないdigital native(学部1年生)と、スキルのある非native(30代以上の図書館員)。両者の実験結果を比較する
      • 電子・紙両方の媒体にアクセスできる環境として、筑波大学中央図書館を設定
  • 実験方法
    • 被験者にレポート課題を与え、その執筆のための情報収集をさせる
    • 課題では「地球温暖化の議論について整理する」というテーマで情報収集(webと図書等)をさせる。被験者の行動は映像、操作記録等を収集
    • 眼球運動を測定する装置もつけて貰う。視線データを収集、さらに頭部につけて動き回れるタイプの装置なので書架の視線も追える
  • 分析結果
    • 一部はDLワークショップでも発表。
    • 図書を使った学生は7/16。図書館でやっているのに本を探しに行かないものも多数。手軽さ/早さを被験者は重視する。
    • webは学生・図書館員とも全員が使っている
      • 学生はサーチエンジンとそこから探せるサイト、図書館員はweb DBがメイン。同じwebでも使うものは違う
      • 学生が良く使うのはWikipedia。レポートの参考にできる、と考えたサイトもWikipedia。学生は情報収集にWikipediaを良く使う
        • 情報がまとまっているから/とりあえず見てみる
      • 学生はサーチエンジンの検索結果/Wikipedia等の一つのページを起点に、複数のページを行き来する。「ピボット行動」(バスケでトラベリング取られないために片足を軸にして動く行動)。起点となるページより3つ先には行かない。
        • Wikipediaの閲覧回数が多いのはそこからピボット行動をするため?
      • 図書館員はwebサイトからアクセスできるDBと図書を良く使う。
        • 信頼性/責任の所在がはっきりしているため
        • 閲覧するページ数は2〜3にとどまる。ピボットはしない。
      • 学生は手軽さ、図書館員は信頼性を重視。学生は広く多くのページを見る、図書館員は少ないページを精読する。
        • Wikipediaを使う学生も、「情報源としては信頼できない」としている。それでも使うのは、Wikipediaに上がっている情報のレファレンスを辿って裏を取っている?
        • たくさんページを見て自分で信頼できると判断したものを選ぶのが学生、最初から信頼できそうなものを探すのが図書館員?
  • 視線分析結果について
    • Web
      • GoogleWikipedia等の既知のページを見るときは視線は安定する、動きは小さい
      • 初めて見るwebページでは視線は広範囲に及び、動きも不規則。学生/図書館員に共通
    • 書架
      • 図書を選ぶときの学生の視線は縦方向に動く。タイトルを読んでいる?
      • 図書館員は横方向に動く。請求記号のみで必要な資料を判断している?
    • 合わせると・・・
      • 初めて使うものでは視線は不規則、慣れているものでは規則的。慣れの有無で視線の動きは定まる
  • 全体のまとめ
    • 視線は慣れによって差がある以外は大きな差はない。世代や技術の差ではなく、慣れの差
      • 請求記号だけは慣れの有無ではないかも。今後検証する
    • 学生固有の行動はWikipediaを起点とするピボット。図書館員と学生は情報探索行動が異なる
  • 今後
    • 今回の対象は技術のある年長者と、技術のない若者。他に技術のある若者と、技術のない年長者を対象として実験することも必要
    • 学生が技術を身につけるとどう行動が変化するのかも今後、分析して行きたい
  • 質疑
  • Q:おそらくこのような状況で、図書館員にものを調べろと言われると意地でもGoogleWikipediaはひかないのでは? 図書館員の見栄がある。
    • A:図書館員がGoogleを使った例もある。最終手段として使った、ということ。基本的には図書やDBを使い、最後にGoogleという意見もあった。中には「使わない」と言いきった人もいるが、主にDB等を、最後にGoogle。学生は逆でGoogleが先。DBはあまり使わない。
  • Q:書架移動時に慎重に進むというのは、図書館員でも知らない図書館ならそうでは?
    • A:館内のサイン等はその通りだと思う。一方、請求記号はどこでも使うのではないか?
  • Q:動画の中で、学生が見ていたのは雑誌の棚では? 図書館員は図書の棚なので動きが違うのは自然かと思うが?
    • A:装置の精度にむらがあるので、よく見える動画を使ったから雑誌架になった。ずれてしまっている動画の中では、やはり学生は縦方向に視線が動いていた。
  • Q:もともと県立高校の教員。学生の被験者は筑波大学の1年生ということで、一般の学生、大学生というよりは知的水準が高くて、図書館や情報探索については意識のある学生なのではないか?
    • A:筑波大学の学生だから他と比べると上手いのではという話かと思うが、今回の学生は1年生、かつ1学期。まだ高校から上がったばかりで大学で専門的な技術は身についていない。学生によって得手不得手があるし、中には2ちゃんねるを使うというような人もいた。学力が高いから探索が得意とかいうことはないと思う。ただ、今後は他の大学の方にも協力していただく必要もあるかと思う。
  • Q:高校までの学校教育の経験の差は? 学校図書館が充実しているか否かとか。今後調べていただければ。
    • A:学生に調査前に高校時代にどのような情報教育を受けていたかを聞いている。教科「情報」を受けている学生が全員であった。
  • Q:ピボット行動について確認したい。Wikipediaを起点にして2ステップまではいくとのことだが、その説明として一次情報を参照しているとのことだった。つまりWikipediaのレファレンスや外部リンクを確認している?
    • A:外部リンク。
  • Q:今回の設定で40分で最後にレポートにまとめるとのことなので、時間の制約があるからこういう行動なのでは? 一方で図書館員は40分だと時間制約を感じないとか。設定を変えれば学生の行動が変わる可能性もあるかと思う。
    • A:今回、40分と設定したのは視線記録装置のバッテリーの関係。時間を増やせば変わるかとも思うが、今後検証したい
  • Q:最後のまとめで、考察であげられたdigital nativeのような環境要因と探索技術の話があった。もう少し細かく見る必要があるかと思ったが、digital nativeは生育の環境か経験年数か、経験年数であれば大学図書館員の方がdigital環境には親しんでいるはずだろうと思うがどうか。また、与えた主題に親しんでいる図書館員はいなかった?
    • A:年数については実験を行う段階では考慮していないが、聞いてはいるので今後検討したい。主題については、図書館員は特別知識を持っている人はいなかった。

図書館利用者の情報探索行動:RFIDを用いた調査手法の利用可能性(杉江典子さん)(第二会場午後3つめ)

  • 図書館における情報提供機能を充実するには・・・利用者の情報探索行動の調査が必要
    • 今は数は少ない
      • 質問紙、観察、面接、本人記録等の調査・・・限られた情報しか得られない
    • 詳細かつ深い分析には質的/量的データ双方が不可欠
      • 量的データ取得にRFID技術を使えば従来手法の問題を克服し簡単にデータ収集できるのでは?
      • RFIDの調査への利用可能性を検討する。得られるデータがどんなものか、その特徴と問題点を検証
  • RFIDとは?
    • GPS無線LAN、赤外線と同じく人の介在なしにものを特定する技術
    • 電波によりタグのデータを送受信することでタグの存在や位置を検知できる
    • 下校時の児童見守り、物品管理、図書館資料へのナビゲーションなど幅広い利用
  • 本研究では・・・
    • 館内のRFIDタグ、利用者のリーダ・ライタ、情報を結びつけるツールによって実現
    • 閲覧スペースのどこにいても電波を受信できるようにタグを設置
    • 2010.1-2に大学図書館閲覧スペースで調査実施。被験者は学生3名(B1〜3)。与えられた課題について情報探索
  • 分析結果
    • まずOPACへ行く、その後OPACを起点に他のところに行ったり戻ったりする
    • 滞在時間が長いのは一般図書・雑誌(50%程度)とOPAC(20〜30%程度)と共通する傾向がある
    • 事実確認的課題ではOPACとデータベースに滞在する時間が、漠然としたテーマより長い。漠然としたテーマでは一般書架への滞在時間が事実確認より長い。
    • 事実確認では二次資料の利用が多く、漠然とした課題では一次資料が多い
    • RFIDからどの分類に属する資料を利用したかまで特定可能
    • 電波が遠くまで達する、資料があまり詰っていない書架の近くなどではタグの電波を遠くから受信する誤作動も。ただしそれほど大きな影響はない
  • まとめ
    • 被験者の図書館内での移動経路、場所ごとの滞在時間等のデータが得られた
    • RFIDを用いることで秒単位の正確なデータをまとまった量、入手可能である。データ収集に限れば人手も必要ない。機材を身につけている本人以外の利用者には迷惑もかからず、被験者以外のプライバシー問題も発生しない
    • 問題点・・・タグの位置の調整には手間がかかる(設置してしまえば半永久的に利用可能)、被験者の姿勢や周囲の環境が原因となりうまく受信できないケースもある。タグの性能は技術の進歩、タグの設置と受信機の扱いには改善の余地もある
    • RFIDを用いた手法は利用者の情報探索行動の調査に有用である。リーダ・ライタを複数入手できれば開館時間中の統制されない探索も可能。他の手法と組み合わせればより深い理解ができるかも。
  • 質疑
  • Q:行動について。仕事にパソコンの整備をしている立場から、図書館においては学生がログインして使う端末もあると思う。それは調査対象に入っていた? あったら、どんな結果になったかも。
    • A:今回対象としたエリアは図書館の2フロア。ネット端末は別フロアにあったので、今回の範囲に入っていない。
  • Q:電波を使うことへの人体への影響はない? BDSに比べると弱い電波で大丈夫とのことだが、図書館で使うと強く出さないといけないので心配。
    • A:人体への影響は専門的なことはわからないが、ペースメーカへの影響については専門家に相談して問題ないとのことだった。
  • Q:RFIDが蔵書につくようになると、その蔵書の分析にも利用できると思うが先行調査があれば
    • A:蔵書についてくる場合、現在のタグの場合は電波の距離が短いものを使用し得いるので、離れた距離で検知することは今のタグだと難しい。先行研究等も見つけられなかった。
  • Q:発表の趣旨との関係で確認したい。RFIDを用いた調査手法の利用可能性とのことだが、まとめの中で列記された項目で利用可能性と言っても図書館の環境に依存するところもあるのでは? 情報源の種類別利用時間、主題別利用時間はその図書館の配架の影響を受ける。
    • A:主題をごちゃごちゃにしているところがあったとすれば適用は出来ないと思う。
  • Q:異なる配架をしていればもっと違った利用可能性も得られるかも知れない。
    • A:書架の様子とその書架にある本の量、タグの数によってどの程度荒い/細かいかも変わる。
  • Q:RFIDとは無線周波個体識別なので、10冊の副本があれば個別に特定できることが前提。先ほどの議論は逆様では?
    • A:RFIDを館内に設置するか図書につけるかによる。

大学図書館員が辞めたいと思うとき:ストレス要因と職務態度の世代間分析(天野絵里子さん)(第二会場午後8つめ)

  • 図書館情報学というよりは経営学より。しかしなんとか図書館情報学との接点を見つけてこちらの分野でも成果を発表したい。
    • 一番最後にこんな暗い発表で申し訳ないが、最後は明るく終わりたい。
  • 本研究の目的:大学職員の心理的ストレスや「辞めたい」と思うときについて分析する
    • 組織心理学の方法から定量的分析
    • 若手には上司からの支援、全世代にとって仕事の意義についての考えがネガティブなインパクトを与える
  • 問題意識:若手にあまり元気がない
    • 「やらされている」感。こんなことでこの変化の時代を乗り切れる?
    • 図書館サービスをアップデートするには中堅・ベテランの上に若手の発想を取り入れて共同することが必要
      • でも心の中にはストレス
      • 要因は色々あるが、組織に内在する何かがそういった気持ちを起こすのでは?
    • ネガティブな気持ちに負けずに働くには?
  • 先行研究レビュー
    • ネガティブな態度を心理的ストレス、離職・転職意識、職務満足度(不満足度)と考える
    • 組織心理学がそれらの態度を研究:看護師、技術者、学校の先生についてある
    • 図書館情報学分野では、海外では調査がされている/日本ではほとんどない
  • モデル/仮説
    • 結果として3つのネガティブな変数を取る
    • 仕事におけるネガティブな態度に結び付く要素
      • 役割行動
        • 曖昧さ:どこまでやっていいのかわからない
        • 葛藤:仕事に対して「こうすべき」と思う方法と違う/異なる指示を受ける
        • 役割過多:仕事が多い
      • 職務特性
        • 資源の適切さ:必要な道具や情報を得る容易さ
        • 意義:仕事に意味を感じられる度合い
        • 自律性:自分で決められること
      • 社会的支援
        • 上司から/同僚から
      • ex) 社会的支援がうまくいっていうと心理的ストレスと離職転職意識が下がり、職務満足度は上がる・・・などの効果があるのでは、等の仮説を立てる
  • データの取り方
    • 質問紙調査を実施
    • 全国の大学図書館員を対象とする
    • 回答者は373名、うち常勤272名のデータを利用
    • U35を若手、36-45歳を中堅、それ以上をベテランとして世代分けをして分析
    • 「ここで働くのが好きだと思う」(職務満足度)を7段階で答える、等の項目設定
  • 分析結果
    • 心理的ストレスは役割曖昧さが要因となっている。意義の大小も大きくかかわる/若手の中では上司の支援の高低がストレスに大きく関係する
    • 離転職意識は仕事の意義で大きい、特に中堅は仕事の意義がなく、同量の支援がなくて役割が曖昧なときに辞めたくなる
    • 職務満足度:全世代で仕事の意義の影響が大きい。若手では仕事の資源の適切さ、社会的支援の大小も満足度と大きくかかわる。中堅では同僚の支援の大小も関係。
      • ベテランでは自律性も関わる。大学と部下の板挟み、中間管理職性も見える(役割の曖昧さに葛藤する等)。自律性の影響が大きいのは「もうほっておいてくれ」意識?
  • 結果を組織にどう落とし込む?
    • すべての結果で若手が最もネガティブ。若手のためには何ができる?
      • 仕事があるのに資源がないのが「やめたい」気持ちにつながる。しかし上司からの適切な支援があればいいが、離転職意識には支援の効果はない
      • まずは意義を感じられる仕事を与えることが若手をつなぎとめる効果がある
    • 中堅以上の世代が頑張らないといけない。
    • 若手と中堅では資源が重要。必要な情報・資源が上司や他部署から得られること。
    • 仕事に意義を感じていたいのが大学図書館員。組織的かつコミュニティレベルで仕事の意義を再定義、再構築することが必要。個々のレベルではなく学会や専門協会の役割も大きい
  • 制限事項
    • 「やめたい」と言っても外部労働市場がないことがネガティブな意識にどれくらい働いているか
    • 質問紙の取り方に偏りもある。網羅的にできればもっと信頼性が上がるかも
  • 質疑
  • Q:元大学図書館員として、あたっているなあと思いながら聞いた。まとめ(1)にあったが、若手世代に部下を持つ中堅に色々な向上を求められるとあるが、心理的なストレスの中で役割過多が正である、今でも仕事が多くて負の感情があるのにさらに求められることが増えるのかな、と感じた。また、今回サンプルになったのはどういう大学図書館の方が多かったのか? 属性など。
    • A:役割過多を中堅以上が感じているのに・・・というのは、優先順位の立て方があると思う。個々の組織で頑張るしかないのはそうだが、これからの図書館サービスを考えるとITを活用したものとなるし、若手の活用が組織内では重要である。そのためには中堅のリーダーシップの開発が必要で、優先順位を上げて欲しい。図書館員の能力開発と言うと図書館に関する技術向上が言われるが、言うのも恥ずかしいが「人間力」のようなものも忘れてはならない。
    • A:属性については、私の人的ネットワークをまずは利用したので国立大学の人が多かったかもしれない。それから、大学図書館員の年齢構成は本来は半分以上がベテランだが、回答結果は若手が半分以上になった。だいたいバラけていたかとは思うが。
  • Q:ステップワイズの回帰分析を使うところがわからない。最後の結論で出した丸印はあまり言えない気がする。普通これは潜在構造分析で使う。なぜあえて回帰分析を選んだ?
    • A:よくやられている手法だったので使ったが、他の研究者の方からもこの統計手法については指摘を受けたことがあった。私自身の課題であると考えている。
  • Q:今日ご発表いただいた内容は組織で働く人であればどこの仕事でも当てはまるような内容かと思った。大学図書館と言う職務に関する他との違いのようなものは御考えがある? 先行研究では他の専門職の例があるそうだが、それらと比較してとか。
    • A:モデルはオリジナルなものなのでぴったりは比較できないが、他の職業の方にもこういった成果を伝えたときにも同様の指摘を受けた。研究としては図書館員では同様の調査がなかったのでオリジナリティを置きたいが、仕事の意義がどの世代に対してもネガティブな感情に結び付くというのは他の職業と違うところでは、と思う。
  • Q:若手を活用しなければとか仕事の意義とか、共感を受ける発表だった。若手に仕事の意義を考えるときに、曖昧さと葛藤、過多というのが役割についてあったが、若手については役割が過小であると思っている者もいるのではないか。もっとやりたいことがあるのに与えられていないので仕事に意義ややりがいが感じられないと言うこともあるかと思ったが、その点はご意見があれば。
    • A:それは当たっていると思う。若手の役割過多については満足度に影響があるとしているが、仕事が多かったからと言ってストレスや離職意識に影響が出ていないのは、両方あるせいかもしれない。色々な考えの人がいると逆にここに数値が出てこない。同じアンケート調査でスキルの活用についての質問も聞いているので、そのあたりで分析できればいい。そこはあまり研究に使っていないのはいい結果が出なかったせいもあるが、実感としては非常にわかる。




個人的に大変興味深かったご発表として、メモを取れなかったものの中では既に注の中でも書いた池内先生と伴先生のご発表がありました。


メモを取った中では、まずは宮田さんがご発表された学術論文PDFの自動判定の学習用集合の影響については大変面白かったです。
機関リポジトリのようなOA論文集合は自由に使えるため計量的分析を行う際のデータとして期待できる、という話は海外の図書館情報学者の中でもされているのですが、実際には適切なメタデータが付与されているかどうかとか、期間ごとに分類が統一されているか等の問題もあるわけで。
実際に使ってみた結果の一例として、F値も精度も機関リポジトリを学習用集合にした場合が最も良くなかった、というのは考えさせられるものがあります。
自分が聞いた内容なので質疑にメモできていないのですが、紀要論文も論文として取ろうにもNII TypeとしてDepartmental Bulletin Paperが付与された目次や表紙がある(一次DRFメーリングリストで話題になりましたね)とか、学位論文もThesis or Dissertationとして取られているけど中身は審査の要旨だけ、みたいなものもあったりして、メタデータだけで判定できないものになっているんですよね(大汗)
もちろんそのような分析のためにメタデータに手をかける必要があるかと言われればコンテンツ公開を優先して欲しいわけですが・・・なかなか悩ましいところです。


安形先生のサイト分析ツールとアンケート調査、ログ分析の結果の比較の話も面白かったです。
アクセスログは自分も機関リポジトリのログ分析に研究としてずっと携わっているわけですが、本当にロボットが多いこと多いこと・・・
それも日夜新たに生まれるというか、安形先生もご自分で作成されたとおっしゃっていますし、自分もしばしばロボットを作って動かしていたりもします。
ブラックリスト式のロボット排除はこのような新規ボットに対応するため日夜更新が必要、かつどれだけやっても完全に排除しきることは不可能、というもので・・・それは認識した上でやれるだけやる、ということになるわけですが、そのチェックのためにも他の方法と併用することは重要と思います。
しかしなんでルーマニアのアクセスが多いんでしょうねー・・・ルーマニアってことは.roドメインですが、誰か新規ボットでも作ったのか、そのドメイン自体もあっているんだかないのだか・・・。


それから杉江さんのRFIDを利用された館内行動の情報探索行動調査、というのも興味深かったです。
館内行動の量的調査はこれまで技術的に難しかったところも多いわけですが、杉江さんのようなRFIDによる方法や、今度筑波でも行われるpingpongプロジェクトのようなTwitterと位置情報を使った方法等、昨今では様々な手法も出現しているところでもあり。
これらの方法で得られた情報を活用して、利用者の行動反映して図書館が改善され、さらにその評価が利用者調査から得られ・・・というサイクルが出来ると好ましいですよね。


天野さんの「大学図書館員がやめたいと思うとき」のご発表も、「最後に暗い話で・・・」ともおっしゃっていましたが重要な話だよな、と思いました。
若手、中堅、ベテランの意識の差の話がかなり興味深かったです・・・若手では同僚はあまり効かないけど、中堅では同僚が効いてくるというのはなかなか・・・
上司からの支援も離転職意識には効かないとか。
いろいろ考えたくなる内容ですね。


そして安蒜さんの発表ですが。
自分が共同発表者になっているので欲目もあるとは思いつつ、個人的にやっぱり「図書館員の書架での視線移動は横、学生は縦」というのはかなり興味深いなあ、と思います。
ちなみに自分も普段は請求記号に頼って図書を探しているのですが、逆に言えば請求記号と配架が混乱するといっきに探索が困難にもなり(苦笑)
「たぶんここら辺だろう」と思って適当に書棚に戻す学生がいるとえらい目にあうのはそのせいですが、そこら辺は逆に最初から書棚全体をタイトルでスキャンする1年生の探索の方が、効率は悪いものの頑健性はあるのかも知れません(まあ、結局横移動型の人も、見つからなかったところから縦移動型になるんだと思いますが)。
あと、補足として「ピボット行動」のイメージの元はバスケットボールのピボットですね。
2ステップより先に進まない=トラベリングにならない、ということで逸村先生が命名されました。
面白いくらい3歩進んでなくて面白かったです。
広く浅く、「嘘を嘘と見抜けない奴は・・・」式になんでもいいから探して自分で選ぶのが学生なわけですが、これが若手に特有か、図書館員みたいな特殊な人以外は誰でもそうか、というのが今後の継続研究で明らかにしていくことになるでしょうー・・・がんばれ安蒜くんー。


次は秋の研究大会ですね。
他の皆さんの発表を聞いていたら自分でもなにか発表したくなってきたので(笑)、それまでにはまた次のネタを考えたいと思います。

*1:具体的にいうと、池内先生のご発表はめっちゃめちゃ面白かったけど移動の関係で途中からしか聞けず、最初は立ち見だったこともありメモが取れませんでしたorz いや本当、面白いので論文等で発表されるのを超楽しみにしていたいと思います(これだけ内容が濃ければきっとすぐどこかでご発表されるのだと思います)。また、日本大学理工学部の伴先生のご発表「図書館所蔵起床書籍に対応した書籍デジタルアーカイブ作成用撮影装置の研究開発」も物凄く面白かったです。書籍電子化のための撮影装置についてのお話で、「うわこれ欲しい!」と思いました。電池が切れてしまったのでメモが取れなかったことが悔やまれます。

*2:NDC Finder:NDC Finder