かたつむりは電子図書館の夢をみるか(はてなブログ版)

かつてはてなダイアリーで更新していた「かたつむりは電子図書館の夢をみるか」ブログの、はてなブログ以降版だよ

統制語検索の有用性と問題


研究の関係でアメリカの学位論文を検索する機会があったんだが、http://www.dissertation-yushodo.jp/も、http://www.sunmedia.co.jp/dissertation.htmlも、統制語*1検索ができなくて参った(汗)
タイトルとか著者名がわかったらそもそも検索なんかするかい、っちゅーねん。
いやまあ、そもそも検索するためのフォームではなく注文のためのフォームだ、と言われたらそれまでだが。


世の中の情報が電子化されて、全文検索可能な形で公開されることが増えてきたもんだから普段は統制語検索の必要性なんて全然感じないわけだが、本当に漏れがなくて精度の高い検索やろうと思うと、やっぱシソーラスディスクリプタの存在はありがたいわ。
外国のデータベース使うときなんか特に。
探そうと思っている言葉の、英語での同義語だの関連語なんて、提示されなきゃわかるわけないっての。
そういうときに自分の探してる分野と近そうな論文にどんなディスクリプタが付与されてるか確認して、それ使って統制語検索・・・っていう手法は本当に便利。
もちろん英語に限らず日本でもそうなわけだが。


もっとも問題点もないわけじゃないわけで。
統制語を付与する場合、機械検索で片づけちゃう手法もあるだろうとは思うが、現状それだと精度が落ちるし、精度のない統制語なんて役に立たないので、どうしても人の目による確認が必要となる。
それだと件のアメリカの学位論文みたいに数が多すぎるものだとコストがえらいことになる。
著者が最初からキーワード選ぶ形にすればかなり解消できるとは思うが、それでもやっぱり著者当人が気づかない漏れとか出てくるだろうし、それに統制語付与する人が増えすぎるとブレが出てきてこれまた使いもんになりにくくなるし。


この漏れやらブレやらの問題も深刻で、別に著者に付与させなくても、たとえばこの間LISA(図書館情報学の学術論文とその抄録とかのデータベース。提供元はCSA)でディスクリプタ確認したら、割とボロボロだった("Open Access"で図書館の開架に関する文献が出てくるってどうなんよw)。
「理想的な人間」なんてものが空想上の産物でしかない以上、統制語検索にこうした問題が出てくるのはある種仕方のないことなんだが、まあ問題は問題。
ユーザがおかしいと思ったレコードを簡単に報告できる仕組みとかがあれば多少は改善されるかもしれないが。


と、まあ、問題もある統制語検索だが、そうはいっても学術論文探すときにはやっぱこれがあるのとないのじゃ全然違うよね。
しかしGoogleを使い慣れた昨今の学生が統制語検索なんてものを知っているかどうかはやや疑問。
そこで先日、先生に情報基礎実習の問題作成の手伝いを頼まれたときにディスクリプタを使わせる問題を「発展問題」みたいな形で入れてみた。
ぶっちゃけ「これゲームバランスおかしいだろ!?」みたいな、1年生にやらせるのは酷な問題だったが、まあ早期に全文検索以外にも検索方式ってあるんやで、ってことを知ってほしかったので。
結果を見るのが今から楽しみだ〜。


・・・代償として、無給でTAみたいなことをやっているわけだが・・・
なんか最近、自分で自分の頸を絞めることが多すぎる気がする・・・