The Design of Browsing and Berrypicking Techniques For The Online Search Interface

を授業の課題に関連していたので読んだ。
結構古い情報検索に関する論文なのだけど、Berrypickingという検索技術のモデルを提案していて検索技術の未来をもしかしたら示しているのかも知れない。結構面白いし、あくまでモデルの提案なので専門的な話はほとんど出てこないので情報検索などが専門でない人でも読みやすいです。
簡単にこの論文でいっていることを言うと、人間が実世界の図書館などで情報を検索するような方法でオンライン上の情報も検索できれば理想的ですね、でもそれじゃあ情報量が多すぎて人手じゃ厳しいから自動化できるところはどんどん自動化していけばいいでしょうっていうお話。それがBerrypickingというモデル。
それで、具体的に私たちが実際に図書館などでどういう検索の仕方をしているかっていったら

  • ドキュメントの脚注を見る
  • そのドキュメントが引用している文献を見る
  • 目的の分野の中心的なジャーナルを見る
  • 図書館の棚の並びは分野によって分類されているので、その分野から探す
  • 図書の目録を見る
  • 著者の情報からその著者が書いた文献などを探す

などの手法を何度も繰り返して行うことによって、少しずつ目的の検索結果に近づけているのではなかろうかと本稿は述べている。
では、以上のような実世界で使われている検索技術をオンラインで、しかも人間の負担を減らすためにある程度自動化して実現するには、どういう技術が必要だろうかっていうことも、この論文には書かれている。その部分に関しては沢山あるので興味のある方は実際の論文を見てみてください。IVのSEARCH CAPABILITIES FOR A BERRYPICKING SEARCH INTERFACEという節にのっています。
それで、現時点ではこの論文で提案されている技術のどれくらいが実現されているだろうかって考えると、ほとんど実現されていないといっていいと思う。ただし、はてなWikipediaで自動的にキーワードを抽出してリンクを張ったりとかCiteseerで論文の目録や引用をたどれるなど、一部の技術は実現されていると思う。本論文を読んでみればweb2.0の先の検索の世界が想像できる、かもしれないし全然違う方向に進むかもしれない。でも、私個人的にはweb上にある情報の検索技術がBerrypickingみたいなものを少しずつ実現していくようになる可能性は結構あると思う。
ただし、本論文が想定している以上に現在のwebで扱われている情報は多種多様にわたっている。図書館では本、つまりテキストしか検索の対象にならないと思うけど、webではテキストだけでなく動画や画像、地図情報、などなどありとあらゆる情報が扱えるように、という方向に向かっている。Berrypickingというモデル自体は全ての形式の情報に対して有効であると思うけど、Berrypickingを実現するために本論文で上げられている技術だけではテキスト以外の情報の検索には使えない。だから、このBerrypickingモデルを実現するためにさらなる多くの検索技術を開発しないといけないだろう。
さらに、私が本論文で一番首をかしげたのはインターフェースに関する記述。実際の図書館における検索をオンライン上で行っているんだからそのインターフェースも仮想的な図書館のようなものにするのが良いだろう、と本論文では述べている。だけど、これはあまり賛同できないな。なんか仮想的な図書館みたいなインターフェースとかって聞くとWindows95が発売されてマルチメディアの時代が来た、とか叫ばれてた時によくあったようなものを思い出す。まあ、本論文はそれよりも前にかかれたものだから仕方ないのかもしれないけど。
こういうおかしな部分はあるけれど、検索のモデルとしてこのBerrypickingというものはかなり魅力的に思われる。
未来の検索技術がどうなるかとか考えるのってすごい楽しくて、ほんといい時代に生まれたと思う。だって、生きているうちにすごい沢山の変化を見ることが出来るだろうし、もしかしたら自分がそういったものに関われるかもしれないと思うと非常にうれしくなってくる。