電子図書館と知識処理

宇陀 則彦
図書館情報大学
〒305 茨城県つくば市春日1-2
Tel: 0298-52-0511, Fax: 0298-52-4326, E-Mail: uda@ulis.ac.jp

概要

本稿では、 情報自身を主体とした電子図書館の研究の重要性について述べ、 電子図書館における知識処理について考察する。 また、研究者それぞれを対象にした個人用電子図書館を 一研究者の立場から思い描く電子図書館の姿として提案する。 個人用電子図書館システムには、 図書館側の情報と研究者の持つ情報それぞれを組織化し、 統合する機能がある。 個人用電子図書館システムは、 組織化された情報を基にして研究者の思考支援を行うことができる。 研究者に対する有益な思考支援を行えるかどうかは、 電子図書館員のシステム設計にかかっている。 システム設計の中心課題は、 情報の意味処理を含んだ概念の体系化である。

キーワード

個人用電子図書館システム、電子図書館における知識処理、 情報の組織化、研究者の思考支援、電子図書館員

Digital Libraries and Knowledge Utilization

Norihiko Uda
University of Library and Information Science
1-2, Kasuga, Tsukuba, Ibaraki, 305, JAPAN
Phone: +81 298-52-0511, Fax: +81 298-52-4326, E-Mail: uda@ulis.ac.jp

Abstract

This paper describes importance of research of digital libraries based on infomation analysis, and discusses knowledge utilization in digital libraries. A digital library system with personal librarian is proposed for the researchers. The system has function which integrates oraganized information in the libarary with one the each researcher has. The system is a thinking support system for the reseachers. Design of the system depends on workmanship of the digital librarians. The most important point of design is oranization of concepts including semantic processing.

Keywords

Digital Librarin System with Personal Librarian, Knowledge Utilization, Origanization of Information, Thinking Support of Researchers, Digital Librarian

1. はじめに

電子図書館研究は、始まったばかりであり、 電子図書館の具体像はいまだに見えてこない。 最近の研究状況をみていると、 インターネットに注目が集まっているせいか、 ネットワークへの参加、通信速度の向上、WWW 上の情報提供など ネットワークがらみの話が比較的多いように感じる。 もちろん DL 関連研究動向[1][2]をみれば、 様々な研究が行われていることは確かであるが、 必要以上にネットワークを強調しすぎているように思える。 ネットワークの整備は、 電子図書館にとって不可欠な技術であるが 図書館機能にとって本質的な主題ではない。 また、単にネットワーク上に情報をおき、 アクセスしてくださいというだけでは電子図書館としては不十分である。 もちろん、WWW に代表されるようなネットワーク分散型の 情報システムを否定するものではなく、その有効性はおおいに評価する。 ただし、それは電子図書館とは異なる土壌で育ったもので、本来別の話である。 WWW は、インターネット上のアプリケーションの一つにすぎず、 WWW を電子図書館の一部に利用することはあっても、 決してそれらはイコールではない。 単に情報を提供するという一側面に共通項を見出して 電子図書館とみなしてしまうと電子図書館がめざすべき本筋を失いかねない。

図書館とは、サービス目的に応じて資料の収集、整理、保存を行い、 利用者の欲する情報を満足がいくように提供する機関である。 すなわち、情報の蓄積とサービスが図書館の本質であり[3]、 これは電子図書館になっても変わることはない。 変わるとすれば、蓄積とサービスの方式が変わるのであって 機能そのものが変わることはない。 また、従来の図書館がなくなるのではなく、 新しい形態の図書館が誕生するのだということも強調しておきたい。

電子図書館について議論する場合、 ネットワークなどの外枠を議論するのではなく、 蓄積とサービスという観点から 電子図書館の中身である情報自身について議論する必要がある。 「はじめに情報ありき」である。 いくら外枠が立派であっても、 その中身が貧弱なものであったら 図書館として十分な情報サービスができない。

システム的観点から言うと、 電子図書館システムは、従来のデータベースシステムより 柔軟性や拡張性を重視したシステムとして構築する必要がある。 従来のデータベースシステムは、 データの完全性や安全性を重視するあまり、 そのデータに対して様々な制約を課す[4]。 電子図書館システムが処理する情報は、 多種多様であり、制約が強いシステムでは、 その制約に従った情報しか入力できず、 本当に入力したい情報は、歪められて入力されるか、 あるいはまったく入力できないであろう。 電子図書館システムは、データベースシステムでいうところの 完全性や安全性は犠牲にしても、情報サービスのために 柔軟性や拡張性を重視しなければならない。

本稿では、一研究者の立場から自分の望む 電子図書館像について述べる。 また、そのような電子図書館を実現するために必要な技術は、 どのようなものであるかを知識処理とからませて述べる。 なお、本稿で議論する電子図書館は、 保持する情報がすべてデジタル化されており、 コンピュータネットワークを通じて情報のアクセスが可能な デジタル図書館を指す。また、研究者を主な利用者とする 専門図書館を想定している。

2. 個人用電子図書館

研究者は、 研究に関する論文、研究用データ、専門書など さまざまな種類の情報を数多く持っており、 これらを有効に活用したいと思っている。

ある程度研究がまとまって、論文を書こうとする場合、 (電子図書館でない)図書館に行って、文献のサーベイを行う。 研究者が論文をサーベイする対象は2種類あって、 ひとつは日頃目を通しているその分野の主な雑誌であり、 もうひとつは、論文の参考文献を見て手に入れようとする あまりなじみのない雑誌やシンポジウム、会議などの論文である。 前者の場合はあまり苦労せずに手に入れられるのだが、 後者の場合は、その図書館に直接なかったら その所在を文献情報データベースなどで検索し、 所在がわかったら図書館員に頼んで文献を取り寄せる。 もし所在がわからなければ図書館員に検索もお願いする。 そして、首尾よく目的の文献を手に入れたら、 今度はすでに持っている多量の文献とあわせて、 今回書く論文にふさわしいように分類する。

論文を書くたびに行うこの作業は、非常に負担である。 つねづね思うことは、自分の研究を理解し、 かつ図書館の情報検索についての知識を有する 自分専用の図書館員がいればよいと思うことである。 これは部分的にはサーチャーと呼ばれる人達が請け負っているが[5]、 まわりにいないこと、コストがかかること、 自分の求める情報をその度に説明しなければならないなどの問題がある。

図書館の本質は情報サービスであるので、 その対象を研究者に限れば、 最終的には研究者それぞれに応じた情報サービスになるだろう。

研究者にとって、単に文献を探したり、何かについて調べることは、 それを楽しみとする人は別にして、気の重い仕事である。 したがって、単なる情報検索システムではなく、 もっと研究に役に立つ情報を提供してくれるシステムを望む。

このような個人用電子図書館[6]に求められる機能には 主に以下のようなものがある。

個人用電子図書館システムは、 図書館側のサーバシステムと研究者側のクライアントシステムの 相互作用により、 研究者が積極的に情報を研究に利用できる環境を提供する。

この個人用電子図書館を構築する上で留意すべき点は、 研究者が信用できるような情報をいかに提供するかである。 下手にインテリジェントなシステムは信用がおけない。 情報の探索を研究者自身が行えるシステムであれば、 研究者も納得するだろう。 信用できる情報を提供できるかどうかは、 サーバーシステムを設計する電子図書館員[7][8]の腕しだいであり、 ここに情報サービスを本質とする電子図書館の真髄がある。

3. 電子図書館における知識処理とは

知識処理という場合には、情報処理とは違って、 知識を処理するのではなく、 知識を利用して情報を処理するという意味あいが強い。 したがって、知識情報処理というのがふさわしい言い方であろう。 言葉遣いのことはさておき、この章では、 何をもって知識というのか、 電子図書館における知識とは何かについて考察する。

知識処理と言うとすぐに思い浮かぶのは、 人工知能の分野における知識処理である。 人工知能における知識とは、 「ある目的のために必要な真であるとして与えられたデータや手続き、 あるいはそれらのついてのデータや手続きを知識という。」 とある[9]。この定義は、計算機処理という観点から述べてあり、 単純なデータの集まりとは違うことは理解できるが、 「ある目的」によってその中身は非常に異なってくるので、 これをそのまま電子図書館における知識の定義とみなすことはできない。

電子図書館システムに関連のある人工知能のテーマと言えば、 データベースからの知識獲得、エキスパートシステム、 オントロジーといったところであろう。

データベースからの知識獲得は、 主に大規模データベースからの知識発掘、知識発見を指す。 大規模に蓄積されたデータがその量により質的な変化を起こし、 データベースに格納されたときの意味とは異なる側面からの 問い合わせに対して、新たな関係が発掘され得ることを 知識発掘と呼ぶ[10]。 電子図書館においては、文献情報データベース、 フルテキストデータベース、ファクトデータベース、 マルチメディアデータベースなどをその情報として持つ。 この膨大な情報源のなかから利用者の望む情報を提供する場合には、 このデータベースからの知識発掘が役に立つかもしれない。

エキスパートシステムは、 通常、人間の知性を用いなければ解けないような特定分野の 問題を解決するのに、専門家の知識をコンピュータに組み込んで、 人間に代わってあるいは人間を支援して問題解決を行うことを 目的とした計算機システムである。 また、エキスパートシステムは実用システムに近づけば近づくほど、 従来型のシステムとの統合が重要になる[11]。 電子図書館における専門家とは、当然電子図書館員である。 電子図書館は、従来の図書館とは機能の形態が異なるが、 どちらも図書館員の専門知識、特に現場の知識が 一番役に立つのは間違いのないところである。 ただし、現場の知識は泥臭いものが多く、 システム化するのは非常に困難である。 したがって、現場の知識そのものをシステム化するのではなく、 現場の知識を活かせるような支援システムを 構築するのが有効であると考える。 単純にはメモ書き程度の記録と後任への継承で十分役に立つ。 図書館がどのようにシステム化しても、 このようないわゆるドキュメンテーション的作業は不可欠である。

オントロジーとは、もともとは存在論という意味であるが、 人工知能の分野では、人工知能システムを構成するときに 用いる基本概念(語彙)の体系であり、 知識の共有と再利用との関連が深い[12]。 つまり、知識の共有をする場合にある程度の合意を得て、 知識の共通理解の基盤を作ろうということである。 動機はどうであれ、やることは概念の体系化であり、 ターミノロジー、分類、シソーラスなど 図書館情報学が古くから行ってきた中心課題である。 概念を体系化しようという試みは、UDC、EDR、CYC など 様々な分野で試みが行われてきたが、 概念を完全に記述したという例はない。 しかしながら、情報を処理する上で概念の体系化は さけられない問題であり、 特に電子図書館にとっては必須である[13]。

電子図書館は、多様な技術の集積であり[1]、 これら人工知能の理論や技術をもその一部にとりいれた 電子図書館のための理論や技術が必要である。 概念を体系化し、さまざまな情報源から発掘した知識を 概念体系にしたがって組織化し、 電子図書館員の専門知識を基にして情報サービスを行う システムを構築する。 このうち、もっとも重要なのは、概念を体系化する部分であり、 情報の意味を記述・表現できるデータモデルならぬ 情報モデルを構築することである。

4. おわりに

本稿で述べた主張は以下の通りである。

1)電子図書館を構築する際には、 外枠からではなく中身から構築する。

2)図書館の本質的機能は情報の蓄積とサービスであり、 機能の形態は変わっても機能自身が変わることはない。

3)研究者を対象とする電子図書館は、研究者それぞれに 即した情報サービスを行えるシステムが有効である。

4)よいシステムを構築するのは、電子図書館員の腕しだいである。

5)概念の体系化と情報の意味処理は、 電子図書館構築にとっての中心課題である。

電子図書館は、新しい情報サービスを積極的に売り込み、 利用者は、興味のある情報を積極的に楽しみながら探す。 これが新しい形態の図書館である 電子図書館の姿であると考える。

参考文献

[1] 杉本重雄. Digital Libraries へのアプローチ −米国で開催された Workshop, Conference に出席して−. デジタル図書館 No.1 pp.5-22. (1994).

[2] 杉本重雄. デジタル図書館へのアプローチ −DL 関連研究分野に関して. デジタル図書館 No.3, pp.3-19 (1995)

[3] 根本 彰. Digital Library は図書館か −ある図書館研究者のインターネット体験. デジタル図書館 No.2, pp.15-32. (1994).

[4] 藤原 譲. 情報知識学のフロンティア. 情報知識学会誌. Vol.3, No.1, pp.3-14. (1993).

[5] 三輪眞木子. データベースサーチャの視点. 情報処理. Vol.33, No.10, pp1162-1170. (1992).

[6] Norihiko Uda. Personal Librarian System in Digital Library of Specific Fields. Proceedings of ISDL'95. (1995).

[7] 山本毅雄. 電子図書館員の仕事とその道具. デジタル図書館 No.1, pp.29-37. (1994).

[8] 下沢ゆりあ. 第47回 FID 大会に参加して −夢は現実となるか? FID に期待すること−. 情報の科学と技術. Vol.45, No.3, pp.106-109. (1995).

[9] 長尾 真 他編. 岩波情報科学辞典. 岩波書店. (1990).

[10] 河野浩之, 西尾章治郎, Jiawei Han. データベースからの知識獲得. 人工知能学会誌. Vol.10, No.1, pp.38-44. (1995).

[11] 寺野隆雄. 大規模エキスパートシステムの評価について. 人工知能学会誌. Vol.8, No.1, pp.8-16. (1993).

[12] 溝口理一郎. 知識の共有と再利用研究の現状と動向. 人工知能学会誌. Vol.9, No.1, pp.3-9. (1994).

[13] Yuzuru Fujiwara and Norihiko Uda. Self Organization of Information in Libraries Based on Terminology. Proceednigs of International Conference on National Libraries Towards the 21st Century. (1993).