ディジタル図書館へのアプローチ − DL関連研究分野に関して

杉本重雄
図書館情報大学 〒305 茨城県つくば市春日1-2
tel: 0298-52-0511, fax: 0298-52-4326, email: sugimoto@ulis.ac.jp

概要

 全米情報基盤計画(NII: National Information Infrastructure)では高速計算 機を高速・ 広域ネットワークで結ぶいわゆる情報スーパーハイウェイの応用分 野として教育と 医療とともに図書館が重視されている。米国では1994年9月には NSF/ARPA/NASA からのディジタル図書館(Digital Library)に関する総額2400万ドルの研究助成 が決定され たほかイギリスでもディジタル図書館を目指した大規模な研究助成 が進められるな どディジタル図書館研究が急速に盛んになりつつある。

 図書館の電子化を目指した従来の「電子図書館」と比べてディジタル図書館の 研 究が目指すものは高度な情報基盤の上に図書館の持つ様々な機能を実現しよ うとす るものであると言える。したがってディジタル図書館には「館」の概念 は必ずしも 含まれず「壁のない図書館」と言われることもある。本稿ではディ ジタル図書館に 関する背景研究分野研究プロジェクト等について解説する。

キーワード

ディジタル図書館プロジェクト,情報アクセス,学術情報の提供,マルチメディ ア技術,ユーザインタフェース,情報の可視化,ディジタル図書館員

Approaches to Digital Libraries --- Research and Development Areas related to Digital Libraries

Shigeo Sugimoto
University of Library and Information Science
1-2, Kasuga, Tsukuba, Ibaraki 305, Japan
phone: +81-298-52-0511, fax: +81-298-52-4326, email: sugimoto@ulis.ac.jp

abstract

Digital library is a new term but widely known as an important issue to make information super-highways really work. Digital library researches have been launched in many countries. For examples, in USA, NSF/NASA/ARPA have started their grant for digital libray researches in 1994, and in UK, JISC has started their research funding program for digital libraries.

Digital library, which is called "Wall-less Library", will provide us with the Space of Information where we can seamlessly access information from our own terminals. The research area of digital libraries covers various aspects from computer/network technologies to social aspects. This paper describes backgrounds of digital libraries and discusses several technological aspects related to digital libraries.

Keywords

Digital Library Projects, Information Access, Academic Information Services, Multimedia Information Technology, User Interface, Information Visualization, Digital Librarian

1.はじめに

 かなり以前より計算機科学を中心とする研究者の間では電子メールや電子掲示 板 が広く利用されコンピュータネットワークは研究者間のコミュニケーション の基盤 環境となっていた。ところがこの1年間にMosaicを中心とする情報提供 とアクセス のためのソフトウェアの発展とそれらを介して情報を提供する機関 が増えたことに よりコンピュータネットワークを利用したコミュニケーション 情報提供情報獲得の 方法が現在急速に変化しつつある。現在のネットワーク環 境では文字テキストや静 止画イメージはもちろんのこと音声や動画をも利用し て構成された様々な情報を世 界中から得ることができる。例えば昨年シューメ ーカー・レビー彗星が木星に衝突 した際のハッブル望遠鏡による木星表面の写 真やサッカーのワールドカップの情報 が提供され非常に多くのアクセスがなさ れたことは記憶に新しい。筆者自身にとっ てみても日頃の活動を電子メール無 しに維持することは不可能である。また以前は 国際会議の情報を得るためにア メリカの学会誌に載る会議案内を1・2カ月遅れで やっと手にいれていたのに 現在では雑誌に載るよりもはるかに早くネットワークか ら情報を得ている。ま た海外出張に出かける前などMosaicを利用して訪問先の大学 の情報を得るほか 天候や交通機関についても調べることもできる。Mosaicを利用し た情報提供は 大学や研究機関にとどまらず国や公共機関民間企業による情報提供に も利用さ れているほか個人が自らの情報を提供するために利用している場合もあ る 。

 書誌情報に限られていた従来の図書館情報システムの枠組みを1次情報の提供 へ と広げる試みがなされてきた。それらにはカーネギーメロン大学(CMU)図書館 にお けるMercury Projectやコーネル大学でのCORE Projectでの学術論文の全文 提供サービ スWAIS(Wide Area Information Servers)を利用したコロンビア大学 における全文デー タベース等がある。学術論文を提供するシステムはキャンパ スLANから広域の ネ ットワーク上での実用システムへ移ろうとしている。ま たCD−ROMやコン ピュ ータネットワークを媒体とする電子雑誌の取り組み も盛んに行われている。さ らに 画像圧縮伸張技術などのマルチメディア技術の 進歩によって動画像をも含む多 様な 情報をディジタル化して蓄積しネットワー クを介して利用できる環境が実現可 能に なってきた。こうした背景からディジ タル化された様々な情報をネットワーク を介 して提供する電子図書館の研究に 結びつくことは容易に想像することができ る。

 電子図書館は魅力的な研究テーマであり従来より電子図書館を目指した研究が 進 められてきた[25]。しかしながら図書館には多様かつ大量の図書・資料が蓄 積される とともに図書館自身の役割も多様であり多様な図書館利用者が様々な 目的で図書館 を利用する。そのため「真の電子図書館」は実現が難しいものの ひとつである。一 方情報スーパーハイウェイの名前で知られる全米情報基盤計 画 (NII:National Information Infrastructure)の重要な応用分野として教育医 療とともに図書館が重要で あると認められディジタル図書館(Digital Library) という新しい名前で呼ばれる研究分 野として注目を浴びることになった。1994 年にはディジタル図書館に関する会議も 開かれた。我が国でも学術情報センタ ーによるプロジェクトや[5][6]通産省によるプ ロジェクト[17]が進められてい る。英国では高等教育における図書館情報に関する報 告として出されたFollett Report[41] の中でディジタル図書館の必要性が示されそれに 基づく総額2000万ポンドの研 究助成が進められている[10]。本稿ではディジタル図書 館に関してこれまでの 背景関連の深い研究分野について論じる。また米国の NSF/ARPA/NASAからの研究 助成を受けて進められるディジタル図書館プロジェクト 等を紹介する。

2. ディジタル図書館の背景

2.1 情報基盤としての広域ネットワーク - インターネットと情報アクセス

 最近我が国ではインターネット(Internet)ということばをよく耳にする。イン ター ネット自身は「ネットワークのネットワーク」と呼ばれるものであり複数 のネット ワークを結んでより広い範囲をカバーするコンピュータネットワーク を構成するも のである。米国では1960年代に構築が開始されたARPANETに始まっ たコンピュータ ネットワークが発展してきた。1980年代に入ってワークステー ションやパーソナル コンピュータの発展とともに計算機が計算の道具としてだ けではなく個人間のコ ミ ュニケーションの道具として不可欠のものとなってき た。

 コンピュータネットワークは電子メールや電子掲示板(BBS: Bulletin Board System) として利用者間のコミュニケーションのほかファイル転送機能を利用したソ フ トウェアやデータの転送遠隔地のマシンの直接利用などに広く利用されてきた。 最近ではディレクトリをたどるのと同様な利用方法でインターネット上に提供さ れ た情報にアクセスすることのできるGopherインターネット上で構成されたハ イパー テキストを提供するWorld-Wide Web(WWW)インターネット上に配置された 複数の全 文データベースを同時に検索する機能を提供する WAIS(Wide Area Information Servers)のほかネットワークに対して情報を提供することとネット ワークから情報を 獲得することを目的としたソフトウェアが広く利用されるよ うになってきた[18][30][31]。1993年に登場したNCSA(National Center for Supercomputing Applications)の Mosaicによりインターネットを利用した広域 の情報提供・利用が急速に加速され た。 Mosaicはこうした新しいサービスと従 来からあるftpによるソフトウェアの提供 サー ビスのためのuser-friendlyな統 一されたユーザインタフェースを提供するもので ある とも言えるが単にそれだ けではなくMosaicによって広域ネットワーク上での情 報提 供の利用性の高さが 明らかになったことに疑う余地はない。

 米国議会図書館やカリフォルニア大学等の大学図書館のOPAC(Online Public Access Catalog)は以前からインターネットを介して利用可能であった。しかし ながらそれら は利用先に直接接続する(telnet)という方法であったので利用可 能な機関とそこへの アクセス方法を事前に知らなければならなかった。そのた め端末から電話回線を経 由して利用することと基本的には同様の利用形態であ った。一方Mosaicの出現で WWWとGopherによる情報提供機関が増加するとともに 「情報提供機関の情報」や 「情報の情報」を提供する機関が現れた。これらを 利用して所望の情報を得られそ うな機関を見つけそこにアクセスすることがで きるようになった[27]。しかもこの作 業はすべて自分の机の上にあるワークス テーションやパソコンを利用して容易に行 うことができる。自分の机の上から ネットワークを介して世界中の情報に容易にア クセスできるようになると情報 提供と情報アクセスのための行動が変化してくるの も当然のことであろう。情 報はネットワークの向こう側ではな くネットワークの上 に置かれることになっ てきたと言える。

2.2 マルチメディア技術

 マルチメディア技術の発展無しにはディジタル図書館を考えることはできない 。 マルチメディアということばは非常に多くの要素を含んでいる。コンピュー タと ネ ットワークを利用して動画像(ビデオ画像)を蓄積・利用できさえすれ ば良いと い うことでは決してない。動画像をも通すだけの十分な通信能力を持 つコンピュー タ ネットワーク動画像を含む多様な情報の入出力編集蓄積検索等 が適切な速度で行 え る十分な能力を持つコンピュータといったハードウェア設 備に加えて多様な形態 の 情報を取り込んで適切に組織化する技術多様な利用者 に多様な情報を提供するた め のユーザインタフェースなど様々なソフトウェア が要求される。

 ディジタル図書館においてマルチメディア技術に期待される役割や機能には次 の ようなものが考えられる。

 将来は従来の形態の図書・文書はもちろん動画像をも含む多様な形態の内容を 持 つ出版物が現れる。そうした出版物を利用するための環境を提供することが 必要で ある。

 AV資料をディジタル化してネットワーク上で利用するにはAVデータの圧縮・伸 張技術や高速ネットワーク等のハードウェア基盤と内容に基づいてAV資料を検索 で きるように内容解析索引付け蓄積するためのソフトウェアが必要である。

 ディジタル図書館は資料を蓄積して提供するだけではなく資料を利用する利用 者 にとって快適な作業環境を提供しなければならない。たとえばディジタル図 書館の 図書館員(Digital LibrarianやCybrarianと呼ばれる)によるサービス を受けるための 対話環境利用者同士での知的共同作業のための共同作業環境が 必要である。また 様 々な障害を持つ利用者にとっても快適な知的作業環境とな る必要がある[32][36]。

2.3学術情報の提供

 筆者は機会を得て昨年秋英国図書館のドキュメントサプライセンター(Document Supply Center)を訪問することができた。同センターでは世界各国からの文献の 複写 依頼や文献の到着等を含めて1日10000通を越える郵便物が到着するという ことを聞 いた。筆者には郵便物を仕分けるための大きなコンベヤーが「図書館 」というより 「工場」あるいは「物流センター」という感じがして興味深かっ た。(情報の流通 が紙という「もの」を利用してなされるという意味において は「物流センター」で あって当然なのかも知れないが。)その大きさがディジ タル図書館の必要性を表し ているようにも思えた。

 現在米国を中心として多くの図書館(特に大学図書館)の目録検索システムが Internet を介してアクセス可能である[42]。先進的な機関では書誌情報による検索に加 えてイメージデータとして蓄積した学術文献全文を利用者に提供するサービスが 進 められていた。先駆的なものとしてはキャンパス内での学術文献提供を目的 とした Carnegie Mellon大学のMercury Project(LIS II: Library Information System II)やCornel大 学のCORE Projectがある[3][34]。高速・広域のネットワ ークを利用したものには学術 情報センターの電子図書館プロジェクト[4][5][6] 等がある。一方Columbia大学の JANUSに代表されるWAISを利用して構築した全文 検索機能を提供する全文データ ベースサービスもある。またMosaic を使ってTechnical Report を提供している大学も ある。(たとえばジョージア工科大学[43]。)Technical Report は一般の学術雑誌とは 異なり出版社経由では手に入りにくいのでネットワーク から入手できることは非常 にありがたい。

 こうした背景の下に1994年に開かれた国際会議Workshop on Digital Libraries: Current Issues(Rutgers大学)やDigital Libraries'94(Texas A&M大 学)ではいくつもの大学 でのディジタル図書館プロジェクトが発表された。この ように学術情報分野では デ ィジタル図書館を指向したシステムの開発が盛んで あり学術情報からディジタル 図 書館は進んでいくと思われる。これらの理由は 以下のように考えられる。

 大学や研究所では研究者間のコミュニケーションのための基盤としてネットワ ー クが整備されており利用者も多い。

 学術文献を要求に応じて複写し提供するサービスが定着しており利用者も多い [26] 。 たとえばCARLのUnCover[44], RLG(Research Library Group)のAriel[45]では Internet を 利用してデータベースを検索し文献の送付を依頼できる。

 情報の利用者自身が情報の生産者でもあるため情報の生産・発信と受信・利用 の 両方の電子化を進めることが容易である。

 利用者や利用目的が明確であるため出版元の協力を得やすい。また出版社自身 が 学術雑誌の電子化を進めているものもある。

3. ディジタル図書館とは

3.1 ディジタル図書館(Digital Library), 電子図書館(Electronic Library), 仮想図書館(Virtual Library)

 ディジタル図書館(Digital Library)ということばのほかにElectronic Library とVirtual Libraryということばがよく使われる。Electronic Libraryの訳語は 電子図書館として広 く使われている。Virtual Libraryは訳すと仮想図書館とな るであろう。

 国際会議での報告[12]によるとGladney他はディジタル図書館を以下のように 定義 している。

「ディジタル図書館は従来の図書館が紙やその他の媒体を使って提供してきた 収集 目録作成情報の発見と流通というサービスを再現模擬拡張するため に必要 な内 容お よびソフトウェアを計算データ蓄積通信のための機械装置と ともに 適切に組み 上げ たものである。完全なサービスを提供するディジタル図書館 は従来の図書館が 提供 してきた必須のサービスを実現しなければならずまた ディジタル化された情報 蓄積 検索並びに通信のよく知られた長所を生かさなけ ればならない。」

 またFoxはSource Book on Digital Libraries[11] のprefaceで,"Digital Library という語 がElectronic Libraryという語よりもはやっている(more in vogue)" と書いている。 Digital Libraryという語は,Electronic Libraryという語より も新しい語である。日本語 訳はどちらも「電子図書館」としてしまっても構わ ないのかも知れないが,「ディ ジタル図書館」とするほうがより明確に主旨を 表しているように思う。やや使い古 された感のあるElectronic Libraryという 語に対して,すべての情報をディジタル化 し , ネットワークを介してすべて の情報にアクセスすることのできる図書館という意 味 でDigital Libraryが使 われている。マルチメディアという概念もDigitalの中に含ま れ てしまうので ,「マルチメディア図書館」などという必要はないト思われる。筆 者 自身は,Electronic Library という用語が「図書館の電子化」,すなわち「館の電子 化」あるいは「館の中 におかれたものの電子化」を意味して使い始められたのに対 して,Digital Library は,様々な情報源(図書,雑誌,灰色文献,視聴覚資料など) をディジタル環 境で利用できるようにし,ネットワークにつながってさえおればど こからでも 情報にアクセスでき,「館」という概念を必要としないものであると考 えてい る。その意味でディジタル図書館は「壁のない図書館(Wall-less Library)」と も呼ばれる。Virtual Library(*1)という用語も使われることがある。これも, 様々な 情報をネットワークを介して蓄積・提供する図書館であり,(実際には どのように 構成されようとも)利用者からみれば一つのまとまりとして提供さ れる図書館とし て,Digital Libraryと同様な意味で使われると考えている。(*1 Virtual Libraryという 語に関してはCERNが提供している Home Page のことを 意図して使われる場合もあ るがここでは一般的な語として述べる。)

 図書館に期待される役割は単に図書・資料を蓄積し情報を集積することだけで は なく利用者による情報へのアクセスを助け利用者の知的作業の支援を行うこ とであ る。組織化・蓄積される情報と図書館員の専門家としての知識には図書 館ごとの特 色が期待される。ディジタル図書館に期待されることは空間的な距 離に阻まれるこ となくネットワークを介して必要な時に必要な情報を提供して くれる図書館にアク セスできることまた必要な情報を探している間にいつのま にか別の図書館にアクセ スしていたというような「壁のなさ」を実現すること がディジタル図書館に期待さ れていることであると思われる。

3.2 ディジタル図書館は図書館か?

 図書館には様々な役割のものがありまたひとつの図書館がいくつもの機能を持 っ ている。そのため「ディジタル図書館」を図書館と呼んでよいかどうかとい うこと も議論の対象である。DL'94においてMiksaとDotyは下の3つの観点から 「ディジタ ル図書館は図書館と呼べるか」について考察している[23]。

1. コレクションとしてのディジタル図書館

  The Digital Library as a "Collection"

2. 情報源のコレクションとしてのディジタル図書館

  The Digital Library as a Collection of "Information Sources"

3. 1カ所に集めておかれた情報源のコレクションとしてのディジタル図書館

  The Digital Library as a Collection of Information Sources "in a place"

また文献[27]において根本は図書館の役割を示しインターネット上におかれた様 々な 情報提供サービスを利用した経験に基づいて図書館としてのディジタル図 書館に関 する考察を述べている。

 多様なメディアに蓄積された多様な形態の大量の情報をディジタル化して多様 な 利用者に提供するという点が様々なディジタル図書館プロジェクトの間の共 通点で ある。しかしながらディジタル図書館の研究はまだ始まったばかりであ り様々な研 究プロジェクトがこれから進められていくところであり完成したデ ィジタル図書館 というものはまだ存在していない。そのため現時点では「ディ ジタル図書館は図書 館か?」という問いに関してはYes/Noを答えることには意 味がないと思われる。

4.ディジタル図書館の研究分野

 図書館はあらゆる情報を蓄積し提供する場であるのでディジタル図書館の実現 に はあらゆる情報技術が関連すると言えるであろう。そのため関連する分野す べてを 述べることは適切であるとは思えない。本章でははじめにNSFの研究助成 プログラ ムを示した後筆者自身の観点から関連すると思われる項目を示す。そ の後筆者自身 が興味を持っているいくつかの関連する研究分野について述べた い。

4.1 関連研究分野

 図書館は人間が蓄積してきた知識・情報をすべて蓄えているところであると言 っ ても良い。したがってそこに蓄積される情報図書館の利用者図書館が提供す るサー ビスすべてが多様かつ大量である。そのためディジタル図書館の研究分 野は非常に 広範囲にまたがる。NSFはNASA,ARPAとともにディジタル図書館に関 する研究助 成を進めている。この助成を受けて進められているプロジェクトは 次章に示す。以 下にはこの研究助成プログラムの中で研究領域としてあげられ た項目を示す[39]。

領域1

任意の形式のデータを取り込むシステムに関する新しい研究

 例:OCR,音声認識,図形理解など

多様な形式の電子情報をカテゴリー分けし,組織化する方法に関する新しい研究

 例:索引付け,内容理解,分類,目録,多言語索引,ハイパーメディア等

領域2

多様な情報に対する検索,フィルタリング,イメージを含む大規模データの抄録 づ くり等に関する新しい研究

 例: 検索理論とモデル,文書の形式構造,知的文書処理,自然言語処理・理 解等

多様な情報の可視化(visualization)と閲覧技術に関する研究

 例: 画像認識,イメージ分類,マルチスケールディスプレイ,データの可視 化, ハイパーメディア上のナビゲーション等

領域3

ディジタル図書館を構築していく上で必要なネットワークに対する要求要件を満 た すネットワーク構成方式とその標準に関する研究

 例: ネットワークのセキュリティ,プロトコルデザイン,データ圧縮等

広域に分散したネットワーク上のデータベースの利用を単純化する方法に関する 研 究

 例: エージェント,intelligent gatekeeper,連携して利用できる分散オブ ジェクト 指向データベース・情報ベース,利用方法に関するモデル,協調作業 のモデルなど

その他

上記以外の例として,知的財産権,プライバシとセキュリティ,科学の発展に結 び つくディジタル図書館の影響,ディジタル環境における出版,著作権に関す る課金 の問題などがあげられている。

 ディジタル図書館を実現するにはどのような情報をどのような利用者にどのよ う なサービスとしてどのような技術を用いて提供するのかを考えなければなら ない。 そのためディジタル図書館を構成するための要素としてコレクション(Collection) サ ービス(Service)技術(Technology)の3点から関連すると思われる項目を列挙 してみ た。 著作権・知的財産権およびそれらに関わる事柄も重要な要素ではあ るが本稿で は扱 わないことにしたい。

●コレクション(Collection)

(1) 情報源の形態と情報表現の形式

 すべての情報がディジタル化されることが前提なので現在の情報媒体(紙CD オ ンラインデータベースetc.)が何であるかは問う必要はない。

 情報は将来に渡って長期間安定して提供できなければならない。そのため特定 の ハードウェアやソフトウェアに依存しない標準化された情報の表現形式を必 要とす る。(たとえばSGMLのようなマークアップ言語によって表現された 文書のデー タベースはデータベースシステムは自体は入れ替わってもデータそ のものは長生き する。)

(2) 収集物情報源の種類

  図書

  逐次刊行物

   新聞雑誌ニュースレターetc.

   一般学術etc.

  灰色文献

   政府等刊行物大学紀要etc.

  技術情報

   特許意匠etc.

  統計データ

  その他

(3) 情報表現

  文字テキスト

   文字テキスト

   図表

  図

   設計図地図etc.

  表

  静止画像

   写真絵画グラフィックイメージetc.

  AV資料(映画ビデオ画像音声・音響資料など)

   ニュース教育資料娯楽作品(ドラマアニメーションなど)etc.

   音楽作品音響資料etc.

  ハイパーテキスト(ハイパーメディア)

  Active資料(ソフトウェア)

   プログラムゲームetc.

  その他

●サービス(Service)

(1) 誰による誰のための

 利用者個人自身による自身のための作業

 利用者間の共同作業

 図書館員による利用者の支援

 図書館の運用

(2) どのような作業

 検索とブラウジング

  資料を探す

  情報そのものを探す

 内容アクセス

  本を読む

  ビデオ資料を見る

 知的作業の場の提供

 資料・データの収集・組織化・蓄積

 管理・運用

(3) どのような利用者

 個人

  一般人

  専門家

  子供・老人

  障害者

 集団

  特定メンバーからなるグループ

   研究者グループ

   開発チーム

    etc.

  不特定メンバーからなるグループ

   地域コミュニティ

   社員コミュニティ

    etc.

 図書館員

●技術(Technology)

(1) 計算機・通信基盤

 大量のマルチメディアデータを高速に処理し通信するためのハードウェアや基 盤的ソフトウェア技術

  高速・広域ネットワーク技術

  マルチメディア通信技術

  大規模データベース技術

   大規模マルチメディアマルチデータベースetc.

(2) 情報の蓄積・組織化・検索

 ディジタル情報化

  印刷物から

  AV資料から

 索引付けの支援・自動化

  冊子体雑誌記事AV資料ハイパーテキスト(ハイパーメディア)

 情報の(再)利用性向上技術

  マークアップ言語の利用

 検索・ブラウジング

  Content-based Retrieval

 自然言語処理・理解

 文書理解

(3) 分散情報環境

 世界中に分散した大量の情報の中から必要な情報を見つけるための技術

 マルチデータベース

 大規模ハイパーテキスト

 ナビゲーション

(4) ユーザインタフェース技術

 情報の可視化(Information Visualization)

 多形態ユーザインタフェース

  利用者観点環境に応じた対話形態

 協調作業支援

4.2 Mosaic, World-Wide Web, Gopher, WAIS

 World-Wide Web, Gopher, WAISの登場によりftpやtelnet主体であったインタ ーネッ ト上での情報獲得方法が変化しだした。さらにMosaicの登場でホームペ ージ作成の ブームが津波のようにやってきたような感じさえする。Mosaic は自 分の机の上から 世界中の情報源にアクセスすることのできるseamlessな操作環 境を提供してくれてい る。Mosaic(あるいはWWWやGopherなど)=ディジタル図 書館であるということは 言えないがMosaicが「壁のない図書館」としてのディ ジタル図書館をイメージさせ るのに大きな役割を果たしたと思われる。

 WWWは巨大なハイパーテキストであるのでリンクが迷路のように張り巡らされ その中で迷子になることも多い。また世界中で様々な機関が様々な情報を提供し て いるので提供される情報の種類と量も巨大である。ディジタル図書館(のネ ット ワ ーク)には巨大な量の情報が蓄積されまた新しい情報が常につけ加えら れて行く の でどのような情報がどこにあるか(ありそうか)を前もって決めず にアクセスす る ことが望ましい。この観点から巨大なWebの中で情報を探して くるロボットのよ う なソフトウェアの研究が注目されている。しかしながらこ れらは現時点では実用 的 には将来のものでしかないと考えられる。そのためネ ットワークを図書館のよう に 利用するには情報の情報すなわちWWWやGopherに よって提供されている情報の 索 引や目録など適切に情報を分類し組織化した構 成した2次情報が必要である。こ う した観点からCERNのVirtual Library米国 議会図書館や英国のBUBLのホームページ O'Reillyが提供するThe Whole Internet Catalogなどが著名である。

4.2 学術情報の提供

 2.3節で述べたように学術情報は以前から文献複写サービスが広く利用されて おり ネットワークを利用して文献を提供する土壌ができていたと言える。現在 行われて いる学術情報の提供方法は大きく分けて(1)文献複写サービス(2)雑誌 記事等のページ イメージのデータベースサービス(3)雑誌記事や種々の文献等を 取り込んで作成した 全文データベースサービスおよび(4)電子ジャーナルがある 。この 内電子ジャーナル だけが執筆・編集段階から閲読段階まですべてを電子 的に行おうとするものであ る 。

 (1)にはCARLのUnCoverやRLGのAriel等がありデータベースの検索や論文複写の 申 込をネットワーク経由で行うなどInternetの利用が進められている。(2)に関 しては冊 子体に仕上げられた雑誌の記事をイメージとして取り込みネットワー クを介して提 供するというシステムの開発が盛んに進められている。これらに は書誌情報(タイ トル著者キーワード及びアブストラクト)のみをテキスト化 して本文はイメージの みで提供するものと本文もOCRを利用してテキスト化し本 文のページイメージの提 供に加えて全文検索を可能にしているものもある。カ ーネギーメロン大学の図書館 で進められたMercuryプロジェクトでは文献を検索 しスキャンインしてある文献を端 末画面上で読むことのできる図書館情報シス テム(Library Information System II: LIS II)が作られた[34]。このように検 索した文献を同じ画面上で読むことのできるシステ ムの実用化が現在では広域 ネットワークを利用して進められている。たとえば学術 情報センターによる電 子図書館プロジェクトでは情報処理学会および電子情報通信 学会の学術論文を 検索・提供する環境の構築が進められている[4][5][6]。Elsevier社は TULIP(The University Licensing Program)と呼ぶシステムを試験的にミシガン 大学カリ フォルニア大学(*2)ほかに試験的に提供している。カリフォルニア大 学サンフランシ スコ校(UCSF)ではAT&T社の全文検索機能とイメージによるペー ジ表示機能を持つ RightPagesシステム[16]を利用してSpringer Verlag社が提供 する学術雑誌(New England Journal of Medicine)を提供するシステムRedSage(*3) の試験を進めている。(3)に関し てはColumbia大学の法学図書館で開発が進めら れたJANUSはWAISによる全文データ ベースを利用して学術情報を提供するものの 代表であろう。またWWWやGopherに よるアクセスに加えWAISを利用して資料の検 索機能を提供しているところは数多く ある。(*2 カリフォルニア大学は9校あ り地理的にかなり分散している。データ ベ ースは各校におくのではなくOakland において管理していた。* 筆者がRedSageプロ ジェクトのリーダであるUCSFのRichardLucier 氏からうかがった話では画面で読むこ とに関しての問題はないが内容に基づく 検索が全文検索であるので検索方法によっ てはノイズが多くなってしまうことMEDLINE などと組み合わせた検索を行えるよう にすることが望ましいとのことであった 。)

 電子ジャーナルはいろいろなところで進められておりCDで配布するものもあ れ ばオンラインアクセスするものもある。現在の電子ジャーナルの場合マルチ ウィン ドウが一般的になる以前から始められたという歴史的な理由またすべて の利用者が 高品位の端末環境がえられるわけではないのでASCIIテキストを基本 としたものが多 い。(一般にListServeと呼ばれる。)しかしながらイメージや 数式を含む内容を適 切にレイアウトした形式で提供することが重要であること はいうまでもない。英国 では高速・広域ネットワークであるSuperJANETを利用 して数式やカラーイメージを も含む雑誌記事の利用性の評価が行われた[28]。 基本的な仕様としてUNIX・ X-windowをプラットホームとすることSGMLを利用す ること数式はTeXで記述する ことカラーイメージハーフトーンイメージと線画が 表示できること階層的な記事の 選択ができること記事間でリンクが張れること 他である。実験では4つのソフト ウ ェアAT&TのRightPagesElectronic Book Technology のDynatextOracleのBookおよび Europublishing Projectのために開発されたEC のRACEプログラムのソフトウェアであ る Telepublishingが利用された。(これ らが上の仕様をすべて満たしているとは限ら ない。)実験からスピード(要求 を出してから読めるようになるまでの時間)が重 要であることテキストに頼り すぎずに内容間を移動する機能記事を画面で読むため の適切なデザインやフォ ントSGMLで記事を作成し利用するためのいろいろな道具が 重要であることを述 べている。またラフバラ工科大学 (Loughborough University of Technology)の McKnight による報告[22]ではMosaicを利用した電子ジャーナルにおけ る仲介者(Intermediaries) と読者著者との関係について行った実験の結果を述べてい る。

4.3 ディジタル情報化

 既存の情報媒体は紙に印刷された図書や文書映画やビデオ映像音楽レコードな ど が中心であるである。したがって生のデータを読み込んでディジタル化し適 切に索 引付けして蓄積する技術が重要である。たとえば紙に印刷されたテキス ト主体の情 報をディジタル化するためのOCR映画やビデオ作品音楽作品を蓄積す るためのマル チメディア情報技術が必要である。またそれらを支える自然言語 処理技術や認識技 術がであることは言うまでもない。

 OCRには高い文字認識率はもちろん単にテキストをコード化するだけでな くペ ー ジに含まれる図や表に付けられた解説注など文書の構造を反映してテキスト を入力 することが要求されている。OCRによる文書入力を高度化するには自然言 語処理や 文書構造の理解などが要求される。雑誌記事の全文を提供することの できるシステ ムであるOMNIS/Myriad[8]を開発したBayerによるとコストの面か ら2次情報の作成 のためにはOCRを用いるべきであるとしている。またHockeyはOCR を利用して人文 科学分野の図書を入力しSGML化して作成した全文データベ ースについて報告し ている[46]。

 映像情報をデータベースに蓄積するにはタイトルだけではなく内容を適切に組 織 化しなければならない。たとえばテレビニュースであればひとつづきの映像 の中に いくつかのニュースが含まれている。ドラマであっても場面の切り替わ りがある。 従って映像を場面ごとに区切り索引を付ける必要がある。この作業 を完全に自動化 することは困難であるが場面の切り替わりを認識しそれに基づ いて検索することの できるデータベースを実現する必要がある[1][2][37]。次 章に示したCMUのディジタ ル図書館プロジェクトはビデオ資料を公共図書館利用 者を含む多様な利用者に提供 することを目標としている。またUCSBのプロジェ クトは地図や航空写真を多様な利 用者に提供することを目標としている。

4.4 Visualization, User Interface

 情報を探す際に検索結果の羅列を見るだけでなく情報を見やすい形で示すこと や 検索とブラウジングを適切に組み合わせることが重要である。また同じ検索 結果を 示す場合でも一般人向け専門家向け子供向けというように利用者によっ て表示方法 を変えるといったことも要求される。

 ユーザインタフェース技術に関する主要な会議の一つである UIST (ACM Symposium on User Interface Software and Technology)の昨年の会議UIST'94 でも情報 の可視化(Information Visualization)は主要な話題の一つであった。 筆者にとって印象 的であったものをいくつかあげたい。Rennison の報告[29]は 別々に書かれた著述たと えば新聞記事の間の関連付けをし内容をキーワードか ら記事にいたるまでのピラ ミ ッド的に構造付けその上で拡大(zooming)や視点 の移動(panning)などのグラフィカ ル な操作を提供するシステムについて述べ ている。木構造は階層的に構成された情 報 を表現するのに重要な概念である。Lamping とRaoは限られたスペースの中で視点 を 中心に大きな木構造表示する方法を示 している[19]。我々は情報を探すときにはじ めは大きな項目に注目し徐々に目 的にあった詳細な項目に接近して行く。たとえば 地図を見ている場合はじめは 大きな字で書かれた名前に注目し徐々に小さな字で書 かれた名前に注目して行 くことが多い。Liebermanはビットマップデータを基に連続 的にzoomingとpanning を行うシステムを示した[20]。同じ情報でも見せ方(見え方) によって利用者 の理解のしやすさは大きく異なる。BedersonとHollanはデータの性質 や利用の 履歴利用者からの見え方の要求等に基づいて情報を提示する環境Pad++につ いて 述べた[9]。また昨年11月に本学で開催したディジタル図書館ワークショップで の諸橋の講演では視点を変えて検索結果を提示するシステムが示された[24]。

 使いやすいOPAC(Online Public Access Catalog)は図書館の利用性を高める上 で重要 な要素である。本学図書館でも汎用計算機が提供する文字端末上のOPAC に加えて対 話性を高めるためにワークステーションのGUI(Graphical User Interface) を利用した XOPACを設置している[33]。図書館利用者はOPACによる検索と書架で のブラウジン グを組み合わせて図書を探すことが多い。したがってこの過程を 支援するシステム が有用である。Allenは分類規則等に基づいて階層的に構成し たOPACの利用性につ いて示した[7]。我々の研究室でも図書のサイズ等から図書 と書棚のイメージを作成 して書誌情報による検索と書架によるブラウジングの 機能を持つシステムを開発し た[13][38]。内山等は図書館のメタファに基づく 検索システムの開発を進めている [35]。

4.5 ディジタル図書館員

 図書館は情報の蓄積場所であるだけではなく利用者個人あるいは利用者グルー プ による知的活動の場である。そのためディジタル図書館には利用者の知的活 動を支 援することが求められる。ディジタル図書館ワークショップにおける山 本の講演で は将来のディジタル図書館環境における図書館員の役割が論じられ た[36]。そこでは 仕事として

(1) 環境とソフトの整備:ゲートウェイ

(2) ネットワーク・リファレンス・サービス

(3) ネットワーク読み聞かせ

(4) 情報創造・情報発信

をあげさらにリファレンスサービスとして

(1) 情報源アプローチへの協力:ネットワーク・ナビゲーション・パイロッティ ング

(2) 検索への協力:コオペラティブ・サーチ

(3) 利用者の知識を生かす翻訳:コオペラティブ・トランスレーション

(4) オンライン・ツールの使い方指導と探索結果の説明 をあげている。

 我々の研究室では協調作業支援システムを試作しそれを「OPACの利用方法を図 書 館員が遠隔地にいる利用者に手ほどきする」という例に適用することでディ ジタル 図書館環境における協調作業支援システムの利用性の評価実験を行った[13][14] 。こ の実験では本学学生30名による利用実験とアンケート調査を行い協調作 業支援シ ステムの利用に対する肯定的な結果を得た。知的活動を支援するとい う観点から図 書館員による対話的なサービスを提供すること利用者(個人及び グループ)自身の 情報とディジタル図書館が提供する情報を有機的に相互利用 できることなどディジ タル図書館において協調作業支援システムの果たす役割 は重要であると思われる。

5. 米国でのディジタル図書館研究プロジェクト

NSF/ARPA/NASAによる研究助成を受けている以下の6大学の研究プロジェクトを 簡 単に紹介する[40]。

(1) カーネギーメロン大学 (480万ドル)[47]

 Informedia on-line Digital Library

 カーネギーメロン大学が公共テレビ局WQED/Pittsburghと協力して対話的に利 用可 能なオンラインディジタルビデオライブラリを開発する。利用者はビデオ アーカイ ブから科学・数学資料を検索して利用できる。音声イメージおよび自 然言語理解技 術を統合的に利用する。初期開発時には1000時間分の資料を持つ ことになってい る 。

(2) ミシガン大学 (400万ドル)[48]

 University of Michigan Digital Library Project

 地球・宇宙科学分野を中心とする大規模かつ発展し続けるマルチメディアディ ジ タル図書館のテストベッドを開発し運用し利用して評価する。何千人もの利 用者と 情報の集積場所をむすびこのシステムは多様なトピックの非常に巨大な 量の情報を システム化するための必要性に合うようにデザインされる。重要な 点はキャンパス 内の利用者地域の高校や公共図書館の利用者など多様な利用者 による評価を行う点 である。

(3) イリノイ大学 (400万ドル)[49]

 Building the Interspace: Digital Library Infrastructure for a University Engineering Community

 イリノイ大学アーバナシャンペイン校(University Illinois at Urbana-Champaign) の新 しいGraigner Engineering Library Centerを中心とした科学技術分野の雑 誌を指向した プロジェクトである。NCSAのMosaicをカスタマイズしてテストベ ッドを構築する。 このテストベッドはイリノイ大学を含むBig Tenと呼ばれるグ ループに属する大学の 何千ものドキュメントと何万人もの利用者のための実用 システムとなる。図書館情 報学大学院(Graduate School of Library and Information Science)を中心として行われる 研究ではテストベッドの社会科学 的評価意味的検索技術の開発将来実現される大規 模システムのためのプロトタ イプの設計に焦点を当てる。

(4) カリフォルニア大学バークレイ校 (400万ドル)[50]

 Environmental Electronic Library

 環境情報に関するプロトタイプディジタル図書館を開発する。環境データ影響 に 関するレポートおよび関連資料の作成や評価のために利用される多様な情報 を収集 する。開発されるプロトタイプはカリフォルニア州のCERESシステム(カ リフォル ニア州が持つ環境情報に関するデータベース)を完全に含むように実 現される。利 用者対象には公共図書館の利用者である一般人を含む多様な利用 者が想定され る。 研究領域には自動化索引知的検索ディジタル図書館の応用を 支援するためのデータ ベース技術遠隔地からのブラウジングのためのデータ圧 縮と通信技術などを含んで いる

(5) カリフォルニア大学サンタバーバラ校(UCSB) (400万ドル)[51]

 Project Alexandria

 新しい電子図書館として十分なサービスをも提供するとともに大量で多様な地 図 画像および写真資料のコレクションに容易にアクセスすることのできるディ ジタル 図書館を開発する。UCSB図書館の地図と画像のコレクション(Map and Image Laboratory)を中心として空間的な索引情報に焦点を当てた研究を進める 。ニューヨー ク州立大学バッファロー校メイン州立大学およびいくつかの企業 と協力して研究を 進める。はじめの半年間にプロトタイプを作ることになって いる。

(6) スタンフォード大学 (360万ドル)[52]

 Stanford Integrated Digital Library Project

 既存のもの将来に現れるものをも含めネットワーク上に広がりつづける大量の 情 報源やコレクションへの一様なアクセスを提供する単一の統合された仮想図 書館 (Virtual Library)を可能にする技術を開発する。個人情報から現在の図書 館にあるコ レクション科学者によって共有されているような情報まですべてを リンクする環境 を構築する。

6.おわりに

 昨年Rutgers大学で開かれたワークショップ Workshop on Digital Libraries: Current Issues [46]と Texas A&M 大学での国際会議 Conference on Theory and Practice of Digital Libraries (DL'94)[53]は筆者にとって非 常に刺激的であった。その理由はいく つかある。筆者の不明を暴露するような ものかも知れないが第一には情報スーパー ハイウェイ=広域・高速ネットワー ク→光ケーブルを張り巡らせることと入れ物に ばかり興味が向いていたところ が応用こそ重要であるということを陽に知らされた こと。特に教育医療と図書 館がその重要な応用分野であると知ったことである。ま た図書館は博物館や資 料館とは異な り利用者に情報を提供することが使命であり デ ィジタル図書館 への取り組みによって多数の図書を所蔵することに価値があると い うことに意 味がなくなりいかに情報を提供できるか情報へのアクセスを支援でき る かが重 要であることが実感できた。

 米国をはじめとしてヨーロッパ日本でもディジタル図書館の研究・開発プロジ ェ クトが進められている。昨年9月末には6プロジェクトに総額2400万ドルと いう NSFからの大規模な研究助成(第5章参照)が発表された。聞くところによ ると数 百件の応募の中から70件余りにしぼられそこから6件が選ばれたとの ことであ る。 米国での研究の層の厚さに驚かされた。個々の技術はそれぞれの 領域では最新 のも のではないかも知れないがそれらを総合できること巨大な量 の情報に適用でき るこ とがディジタル図書館プロジェクトの特徴であるように 思う。

 最後にこの1年間ディジタル図書館の調査等のために研究室を留守にすること も 多かった。またネットワークから獲得する情報無しには仕事を進めることは 不可能 であった。末筆ながらこうした活動を支えてくださった諸氏に感謝の意 を表した い 。

参考文献(URLを含む)

[1] Aigrain, P. and Joly, P., Discrete Visual Manpulation User Interfaces for Video, Proc. of RIAO, vol.2, 1994

[2] Aigrain, P. et al., Representation-Based User Interfaces for the Audiovisual Library of Year 2000, Proc. of SPIE'95, 1995.2

[3] 安達淳, 橋爪宏達, 欧米における電子図書館プロジェクト, 情報処理, Vol.33, No.10, pp.1154-1161, Oct., 1992

[4] 安達淳, 電子図書館と学術雑誌, 情報の科学と技術, Vol.44, No.5, pp.247-253, May, 1994

[5] 安達淳, 電子図書館設立の条件, ディジタル図書館(ISSN 1340-7287), No.1, p.23-28, 1994.8

[6] 安達淳, 学術情報センターの電子図書館システム試行実験報告, ディジタル 図書館 (ISSN 1340-7287), No.3, 1995.3

[7] Allen, R.B., Navigating and Searching in Hierarchical Digital Library Catalog, Proc. of DL'94, p.95-100, 1994.6

[8] Bayer, R., Design of a Multi-Server Active Digital Library System, Proc. of ADTI'94, p.284-291, 1994.11

[9] Bederson, B.B. and Hollan, J.D., Pad++: A Zooming Graphical Interface for Exploring Alternate Interface Physics, Proc. of UIST'94, p.17-26

[10] Brindley, L.J. (永田治樹訳), ディジタル・ライブラリーの創造:英国 高等教育 機関における進展, 情報管理, Vol.37, No.9, p.745-753, 1994.12

[11] Fox, E.A. (ed), Source Book on Digital Libraries (version 1.0), Virginia Polytechnical Institute, Dec., 1993, p.410

[12] Gladney, H.M. 他, Digital Library: Gross Structure and Requirements (Report from a March 1994 Workshop), Proc. of DL'94, p.101-107, 1994.6

[13] 後藤清記他, LAN環境における協調作業支援システムとその図書館サービス への 適用, ディジタル図書館(ISSN 1340-7287), No.3, 1995.3

[14] 後藤清記他, LAN環境における協調作業支援システムとその図書館サービス への 適用, 情報処理学会第50回全国大会講演論文集, 1995.3

[15] 橋爪宏達, ネットワークによる学術情報流通, ディジタル図書館(ISSN 1340-7287), No.1, p.39-42, 1994.8

[16] Hoffman, M.M., et al., The RightPages Service: An Image-Based Electronic Library, Journal of the American Society for Information Science, Vol.44, No.8, pp.446-452, Sept. 1993

[17] 堀口光, 藤原達也, 「パイロット電子図書館システム事業」の概要, ディ ジタル図 書館(ISSN 1340-7287), No.2, p.39-42, 1994.11

[18] Krol, E., The Whole Internet Catalog, O'Reilly & Associates, 1992

[19] Lamping, J. and Rao, R., Laying out and Visualizing Large Trees Using a Hyperbolic Space, Proc. of UIST'94, p.13-14, 1994.11

[20] Lieberman, H., Powers of Ten Thousand: Navigating in Large Information Spaces, Proc. of UIST'94, p.15-16, 1994.11

[21] McKeon, K. 他, The JANUS Digital Library, Proc. of DL'94, p.67-73, 1994.6

[22] McKnight, C. 他, ELVYN - Publisher and Library Working Towards the Electronic Distribution and Use of Journals, Proc. of DL'94, p. 6-11, 1994.6

[23] Miksa, F. and Doty, P., Intellectual Realities and the Digital Libraries, Proc. of DL'94, 1994.6

[24] 諸橋正幸他, 情報検索システムにおける効果的なナビゲーション機能の提 案, デ ィジタル図書館(ISSN 1340-7287), No.2, p.45-49, 1994.11

[25] 長尾真, 電子図書館, 岩波科学ライブラリー15, 岩波書店, 1994.9

[26] 永田治樹, 大学図書館とエレクトロニック・ドキュメント・デリバリー, 情報の 科学と技術, Vol.44, No.7, pp.352-361, July, 1994

[27] 根本彰, Digital Libraryは図書館か - ある図書館研究者のインターネッ ト体験, デ ィジタル図書館(ISSN 1340-7287), No.2, p.15-32, 1994.11

[28] Pullinger, D., The SuperJournal. Project: Electronic Journals on SuperJANET, British Library R&D Report 6126, 1994.2

[29] Rennison, E., Galaxy of News: An Approach to Visualizing and Understanding Expansive News Landscape, Proc. of UIST'94, p.3-12, 1994.11

[30] 阪口哲男, 国際全文データベースについて, 図書館情報大学総合情報処理 セン ター年報, no.2, p.20-34, 1993

[31] 阪口哲男, Internetにおける情報資源の利用と提供の実際, ディジタル図 書館(ISSN 1340-7287), No.1, p.43-50, 1994.8

[32] 杉本重雄, Digital Librariesへのアプローチ - 米国で開催されたWorkshop, Conferenceに出席して, ディジタル図書館(ISSN 1340-7287), No.1, p.5-22, 1994.8

[33] Fujita, T., et al., Transporting an Online Public Access Catalog from Mainframe to Distributed Environment, Proc. of 47th FID, p.267-271, 1994.10

[34] Troll, D.A., Project Mercury and Development of the Library Information System, Mercury Technical Report Series, No.7, 1993

[35] 内山将夫, 板橋秀一, 図書館の機能を模倣した文献検索システム, 情報処 理学会第 48回全国大会講演論文集, No.5, p.207-208, 1994

[36] 山本毅雄, 電子図書館員の仕事とその道具, ディジタル図書館(ISSN 1340-7287), No.1, p.29-38, 1994.8

[37] Zhang, H.J., et al., Automatic Parsing of News Video, Proc of IEEE 1994 Internation- al Conference on Computing and Multimedia Systems, p.45-54, 1994.5

[38] 趙燕春, 書架のイメージを持つ蔵書検索システム, 図書館情報大学修士論 文, 図書 館情報大学, 1995.3

[39] NSF, Research on Digital Libraries: Program Guideline, Sept., 1993

[40] National Science Foundation News, Awards: Digital Libraries Press Release, NSF PR 94-52, 1994.9

[41] FOLLETT: Joint Funding Council's Libraries Review Group: Report, 1993.12

   gopher://bubl.bath.ac.uk:7070/11/Index

   ここから BUBL keyword search を選択し "follett" で検索できる。

URL

[42] http://ss.cc.affrc.go.jp/ric/opac/opac.html

   国内のOPACのリストを見ることができる。

[43] http://www.cc.gatech.edu/gvu/reports/TechReports.html

   ジョージア工科大学, Graphics Visualization & Usability Center

[44] http://carl.org/carl.html

   CARLのホームページ

[45] http://www-rlg.stanford.edu/welcome.html

   RLGのホームページ

[46] http://superbook.bellcore.com/DBRG/DL94/

   http://www.cs.umbc.edu/conferences/dl/abstracts.html

   Rutgers大学で1994年に開催されたワークショップのプログラムおよびアブ ストラクト

[47] http://fuzine.mt.cs.cmu.edu/im/informedia.html

   CMUのディジタル図書館プロジェクト

[48] http://http2.sils.umich.edu/UMDL/HomePage.html

   ミシガン大学のディジタル図書館プロジェクト

[49] http://www.grainger.uiuc.edu/dli/

   イリノイ大学のディジタル図書館プロジェクト

[50] http://http.cs.berkeley.edu/‾wilensky/proj-html/proj-html.html

   カリフォルニア大学バークレイ校のディジタル図書館プロジェクト

[51] http://alexandria.sdc.ucsb.edu/

   カリフォルニア大学サンタバーバラ校のディジタル図書館プロジェクト

[52] http://diglib.stanford.edu

   スタンフォード大学のディジタル図書館プロジェクト

[53] http://atg1.wustl.edu:80/DL94/

   DL'94のproceedings

[54] http://www.dl.ulis.ac.jp/

   本学のディジタル図書館ネットワーク(DLnet)のホームページ