Z39.50 JAPAN/MARC 対応関連仕様と評価用試作システムの説明

石田 茂
株式会社インテック・システム研究所
情報応用研究部
〒930-0804 富山県富山市下新町 3-23 ISL ビル 2F
Phone: 076-444-8088
FAX: 076-444-8126
E-Mail: ishida@isl.intec.co.jp

概要

Z39.50 が備えている国際的な相互接続性を維持しつつ、 日本語書誌目録の JAPAN/MARC レコードを検索してその結果を 返戻する場合、Z39.50 に日本語書誌目録を考慮した付加的な仕様が 必要になることが指摘されている。

この指摘に基づき、本稿では、日本語書誌目録用に必要となる 仕様項目を概説し、JAPAN/MARC に適用して作成している関連仕様と 試作したシステムの機能概要を述べる。

キーワード

Z39.50, JAPAN/MARC, JPmarc, 日本語, 書誌, 目録, Index Data, ChaSen, 茶筌, 形態素解析

Explanation of Draft Specification for Z39.50 JAPAN/MARC and Prototype System for Evaluation

Shigeru Ishida
INTEC Systems Laboratory Inc.
ISL BLDG 2F, 3-23 Shimoshin-Machi, Toyama City, Toyama., 930-0804, Japan
Phone: +81-76-444-8088
FAX: +81-76-444-8126
E-Mail: ishida@isl.intec.co.jp

Abstract

In case that Z39.50 clients search and retrieve JAPAN/MARC bibliographic item catalogue in keeping the international interoperability of Z39.50, it is said that a additonal specification for Japanese bibliographic is needed.

Therefore based on this, this paper explains brief of items of a additional specification needed for Japanese bibliographic and also explains a draft specification for Z39.50 JAPAN/MARC and brief of facilities of a prototype system.

Keywords

Z39.50, JAPAN/MARC, JPmarc, Japanese, Bibliographic Catalogue, Index Data, ChaSen, Morphological Analysis

1. はじめに

Z39.50[1] は情報検索と返戻に関する ANSI/NISO 規格である。 今日、Z39.50-1995 をベースとする ISO 23950:1998 として 国際規格に採用されており、国内では JIS X 0806:1999 として 規格化されている。

Z39.50 は、欧米で構築されている電子図書館の機能の中で、 主に USmarc, UNImarc 等の MARC レコードの検索とその結果情報の 返戻を実現するために採用が進んでいる。 一方、Z39.50 を日本語書誌目録レコードに適用する場合、 UNImarc に準拠して開発された国内で代表的な MARC 形式である JAPAN/MARC[2] (以降 JPmarc) が候補に上げられる。 Z39.50 が備えている国際的な相互接続性を維持しつつ、 JPmarc レコードを検索してその結果を返戻する場合、 日本語書誌目録を考慮したアクセスポイントや検索式の構造、 返戻時の要素仕様などが別途必要になることが指摘されている。[3] この指摘に基づき、Z39.50 で JPmarc レコードを運用するための 関連仕様を作成し、これら仕様を評価することを目的に、 サーバならびにクライアントシステムを試作した。

本稿では、日本語書誌目録用に必要となる仕様項目を概説し、 JPmarc に適用した仕様と試作したシステムの機能概要を 述べる。

2. Z39.50 の国内利用に向けて

Z39.50 は、異機種ネットワーク間の相互接続性に 優れた情報検索と返戻の機能を実装する際、 有望な仕様として国際的に認知されている。 これには、ネットワークに接続された複数の図書館を 同一の利便性でアクセスできること、 OPAC と連携した図書館間の相互貸借を実現することが 主要な目的と捉えられている。

これらを踏まえてまず最初に、日本語書誌目録として公式に 流通している JPmarc 形式のレコードを Z39.50 に載せるために 必要となる関連仕様を作成、評価する環境として、 JPmarc レコードをネイティブに扱える Z39.50 サーバ、 クライアントシステムを試作している。 併せて、JPmarc をZ39.50 に載せるための関連仕様を作成している。

2.1 検索式の国際化

Z39.50 は米国を中心に開発されてきた経緯から、 検索式を扱う言語仕様の面で国際化が遅れている。 符号化されたデータレベルでは、問題なくバイナリデータを 転送することができるが、検索式で表現される文字コードの 符号化方式については、Z39.50 サーバ(target)と クライアント(origin)間で予め了承しておく必要がある。 現在、このための規約として、「文字集合と言語の交渉規約 #2 」[4] が作成されている。 この規約では、文字集合の符号化方式として、 ISO 2022 のエスケープシーケンスに基づいた方式と、 ISO 10646-1 のいわゆる Unicode 系の方式が用意されている。 EU では ISO 10646-1 に基づく符号化方式を採用した 環境が構築されつつある。

しかし、これだけでは、クライアントとサーバ間で検索式の 扱いを正確に交渉することができない場合がある。 特に、アジア圏の言語では空白文字による分かち書きという 表記様式が一般的でないこと、日本語における片仮名、平仮名、 ローマ字、漢字などの同一内容の異表記の可能性、これによる 典拠コントロールの繁雑さという問題が存在する。 これらを検索時のアクセスポイントを表現する Bib-1 などの属性集合で如何に指定するのか、 また、検索結果の返戻時に指定する要素仕様を どのように対応あるいは拡張するべきか、 解決しなければならない課題は多い。

主に欧米において Z39.50 の規格開発に携わる人達に、 問題意識に上る必然性のないこれらの課題の解決を 期待することは難しい。 一方で、Z39.50 の国際的な利用が進もうとしている現在、 各国の言語特性を Z39.50 に反映させるよう、 各言語圏から必要な仕様を提案していくことが求められている。 これらの仕様をスキーマとして Z39.50 の規格に登録することで、 電子図書館の検索と返戻機能の面で、 言語圏を考慮した国際的な連携が実現できると期待される。

2.2 JPmarc と UNImarc の非互換性

JPmarc には、図書編と逐次刊行物編の二種類があり、 主に図書編のレコードが流通している。 JPmarc は UNImarc 準拠に開発されているが、以下の点で MARC 構造レベルで非互換性を抱えている。