参加記

資料保存協議会の第3回セミナー「デジタル記録の信頼性と活用」にて、林賢紀氏( 農林水産省研究情報センター)、伊戸川暁氏(リコー)の公演が行われた。

林氏からは、農林水産研究情報センターで行われている、webにある農林水産関連情報を収集・保管・提供するサービスの紹介があった。

サーチエンジン「農林1号(仮称)」は、農林水産業関連の情報のみを収集できるよう、あらかじめ指定したwebサイトのみを対象にデータを収集している。しかし、利便性に溢れるサーチエンジンでも、管理者の異動・組織の改編・サーバのクラッシュ・頻繁な更新など、発信源の状況によってオリジナルサイトは容易に消滅する。

同センターでは、この問題に対応する「インターネットアーカイブ」の構築も行っている。形態は、前更新日より更新日までを1つの「世代」と定義し、ディレクトリ形式で保存するというものである。アーカイブでも他のデータベースとの横断検索が可能であり、検索方法はオリジナルURL・日付・キーワード・世代といった、柔軟な構築がなされている。また、サイトを表示する際には、ページに含まれている画像や、リンクされたURLも書き換えが行われている。テキストに限らない階層を持った表示は、webアーカイブならではと言えよう。

今後、蓄えられたデータをいかにして永続的に保存していくか、といった、どの策でも不確実であろう問題が生じると思われる。しかし、このような構造は、webにある情報を活用する手段として有益であると言える。現在、このサービスは農林水産業関連の情報のみに限られているそうだが、他分野にもこの概念が注目されることを期待したい。

伊戸川氏からは、電子情報が紙やモノに記された情報より危うい点を解消する手段として、電子文書の長期的保管のための枠組について紹介があった。

提案されているPOT(Persistent On-line Text)は、電子文書を保存するにあたって考えうる諸問題を4層に階層化している。

物理層…自律的に新しい媒体へファイルを転送する階層
分散層…ネットワークを介して文書を遠隔地に分散し安全性を高める階層
文書層…メタデータとデータから構成されている文書を「文書」という単位で定義する階層
解釈層…制御文書・認証文書・仕様書などの「文書」の関係を示す管理情報も文書として保存する階層

POTはあくまで長期的保管を構築するにあたる1つの指針を示すに過ぎない。例えば、媒体の移行(Migration)にかかる年を経るごとに幾何級数的に増大するというコストや、POTを支えるバック・ボーンの必要性など、不安要素の存在は否めないという。

どの分野においても電子文書を扱う機会は増加しており、それらの情報は電子媒体に記録して保管することが多い。だが、データは消滅することが容易であるし、媒体は稼動環境になければ不可視である。便利で柔軟な電子情報だが、このような危険性がどの状況でも起こりうることを、改めて実感させられた。電子情報を扱う一人として、いまある表面上の情報のみ使うだけに終わらず、背景も含めて記憶し活用していきたい。

Home