貴重書等のディジタルアーカイブシステムにおける構造記述
【研究分野】情報通信工学
【研究キーワード】
デジタルアーカイブ / 構造記述 / 領域分割 / 色空間 / 画像検索
【研究成果の概要】
本研究では、聖書や楽譜、家系図等、明確な構造と意味情報が含まれるコンテンツをデジタルアーカイブの対象として取り扱う。これら貴重書のデジタルアーカイブに際しては、単にイメージのハンドリングに留まる事無く、そのイメージの中から構造的な記述を抽出し、ページ構成やレイアウト、印刷技法などの書誌学的なコンテンツ分析および、それらの分析結果をキーとした高次なインデックスによる検索、そしてインターネット上でのイメージ再現を考慮する事により、構造記述型デジタルアーカイブシステムの実現を目指している。したがって、ドキュメントの構造を自動抽出する研究は、その意味情報の抽出と利用という次の段階の研究課題へ向かう足がかりとなる、重要な基盤技術であると考えている。稀覯書を租にモデル化すると、背景と文字、または背景と記号といった、本質的には2値画像と見なせる領域をベースとして、その上に挿絵領域がカラー画像として重畳されていると考える事が出来る。そこで、HSL空間での各領域に現れる特徴的な色分布を分析する事により、色空間でのクラスタリングを主とし、空間的な情報を従として、文字/記号領域と背景領域そして挿絵などのカラー領域の、判定分離アルゴリズムを構築した。このようにして3つのカテゴリーへ分離した後、デジタルアーカイブシステムに不可欠な検索機能に関してのアルゴリズム開発を行った。貴重書のデジタルアーカイブシステムにおいては、文字列データの検索と同様にイメージデータの検索も重要である。本研究では、カラー領域の画像を対象として、視覚特性を考慮した色空間の非線形処理および形状情報にロバストな画像検索アルゴリズムを構築した。またその検索アルゴリズムの実装に当たっては、あいまいな検索意図にも対応が可能で結果的に効率の良い検索を実現できる検索用ユーザインターフェースの構築を行った。
【研究代表者】