古典文章表記構造の統合処理と検索エンジンの研究
【研究分野】日本文学
【研究キーワード】
古典文学 / 情報検索 / アノテーション / 日本古典 / 電子化テキスト / 検索 / メタデータ / 二分木 / SUFFIX ARRAY / 日本古典文学 / 検索法 / 総ルビ付き本文 / 返り点 / データベース / シソーラス / 標準訓読み / 画像本文 / テキストデータ
【研究成果の概要】
本研究では、日本古来の書物に現れる漢字・仮名交じり文の特質、多彩な書体や用字の混在、ルビや左注付き本文の実体、返り点などの漢文読み下し法など、日本独自の表記に即した国文学の各種情報の一般的な表記法とその上での検索手法について検討した。まず、実態調査をかねて、古典資料(里見八犬伝、枕草子、和漢朗詠集、源氏物語)のもとにその具体的な表記に係る問題点を整理した。検討の結果、表記の問題はいわゆる多重パラレルテキストと見なすことができ、近年、計算言語学で提案された、アノテーション・グラフ(AG)の考え方が適用できることが明らかになり、いくつか実例(湖月抄)について、AG表記を試みたところ、適用上重大な問題がないことが確認され、多重表記問題解決への糸口をつかんだ。
【研究代表者】