Webからの数式情報・図形情報の獲得および利用に関する研究
【研究分野】知能情報学
【研究キーワード】
Web / 数式検索 / MathML / グラフ構造 / 視覚化 / 検索語 / SearchSpy / 相関係数 / 話題検出と追跡
【研究成果の概要】
平成20年度においては、Webページ上の数式を検索するための手法についての研究を進めた。数式はあらゆる学問分野において、重要な要素の記述に用いられている。しかし、数式を対象とした検索に関する研究は不十分ではない。従来のテキスト検索技術であるTF-IDF等では単語の出現頻度に基づいているため、数式の構造(例えばsinを含んだ積分式においてsinが積分記号の内側か外側かなど)を反映した検索が困難であつた。この研究ではテキストではなくMathML (Mathematical Markup Language)を利用して、数式の構造を反映した検索を実現するシステムを構築した。また、検索結果を提示するにあたっては、対象の重要度に応じたランキングを行うことが不可欠である。数式の検索者が求める数式の性質として、「単純な数式」および「指定した条件が分かりやすく表れた数式」の二つを仮定し、そのような性質を満たす数式を上位にするランキング手法を考案し実装した。The Wolfram Functions Siteより収集した約8,OOO個の数式を用いて検索の実験を行ったところ、設計した問い合わせ言語を正しく認識し結果を出力することを確認した。また、提案したランキング手法を比較し、数式における適切なランキングについての考察も行った。
【研究代表者】
【研究種目】萌芽研究
【研究期間】2006 - 2008
【配分額】3,300千円 (直接経費: 3,300千円)