WWW非均質情報空間のページ意味理解に基づく組織化の研究
【研究分野】知能情報学
【研究キーワード】
WWW / 文書整理 / ネットワークエージェント / 情報アクセス / 情報空間組織化 / ハイパーリンク / インターネット / 情報組織化 / 文書整理支援
【研究成果の概要】
WWWは非均質だが、ハイパーリンクで結ばれた巨大な情報空間を形成しており、重要な情報インフラストラクチャになってきている。サーチエンジンはWWW利用の不可欠なツールになっているが、更に多様で高度な利用支援機能が必要とされている。本研究ではWWWページの意味理解に基づき、WWWの情報を見通しよくするための主として3種のシステムの研究開発を行った。
第一のFish Viewシステムは、Web上から得られる多数の文書データをユーザの視点に基づき整理することを支援し、効率的に読み進むことを可能にする。電子化辞書の概念体系を利用した新しい動的ベクトル生成・照合機構であるFishEyeマッチングによる視点に基づく文書の照合が特徴である。第二は、WebBeholderシステムであり、指定したWebページ(同一サイト内の子ページも含む)に有意な変化が生じた時に、電子メールで通知し、変化部分を視覚的に表示する機能を提供する。WWWは主としてストック型のグローバル情報共有を可能とするが、情報は新しい部分が価値が高い訳であり、ストック型情報の枠組みの上に必要とする人にフロー型の新情報を遅滞なく伝達する枠組みを、プッシュ型情報伝達とは異なる形態で実現している。技術的にはHTMLのタグを利用してHTMLテキストの差分を効率よく検出する手法を考案、開発している。第三は、AreaViewシステムであり、ある分野(例えば学術分野の「人工知能」や「分子生物学」等)の多数のWebページの中から、主として外部リンク参照数が多いページは有用性の高いと思われることを利用し、利用価値が高いと思われる10〜15程度のWebページ(コアページと呼ぶ)を抽出する。そして、他のページをこれらコアページを中心とするグループに弱構造化して、視覚化して提示する機能を提供する。
【研究代表者】
【研究分担者】 |
伊庭 斉志 | 東京大学 | 大学院・新領域創成科学研究科 | 助教授 | (Kakenデータベース) |
土肥 浩 | 東京大学 | 大学院・新領域創成科学研究科 | 助手 | (Kakenデータベース) |
|
【研究種目】基盤研究(B)
【研究期間】1998 - 1999
【配分額】5,500千円 (直接経費: 5,500千円)