テキスト処理を基盤とするWeb知能化
【研究分野】知能情報学
【研究キーワード】
Web知能化 / 人工知能 / テキストマイニング / Webマイニング / 意味計算 / テキスト要約 / チャンス発見 / テキスト処理 / 自動要約 / 人間関係ネットワーク / 意味表現
【研究成果の概要】
情報流通・共有のグローバルなインフラに成長したWWW(Web)情報空間を知能化することによって,個人,組織,社会の創造性を高める情報空間にすることに向けて,主としてテキスト処理を基盤とする観点からWeb知能化に関する研究を行った.以下は主な成果である.
1)複数テキスト文書要約における抽出した重要文の順序決定手法:時間順序だけでなく,原文書中の前提情報,後置情報,話題の類似性も考慮して決定する新手法を考案,開発した.これは国際的観点からも高い新規性を有している.
2)Webからの企業間関係マイニング:これまでの人間関係マイニングに加えて,Webからの企業間の提携関係及び訴訟関係のマイニングを行う技術を開発した.また,種々の2エンティティ間の関係をWebからマイニングする汎用性のある枠組みについても開発した.
3)テキストからの感情抽出:テキストの意味理解の一部として,テキストからの感情抽出について研究した.今後のテキスト意味理解にも有用と考えられる,常識ベースのコーパスを利用する高度な機能も考案,開発するという成果を得た.感情によるWebオンラインニュースの分類システムも実現した.
4)Web検索エンジンを用いた語の関連性の算出:最初に,検索エンジンによる2語のAND検索によるヒット数を利用する語の関連度の算出法を考案,開発した.次いで,2語のAND検索によって出力される検索エンジンのsnippet情報を利用し,2語を含む周辺に現れる単語パターンも用いて関連度をより精度良く算出する新手法を考案,開発した.
5)自然言語テキスト概念意味の共通的記述言語CDL(Concept Description Language)の研究:Semantic Webがメタデータの共通的記述であるのに対し,標記CDLによる次世代Webに向けてW3Cにおける国際標準化活動をNPO法人ISeC(セマンティックコンピューティング研究開発機構)を中心にして開始しているが,これに連携してテキストからCDL記述を(半)自動的に生成する研究を行った.本件については,現状は部分的な3つ組構造を生成する段階である.
【研究代表者】