符号化技術とその情報システムへの応用
【研究分野】情報通信工学
【研究キーワード】
データマイニング / テキストマイニング / 相関抽出 / 誤り訂正符号 / 多値属性値 / テキスト分類 / ブロックターボ符号 / リスト複号法 / クラスタリング / 相関ルール / 直積ファイル / ディスク配置 / 最尤復号法
【研究成果の概要】
今年度目標とした項目に対し,下記の結果を得た.
1.データマイニングとテキストマイニング
新聞記事などのテキストデータについて,その自動分類法と,特に複合語に着目し分類精度を向上させる方式を提案した。また,大規模データベースにおいて属性値が連続値をとる場合に属性間の相関を考慮した離散化の方法を提案し,いずれも信学会・ソサエティ大会で発表した.定型項目と記述項目が混在するアンケートデータからの相関ルールを抽出する新しい方法を提案した.エントロピーを用いて多値属性値の出現頻度から複雑さを評価し,これを最小支持度の修正に反映する.これはテキスト中の単語の出現頻度に対しても合理的に取り扱うことが出来る方法になっており、実データに適用しその有効性を明らかにした.情報理論とその応用シンポジウムで発表した.
2.符号化技術
ブロックターボ符号におけるインタリーバの有効な設計方法を提案した.置換行列に制約条件を加えることにより,構成されたターボ符号の最小距離を増加させることができる.そのときの条件・置換行列の求め方・要素符号を与えたときの最小距離の導出などを具体的に与え評価した.また,リスト復号法を用いた連接符号の復号アルゴリズムの提案・評価,および周期的畳み込み符号の新しい構成法とその性能の導出を行った.いずれも情報理論とその応用シンポジウムで発表した.
【研究代表者】
【研究種目】萌芽的研究
【研究期間】2000 - 2001
【配分額】2,200千円 (直接経費: 2,200千円)