少数データからの高精度な画像認識アルゴリズムの構築に関する研究
【研究キーワード】
画像認識 / 機械学習 / 少数データ
【研究成果の概要】
本研究の目的は,少数の教師情報しかない状況において,高精度な画像認識モデルを学習するアルゴリズムの構築である.生成モデルを利用することで,今まで観測されていないデータを生み出すことが可能となり,少量の教師信号のみでも高精度の予測モデルが構築できる可能性がある.
そこで本年度は,2次元画像から教師なしで3次元表現を学習する新しい生成モデルRGBD-GANを提案した.提案手法では,カメラの姿勢や深度などの3次元に関する教師情報がなくても,カメラのパラメータに応じた画像生成や深度画像の生成が可能である.本手法の特徴は,異なるカメラパラメータから生成された2つのRGBD画像に対し,明示的な3次元一貫性損失を用いている点にある.この損失はシンプルでありながら,カメラパラメータを条件とするあらゆる種類の画像生成に有効である.
画像の生成モデルに加えて,画像認識の高度化のために,画像に映る複数の物体の関係を認識する研究を実施した.最近の関連手法では,画像特徴に意味的特徴や空間的特徴を組み合わせることでこの課題に取り組んでいるが,それら特徴同士の関連付けが弱く,主に画像特徴に含まれる空間的な文脈が失われてしまう欠点を持つ.そこで本研究では,意味的特徴,空間的特徴,および画像特徴を強く関連付けることができる新しいアーキテクチャである「バウンディングボックス・チャンネル」を提案した.提案手法は,物体領域の特徴を効果的に強調し,オブジェクト内の関係をより良くモデル化することが可能である.
【研究代表者】
【研究種目】基盤研究(A)
【研究期間】2019-04-01 - 2023-03-31
【配分額】44,460千円 (直接経費: 34,200千円、間接経費: 10,260千円)