ファインチューニングを用いた筆跡鑑定手法
【研究キーワード】
深層学習 / 音楽情報処理 / OMR / バッハ研究 / 画像処理 / デジタル・ヒューマニティーズ / 筆跡鑑定
【研究成果の概要】
近年深層学習が機械学習の世界で注目を浴びておりさまざまな応用分野で大きな精度改善を達成している。特にCNN(Convolutional Neural Networks)は画像処理の分野で著しい成功をおさめている。深層学習の特筆すべき点は、これまでのように特徴量を人間が設計するのではなく、ニューラルネットワークの中間層で自動的に特徴量抽出が行われることである。古楽譜は数ある文書の中でも特に多様な情報を含む複数の階層からなり、多階層のCNN によってこれらの多層構造が自動的に抽出されることが期待できる。これまで古楽譜における音楽記号認識は五線削除の困難さがネックとなり先の段階へ進むことができなかった。これは古楽譜が傾きやインクの映り込み、紙の劣化といった特有のノイズを含んでいることが多く、五線削除に必要な二値化の処理がうまくいかないことが最大の原因であった。CNN を利用することで二値化などの前処理をすることなく、筆跡者を判別することが期待できる。
本研究で究明せんとする対象は、大規模画像データによる事前学習によって、筆跡サンプルの少ない筆跡者の判定精度向上をいかに達成するかである。 本年度は、過学習を避けるための方策として、特定の距離関数を用いた対象ドメインのデータ外類似データを用いた事前学習の有効性を検証した。対象となる筆跡データの分類に有効なネットワークの学習にとって、有効に事前学習を可能にするためのデータ選択方法について分析した。具体的にはImageNetやXceptionなどの大規模画像データセットと対象筆跡データの類似度を様々な尺度を用いて計算し、事前学習したことによる精度向上との関係性を分析した。
【研究代表者】
【研究種目】若手研究
【研究期間】2021-04-01 - 2023-03-31
【配分額】4,290千円 (直接経費: 3,300千円、間接経費: 990千円)