ホンダ・リサーチ・インスティチュート・ジャパン – 先端技術の研究開発

論文検索 > Mask U-Net を用いた環境音セグメンテーションの提案

研究活動

論文検索

Advanced Search

December 2018

Mask U-Net を用いた環境音セグメンテーションの提案

  • 周藤唯, 糸山克寿, 西田健次, 中臺一博,
  • in 第52回人工知能学会 AIチャレンジ研究会予稿集,
  • 人工知能学会,
  • 2018,
  • pp. 21-26,
  • Conference paper

本稿では,Mask U-Net を用いた環境音のセグメンテーションについて提案する.近年,音データを用いた防犯監視システムや高齢者見守りシステムなどの要望が高まってきている.環境音のセグメンテーションは,空間情報を用いる伝統的な音源分離とは異なり,事前学習した音源の性質をもとに,区間検出,分離,識別を同時に行う手法である.このような手法として,画像のSemantic Segmentation 用に提案されたU-Net を歌声信号分離に適用した例があるが,限定したクラスを対象とした適用にとどまっていた.本研究では,U-Net を用いたセグメンテーションとCNNを用いた音響イベント検出を組み合わせたMask UNetによる環境音セグメンテーション法を提案し,より一般的なクラスを対象とした75 クラスの環境音が含まれる混合音データに適用することによってその有効性を示す.結果として,従来手法と比較し,学習速度,音源分離性能が向上することを確認した.

Search by Other Conditions

Keywords
Entry type
Years
to
Authors
Language
Refereed