物理的性質に基づく機械学習による音響処理

多くの機械学習技術では、大量のデータを用いて目的のタスクを達成するためのモデル学習を行います。しかしながら、音響メディア処理ではそのような学習に用いるデータを大量に収集することが難しい場合も少なくありません。一方で、音響現象は物理法則に従うはずであり、そのような物理的性質に基づく制約が機械学習モデルの有用な事前情報となりえます。波動方程式のような音伝搬の支配方程式はその最たる例です。それ以外にも、扱う対象やタスクによって様々な物理的性質に基づく制約が考えられますが、これらを効率よく機械学習モデルに取り入れることによる、新たな音響処理技術の構築を目指します。これにより、従来の機械学習技術よりも少量のデータで、かつ古典的な物理モデルのみに基づく技術よりも高い柔軟性を持つ技術が実現できると期待できます。

References
  • S. Koyama, J. G. C. Ribeiro, T. Nakamura, N. Ueno, and M. Pezzoli, “Physics-Informed Machine Learning For Sound Field Estimation: Fundamentals, state of the art, and challenges,” IEEE Signal Process. Mag., vol. 41, no. 6, pp. 60-71, 2025.
  • J. G. C. Ribeiro, S. Koyama, R. Horiuchi, and H. Saruwatari, “Sound Field Estimation Based on Physics-Constrained Kernel Interpolation Adapted to Environment,” IEEE/ACM Trans. Audio, Speech, Lang. Process., vol. 32, pp. 4369-4383, 2024.