librosa

【PyTorch/librosa】Pythonで音声/音楽データをリサンプリングする

librosaとPyTorchを用いて、Pythonで音声/音楽データ（波形）のリサンプリングを行う。Numpyのndarray配列をリサンプリングしたい場合はlibrosaを用い、PyTorchのTensor配列をリサンプリングしたい場合...

2022/07/22 2024/02/29

librosaPythonPyTorchSound

Pythonでディレクトリ内のwavファイルをすべて読みこんでリサンプリングして書き出す方法について記載する。すべてのwavファイルを読み込んで、リサンプリングして書き出す globモジュールのglobを用いることで、ファイル名を取得する...

2023/09/22

librosaPythonSound

キーワードスポッティングや音イベント検出で、対数log-melや対数スペクトルに変わる特徴量として提案されたPer-Channel Energy Normalization（PCEN）の性能を、yes/noのspeech commands ...

2022/06/27 2022/11/14

librosaPythonPyTorchSound

音声識別や音響イベント検出の特徴量として、対数メルスペクトルがよく用いられています。この対数メルスペクトルに代わる特徴量として、2017年にPer-Channel Energy Normalization（PCEN）が提案され、性能が向上す...

2022/06/22 2022/11/13

librosaPythonSound

音声認識、話者識別や音環境分類などの入力特徴量としてよく使われるメルスペクトログラム（Mel Spectrogram）を、Pythonで時間波形から変換する方法について、PyTorchとlibrosa二つのライブラリを見ていきます。メル...

2022/06/05 2022/11/02

librosaPythonPyTorchSound

音響信号処理全般でよく用いられるスペクトログラムを、Pythonで時間波形から変換する方法について見ていきます。ここでは、PyTorchのtorchaudio.transforms.Spectrogramと、librosaのlibrosa....

2022/06/03 2022/11/01

librosaPythonPyTorchSound