librosa

スポンサーリンク
librosa

【PyTorch/librosa】Pythonで音声/音楽データをリサンプリングする

librosaとPyTorchを用いて、Pythonで音声/音楽データ(波形)のリサンプリングを行う。Numpyのndarray配列をリサンプリングしたい場合はlibrosaを用い、PyTorchのTensor配列をリサンプリングしたい場合...
librosa

【Python】すべてのwavファイルを読み込んで、リサンプリングして書き出す

Pythonでディレクトリ内のwavファイルをすべて読みこんでリサンプリングして書き出す方法について記載する。 すべてのwavファイルを読み込んで、リサンプリングして書き出す globモジュールのglobを用いることで、ファイル名を取得する...
librosa

Per-Channel Energy Normalization(PCEN)の性能確認【PyTorch】

キーワードスポッティングや音イベント検出で、対数log-melや対数スペクトルに変わる特徴量として提案されたPer-Channel Energy Normalization(PCEN)の性能を、yes/noのspeech commands ...
librosa

【PCEN】対数log-melに代わる特徴量PCEN【librosa】

音声識別や音響イベント検出の特徴量として、対数メルスペクトルがよく用いられています。この対数メルスペクトルに代わる特徴量として、2017年にPer-Channel Energy Normalization(PCEN)が提案され、性能が向上す...
librosa

【PyTorch】Pythonで時間波形からメルスペクトログラムへ変換【librosa】

音声認識、話者識別や音環境分類などの入力特徴量としてよく使われるメルスペクトログラム (Mel Spectrogram)を、Pythonで時間波形から変換する方法について、PyTorchとlibrosa二つのライブラリを見ていきます。 メル...
librosa

【PyTorch】Pythonで時間波形からスペクトログラムへ変換【librosa】

音響信号処理全般でよく用いられるスペクトログラムを、Pythonで時間波形から変換する方法について見ていきます。ここでは、PyTorchのtorchaudio.transforms.Spectrogramと、librosaのlibrosa....