Sound

【PyTorch】Pythonで時間波形からメルスペクトログラムへ変換【librosa】

音声認識、話者識別や音環境分類などの入力特徴量としてよく使われるメルスペクトログラム（Mel Spectrogram）を、Pythonで時間波形から変換する方法について、PyTorchとlibrosa二つのライブラリを見ていきます。メル...

2022/06/05 2022/11/02

librosaPythonPyTorchSound

音響信号処理全般でよく用いられるスペクトログラムを、Pythonで時間波形から変換する方法について見ていきます。ここでは、PyTorchのtorchaudio.transforms.Spectrogramと、librosaのlibrosa....

2022/06/03 2022/11/01

librosaPythonPyTorchSound

SciPyで音声/音楽データを読み込むscipy.io.wavfile.readは、WAV形式の音データ読み込むことができます。Numpy形式で読み込まれますが、WAVのフォーマットによってdtypeが変わるので注意が必要です。読み込んだ後はpythonで信号処理などを行います。

2022/02/10 2022/07/20

PythonSciPySound

PythonのライブラリであるPySoundFileで音声/音楽データを読み込むには、soundfile.readを使用します。様々なデータ形式に対応しているため、非常便利な関数です。

2022/02/10 2022/07/20

PythonSound

Pythonでwav,mp3など音声/音楽データを読み込めるライブラリPyTorch, librosa, PySoundFile, Scipyをまとめました。Pythonで信号処理やディープラーニングのデータを読み込むときに使うコードです。

2022/02/11 2022/07/20

PythonPyTorchSciPySound

PythonのライブラリPyTorchで音声/音楽データを書き込むtorchaudio.saveについて説明しています。この関数は、wav, mp3, ogg, vorbis, amr-nb, amb, flac, sph, gsm, htkなど幅広いフォーマットに対応しているので非常に便利です。

2022/02/16 2022/07/20

PythonPyTorchSound

PythonのライブラリScipyで音声ファイルを書き出すための関数scipy.io.wavfile.writeについて紹介しています。numpyの配列を簡単な表現にかきだせて非常に便利です。

2022/02/16 2022/07/20

PythonSciPySound

PySoundFileで音声/音楽データを書き出しをするためにはsoundfile.writeを使用します。この関数は、WAV, FLAC, OGGやMATなど幅広いファイル形式に対応しているため、汎用的に使うことができます。

2022/02/17 2022/07/20

PythonSound

MATLABでディレクトリ（フォルダ）内のwavファイルを読み込んで、リサンプリングして書き出すまでを説明します。dir、audioread、audiowriteを使うことで簡単に行うことができます。

2022/03/30 2022/07/20

MATLABSound

音楽とオーディオ分析のPythonライブラリであるlibrosaで、音声/音楽データを読み込むにはlibrosa.loadを用いる。Numpyで読み込まれる。デフォルトのままだと、モノラル化されたり、サンプリング周波数が変更されるので注意が必要である。

2022/02/09 2022/07/20

PythonSound