PyTorch, PySoundFile, Scipyなどを用いることで、音声/音楽ファイルをwav,mp3などの形式で書き出すことができます。ここでは、その関数名と対応フォーマット一覧を記載します。各ライブラリの使い方詳細については関連記事をご覧ください。
各ライブラリの比較とコード
各ライブラリでの関数名、対応フォーマットと読み込み後の型は表に記載した通りです。
ライブラリ | 関数名 | 対応フォーマット | 書込み時の型 |
PyTorch | torchaudio.save | WAV, MP3, FLAC, OPUSなど | tensor |
SciPy | scipy.io.wavfile.write | WAV | ndarray |
PySoundFile | soundfile.write | WAV, FLAC, OGG, MATなど | ndarray |
torchaudio.save
import torchaudio
torchaudio.save(filepath='test.wav', src=y, sample_rate=sf)
torchaudio.save
– Torchaudio v0.10.0 Documentation
scipy.io.wavfile.write
import scipy
from scipy.io.wavfile import write
scipy.io.wavfile.write(filename='test.wav', rate=sf, data=y)
soundfile.write
import soundfile
soundfile.write(file='test.wav', data=y, samplerate=sf)
コメント