Python

スポンサーリンク
Python

【PyTorch】Tensor配列にNaNが含まれているか判定するtorch.isnan、nanを指定した値に置き換えるtorch.nan_to_num

PyTorchでTensor配列にNaNが含まれているか判定するにはtorch.isnan、NaNを指定した値に置き換えるにはtorch.nan_to_numを使う。 torch.isnanの使い方 torch.isnanにTensor配列...
Python

【PyTorch】ランダムな整数を生成するtorch.randomint【乱数】

PyTorchでランダムな整数を生成するにはtorch.randomintを用いる。 torch.randint - PyTorch v1.12 Docs torch.randomint 第一引数lowと第二引数highで、生成する乱数の範...
Image

【最短】PyTorchでjpeg/png画像を読みこむread_image、保存するwrite_jpeg/write_png【Python】

PyTorchで画像を読み込むにはtorchvision.io.read_imageを使う。また、保存はtorchvision.io.write_jpeg/torchvision.io.write_pngを使う。 今回用いるサンプル画像をW...
librosa

Per-Channel Energy Normalization(PCEN)の性能確認【PyTorch】

キーワードスポッティングや音イベント検出で、対数log-melや対数スペクトルに変わる特徴量として提案されたPer-Channel Energy Normalization(PCEN)の性能を、yes/noのspeech commands ...
librosa

【PCEN】対数log-melに代わる特徴量PCEN【librosa】

音声識別や音響イベント検出の特徴量として、対数メルスペクトルがよく用いられています。この対数メルスペクトルに代わる特徴量として、2017年にPer-Channel Energy Normalization(PCEN)が提案され、性能が向上す...
PyTorch

【PyTorch】最大値、最小値を取得するtorch.max、torch.min

PyTorchでTensor配列の最大値、最小値を取得するためには、torch.maxとtorch.minを使います。 torch.max torch.maxはTensor配列の最大値を取得します。まず対象となるTensor配列を、3行4列...
Machine Learning

【PyTorch】エポックに応じて自動で学習率を変えるtorch.optim.lr_scheduler

PyTorchで、エポックに応じて学習率を変更するSchedulerの基本的な使い方を見ていきます。 PyTorchに実装されているScheduler 以下、リンク先ドキュメントから、PyTorchに実装されているSchedulerは14種...
Machine Learning

PyTorchのモデルの保存と読み込み方法

PyTorchにモデルの保存と読み込みには大きく分けて2種類の方法があります。1つ目はtorch.save/torch.loadを使う方法で、2つ目はTorchScript形式で保存/読み込む方法です。 参考記事 - Saving and ...
Machine Learning

【PyTorch】Focal Lossの実装と効果の確認【自作損失関数】

PyTorchにおけるFocal Lossの実装を行ない、簡単な追試を行ない性能がどのようになるか見ていきます。 Focal Lossについて Facebook AI Research (FAIR)によって2017年に物体検出を対象に提案さ...
Machine Learning

PyTorchで自作の損失関数(loss function)を使う

PyTorchで自作の損失関数(ロス関数)を使う方法について見ていきます。 自作損失関数の定義 自作損失関数はnn.Moduleを継承して、基本的には定義します。 import torch from torch import nn clas...