スポンサーリンク

Pythonで代表値(平均値、中央値、最頻値)を算出するstatistics.mean、median、mode

Python

Pythonの組み込みモジュールstatisticsで、代表値(平均値、中央値、最頻値)を算出する方法について記載する。平均値はstatistics.mean、中央値はstatistics.median、最頻値はstatistics.modeを用いる。

statistics.meanの使い方

statistics.meanの引数にdataを指定することで、平均値が算出される。dataが空の場合は、StatisticsErrorが返ってくる。

l = [1, 2, 3, 4, 4, 10, 1, 3, 7, 1]

print(statistics.mean(l))
# 3.6

b = []
print(statistics.mean(b))
# StatisticsError: mean requires at least one data point

statistics.medianの使い方

statistics.medianの引数にdataを指定することで、中央値が算出される。dataが偶数の場合は、中央値に近い2つの値の平均値で補間される。

print(statistics.median(l))
# 3.0

l2 = [1, 2]
print(statistics.median(l2))
# 1.5

statistics.modeの使い方

statistics.modeの引数にdataを指定することで、最頻値が算出される。最頻値が1つでない場合は、StatisticsErrorが返ってくる。

print(statistics.mode(l))
# 1

l2 = [1, 2]
print(statistics.mode(l2))
# StatisticsError: no unique mode; found 2 equally common values

関連記事、参考資料

コメント