Pythonの組み込みモジュールstatisticsで、代表値(平均値、中央値、最頻値)を算出する方法について記載する。平均値はstatistics.mean、中央値はstatistics.median、最頻値はstatistics.modeを用いる。
statistics.meanの使い方
statistics.meanの引数にdataを指定することで、平均値が算出される。dataが空の場合は、StatisticsErrorが返ってくる。
l = [1, 2, 3, 4, 4, 10, 1, 3, 7, 1]
print(statistics.mean(l))
# 3.6
b = []
print(statistics.mean(b))
# StatisticsError: mean requires at least one data point
statistics.medianの使い方
statistics.medianの引数にdataを指定することで、中央値が算出される。dataが偶数の場合は、中央値に近い2つの値の平均値で補間される。
print(statistics.median(l))
# 3.0
l2 = [1, 2]
print(statistics.median(l2))
# 1.5
statistics.modeの使い方
statistics.modeの引数にdataを指定することで、最頻値が算出される。最頻値が1つでない場合は、StatisticsErrorが返ってくる。
print(statistics.mode(l))
# 1
l2 = [1, 2]
print(statistics.mode(l2))
# StatisticsError: no unique mode; found 2 equally common values
コメント