pandasで平均値を求める

目次

イントロダクション

データ分析において、平均値は非常に重要な数値です。平均値を求めることにより、データの中心傾向を理解し、そのデータが持つ特徴を把握することができます。この記事では、Pythonのpandasライブラリを使用して、データフレームから平均値を求める方法を紹介します。

データフレームから平均値を求める

pandasライブラリを使用すると、データフレームから簡単に平均値を求めることができます。以下は、pandasを使用してデータフレームから平均値を求める方法です。

import pandas as pd

# データフレームの作成
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [5, 4, 3, 2, 1]})

# 列ごとの平均値を求める
print(df.mean())

上記のコードを実行すると、以下のように出力されます。

A    3.0
B    3.0
dtype: float64

このように、mean()関数を使用することで、列ごとの平均値を求めることができます。

条件付きの平均値を求める

pandasを使用して、条件付きの平均値を求めることもできます。例えば、ある列の値が特定の値を満たす行だけで平均値を求める場合、以下のようにコードを記述します。

# 特定の条件を満たす行だけで平均値を求める
print(df.loc[df['A'] > 2].mean())

上記のコードを実行すると、以下のように出力されます。

A    4.0
B    2.0
dtype: float64

このように、loc関数を使用して条件を指定することで、条件付きの平均値を求めることができます。

欠損値を含むデータフレームから平均値を求める

データフレームには欠損値が含まれる場合があります。pandasを使用して、欠損値を含むデータフレームから平均値を求める場合は、以下のようにコードを記述します。

# 欠損値を含むデータフレームから平均値を求める
df_with_nan = pd.DataFrame({'A': [1, 2, None, 4, 5], 'B': [5, None, 3, 2, 1]})
print(df_with_nan.mean(skipna=True))

上記のコードを実行すると、以下のように出力されます。

A    3.0
B    2.75
dtype: float64

このように、mean()関数のskipnaパラメータをTrueに設定することで、欠損値を無視して平均値を求めることができます。

まとめ

この記事では、pandasライブラリを使用して、データフレームから平均値を求める方法を紹介しました。また、条件付きの平均値や欠損値を含むデータフレームから平均値を求める方法についても説明しました。平均値を求めることは、データ分析において非常に重要なステップの一つです。ぜひ、この記事を参考にして、データ分析のスキルを磨いてみてください。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

コメント

コメントする

CAPTCHA


目次