Python - 在 Pandas Dataframe 中对列进行分组
要将Pandas数据框中的列分组,请使用groupby().首先,让我们创建Pandas数据框-
dataFrame = pd.DataFrame(
{
"Car": ["Audi", "Lexus", "Audi", "Mercedes", "Audi", "Lexus", "Mercedes", "Lexus", "Mercedes"],
"Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
}
)现在让我们根据Car列分组-
res = dataFrame.groupby("Car")分组后,我们将使用函数来查找分组汽车名称的注册价格(Reg_Price)的均值-
res.mean()
这将根据Car列计算注册价格的平均值。
示例
以下是代码-
import pandas as pd
#其中一列为Reg_Price的数据框
dataFrame = pd.DataFrame(
{
"Car": ["Audi", "Lexus", "Audi", "Mercedes", "Audi", "Lexus", "Mercedes", "Lexus", "Mercedes"],
"Reg_Price": [1000, 1400, 1100, 900, 1700, 1800, 1300, 1150, 1350]
}
)
print"DataFrame...\n",dataFrame
#按汽车分组
res = dataFrame.groupby("Car")
print"\nMean of Registration Price grouped according to Car names...\n",res.mean()输出结果这将产生以下输出-
DataFrame...
Car Reg_Price
0 Audi 1000
1 Lexus 1400
2 Audi 1100
3 Mercedes 900
4 Audi 1700
5 Lexus 1800
6 Mercedes 1300
7 Lexus 1150
8 Mercedes 1350
Mean of Registration Price grouped according to Car names...
Reg_Price
Car
Audi 1266.666667
Lexus 1450.000000
Mercedes 1183.333333