Pandas GroupBy对象索引与迭代方法

时间：2021-05-22

如下所示：

import pandas as pddf = pd.DataFrame({'性别' : ['男', '女', '男', '女', '男', '女', '男', '男'], '成绩' : ['优秀', '优秀', '及格', '差', '及格', '及格', '优秀', '差'], '年龄' : [15,14,15,12,13,14,15,16]})GroupBy=df.groupby("性别")

GroupBy.iter()

GroupBy对象是一个迭代对象，每次迭代结果是一个元组，元组的第一个元素是该组的名称(就是groupby的列的元素名称)，第二个元素是该组的具体信息，是一个数据框，索引是以前的数据框的总索引

for name,group in GroupBy: print(name) print(group)女年龄性别成绩1 14 女优秀3 12 女差5 14 女及格男年龄性别成绩0 15 男优秀2 15 男及格4 13 男及格6 15 男优秀7 16 男差

GroupBy.groups

显示分组的组名，以及所对应的索引

print(GroupBy.groups){'女': Int64Index([1, 3, 5], dtype='int64'), '男': Int64Index([0, 2, 4, 6, 7], dtype='int64')}

GroupBy.indices

类似于GroupBy.groups

print(GroupBy.indices){'女': array([1, 3, 5], dtype=int64), '男': array([0, 2, 4, 6, 7], dtype=int64)}

GroupBy.get_group(name[, obj])

获得某一个分组的具体信息

In [2]: GroupBy.get_group("男")Out[2]: 年龄性别成绩0 15 男优秀2 15 男及格4 13 男及格6 15 男优秀7 16 男差

Grouper([key, level, freq, axis, sort])

应用

可以先通过循环获得所有的组的名称

for name in GroupBy: print(name)# 获得所有分组的名称 GroupBy.get_group(name) #获得所有该名称的数据

以上这篇Pandas GroupBy对象索引与迭代方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持。

Pandas GroupBy对象 索引与迭代方法

相关文章

浅谈pandas用groupby后对层级索引levels的处理方法

MySQL去重该使用distinct还是group by？

在pandas多重索引multiIndex中选定指定索引的行方法

Java集合框架中迭代器Iterator解析

Python迭代器协议及for循环工作机制详解

Pandas GroupBy对象索引与迭代方法