时间:2021-05-22
如下所示:
import pandas as pddf = pd.DataFrame({'性别' : ['男', '女', '男', '女', '男', '女', '男', '男'], '成绩' : ['优秀', '优秀', '及格', '差', '及格', '及格', '优秀', '差'], '年龄' : [15,14,15,12,13,14,15,16]})GroupBy=df.groupby("性别")GroupBy.iter()
GroupBy对象是一个迭代对象,每次迭代结果是一个元组,元组的第一个元素是该组的名称(就是groupby的列的元素名称),第二个元素是该组的具体信息,是一个数据框,索引是以前的数据框的总索引
for name,group in GroupBy: print(name) print(group)女 年龄 性别 成绩1 14 女 优秀3 12 女 差5 14 女 及格男 年龄 性别 成绩0 15 男 优秀2 15 男 及格4 13 男 及格6 15 男 优秀7 16 男 差GroupBy.groups
显示分组的组名,以及所对应的索引
print(GroupBy.groups){'女': Int64Index([1, 3, 5], dtype='int64'), '男': Int64Index([0, 2, 4, 6, 7], dtype='int64')}GroupBy.indices
类似于GroupBy.groups
print(GroupBy.indices){'女': array([1, 3, 5], dtype=int64), '男': array([0, 2, 4, 6, 7], dtype=int64)}GroupBy.get_group(name[, obj])
获得某一个分组的具体信息
In [2]: GroupBy.get_group("男")Out[2]: 年龄 性别 成绩0 15 男 优秀2 15 男 及格4 13 男 及格6 15 男 优秀7 16 男 差Grouper([key, level, freq, axis, sort])
应用
可以先通过循环获得所有的组的名称
for name in GroupBy: print(name)# 获得所有分组的名称 GroupBy.get_group(name) #获得所有该名称的数据以上这篇Pandas GroupBy对象 索引与迭代方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
层及索引levels,刚开始学习pandas的时候没有太多的操作关于groupby,仅仅是简单的count、sum、size等等,没有更深入的利用groupby
前言关于groupby与distinct性能对比:网上结论如下,不走索引少量数据distinct性能更好,大数据量groupby性能好,走索引groupby性能
在multiIndex中选定指定索引的行我们在用pandas类似groupby来使用多重index时,有时想要对多个level中的某个index对应的行进行操作
Java里面的数组数据可以通过索引来获取,那么对象呢?也是通过索引吗?今天我们就来分析一下Java集合中获取集合对象的方法迭代-Iterator。本篇文章主要分
一、递归与迭代二、什么是迭代器协议1、迭代器协议是指:对象必须提供一个next方法,执行该方法要么返回迭代中的下一项,要么就引起一个stopiteration异