时间:2021-05-23
1.单列运算
在Pandas中,DataFrame的一列就是一个Series, 可以通过map来对一列进行操作:
df['col2'] = df['col1'].map(lambda x: x**2)其中lambda函数中的x代表当前元素。可以使用另外的函数来代替lambda函数,例如:
define square(x): return (x ** 2) df['col2'] = df['col1'].map(square)2.多列运算
apply()会将待处理的对象拆分成多个片段,然后对各片段调用传入的函数,最后尝试将各片段组合到一起。
要对DataFrame的多个列同时进行运算,可以使用apply,例如col3 = col1 + 2 * col2:
df['col3'] = df.apply(lambda x: x['col1'] + 2 * x['col2'], axis=1)其中x带表当前行,可以通过下标进行索引。
示例2
applymap()
用DataFrame的applymap方法,可以将函数应用到元素级的数据上。
In [47]: f = lambda x : x+1In [48]: df.applymap(f)Out[48]: data1 data20 -1.332263 1.4778121 0.284755 1.2945282 0.066644 0.6038273 1.757402 2.5711174 3.710012 1.959990Series也有一个元素级函数应用的方法map
In [49]: df['data1']Out[49]:0 -2.3322631 -0.7152452 -0.9333563 0.7574024 2.710012Name: data1, dtype: float64In [50]: df['data1'].map(f)Out[50]:0 -1.3322631 0.2847552 0.0666443 1.7574024 3.710012Name: data1, dtype: float643.分组运算
可以结合groupby与transform来方便地实现类似SQL中的聚合运算的操作:
df['col3'] = df.groupby('col1')['col2'].transform(lambda x: (x.sum() - x) / x.count())在transform函数中x.sum()与x.count()与SQL类似,计算的是当前group中的和与数量,还可以将transform的结果作为一个一个映射来使用, 例如:
sumcount = df.groupby('col1')['col2'].transform(lambda x: x.sum() + x.count()) df['col1'].map(sumcount)对col1进行一个map,得到对应的col2的运算值。
4.聚合函数
结合groupby与agg实现SQL中的分组聚合运算操作,需要使用相应的聚合函数:
df['col2'] = df.groupby('col1').agg({'col1':{'col1_mean': mean, 'col1_sum‘': sum}, 'col2': {'col2_count': count}})上述代码生成了col1_mean, col1_sum与col2_count列。
示例2
函数 说明 count 分组中非Nan值的数量 sum 非Nan值的和 mean 非Nan值的平均值 median 非Nan值的算术中间数 std,var 标准差、方差 min,max 非Nan值的最小值和最大值 prob 非Nan值的积 first,last 第一个和最后一个非Nan值
到此这篇关于Pandas对DataFrame单列/多列进行运算(map, apply, transform, agg)的文章就介绍到这了,更多相关Pandas map apply transform agg内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
1.apply与transform首先讲一下apply()与transform()的相同点与不同点相同点:都能针对dataframe完成特征的计算,并且常常与g
背景:dataFrame的数据,想对某一个列做逻辑处理,生成新的列,或覆盖原有列的值下面例子中的df均为pandas.DataFrame()的数据1、增加新列,
对于pandas的dataframe,绘制直方图方法如下://pdf是pandas的dataframe,delta_time是其中一列//xlim是x轴的范围,
pandas提供了set_index方法可以将DataFrame的列(多列)变成行索引,通过reset_index方法可以将层次化索引的级别会被转移到列里面。1
最近在使用apply函数,总结一下用法。apply函数可以对DataFrame对象进行操作,既可以作用于一行或者一列的元素,也可以作用于单个元素。例:列元素行元