R语言 实现data.frame 分组计数、求和等

时间:2021-05-20

df为1个data.frame对象,有stratum和psu两列,这里统计stratum列计数

方法1:

cnt = table(df$stratum)

方法2:

cnt = tapply(df$psu, INDEX=df$stratum, FUN=length)

在方法2的基础上,只要改变FUN函数就可以实现分组求和、求均值等功能,如下

分组求均值:

tapply(df$psu, INDEX=df$stratum, FUN=mean)#(等价于python中的df.groupby('stratum').psu.mean)

补充:R语言 | 自定义函数对数据集(data.frame)的列进行条件判断计算

1.使用iris数据集

> iris_10 <- head(iris, n = 10)## 自定义函数:如果x >= 5.0, z = y *10> get_With_function <- function(x, y, z){+ if(x >= 5.0){+ z <- y * 10+ }+ c(zlie = z )+ }

2.保险起见,设定z列为0,可能也不需要

> iris_10$z <- 0

3.运用自定义函数,对data.frame的x行进行判断,对y列进行运算,赋值到z列

4…注意Map的使用

> iris_10$z <- with(+ iris_10,+ Map(+ get_With_function,+ iris_10$Sepal.Length,+ iris_10$Sepal.Width,+ z+ )+ )> iris_10 Sepal.Length Sepal.Width Petal.Length Petal.Width1 5.1 3.5 1.4 0.22 4.9 3.0 1.4 0.23 4.7 3.2 1.3 0.24 4.6 3.1 1.5 0.25 5.0 3.6 1.4 0.26 5.4 3.9 1.7 0.47 4.6 3.4 1.4 0.38 5.0 3.4 1.5 0.29 4.4 2.9 1.4 0.210 4.9 3.1 1.5 0.1 Species z1 setosa 352 setosa 03 setosa 04 setosa 05 setosa 366 setosa 397 setosa 08 setosa 349 setosa 010 setosa 0

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章