时间:2021-05-22
背景:dataFrame的数据,想对某一个列做逻辑处理,生成新的列,或覆盖原有列的值
下面例子中的df均为pandas.DataFrame()的数据
1、增加新列,或更改某列的值
df["列名"]=值如果值为固定的一个值,则dataFrame中该列所有值均为这个数据
2、处理某列
df["列名"]=df.apply(lambda x:方法名(x,入参2),axis=1)说明:
1、方法名为单独的方法名,可以处理传入的x数据
2、x为每一行的数据,做为方法的入参1;x中的数据可以用【x.列名】来获取
3、入参2等为方法需要的其他参数,不需要可以不写
4、axis=1,表示每次取一行数据进行处理,按行处理
例子如下:
根据列title的是否包含特定词,来赋值给新的列1或0的值
bugInfo['IntegrationTest'] = bugInfo.apply(lambda x: self.bug_rule(x, "IntegrationTest"), axis = 1) def bug_rule(self, frame, type): # 处理列表中的数据,更新到sql数据库中 result = "0" if type == "SmokeTest": # 冒烟测试 if re.search("^\[冒烟\]|\[冒烟测试\]|【冒烟】|【冒烟测试】", frame["title"]): result = "1" elif type == "InterfaceTest": # 接口测试 if re.search("^\[接口\]|\[接口测试\]|【接口】|【接口测试】", frame["title"]): result = "1" elif type == "IntegrationTest": # 集成测试 if self.IntegrationTime != "" and self.IntegrationTime == frame["created_time"]: result = "1" return result以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
在数据预处理过程中可能会遇到这样的问题,如下图:数据中某一个key有多组数据,如何分别对每个key进行相同的运算?dataframe里面给出了一个groupby
pandas中对DataFrame筛选数据的方法有很多的,以后会后续进行补充,这里只整理遇到错误的情况。1.使用布尔型DataFrame对数据进行筛选使用一个条
1.单列运算在Pandas中,DataFrame的一列就是一个Series,可以通过map来对一列进行操作:df['col2']=df['col1'].map(
Dataframe结构放在numpy来看应该是二维矩阵的形式,每一列是一个特征,上面会有个列标题,每一行是一个样本。对Dataframe结构的某一列进行排序方法
前言大家在使用Python进行数据分析时,经常要使用到的一个数据结构就是pandas的DataFrame,关于python中pandas.DataFrame的基