时间:2021-05-23
比如有一个三百多列的数据集,想要快速找到包含xxx的列,这里有三种方法
关于filter,这里可以多说一句,除了like匹配之外,还支持正则表达式匹配,参数为regex。
官方api上给出了filter更详细的用法,除了过滤列名外,还可以在行、列上进行筛选,filter全部的参数如下:
item:接收list类型参数,保留参数内项目的标签,举例
# 等同df[['a', 'b', 'c']]df.filter(item=['a', 'b', 'c'])like like='xxx' 等同 ‘xxx' in labels
regex 正则表达式,输入字符串pattern
axis 表示作用的轴
更多示例见官网:DataFrame filter函数
补充:python-pandas如何选取满足条件的特定的行和列
我就废话不多说了,大家还是直接看代码吧~
import pandas as pddf1 = pd.read_csv("data/trans/bike_flow.csv")# ['t_idx' 'r_idx' 'c_idx' 'bike_out_cnt' 'bike_in_cnt' 'flow_stay' 'flow_in' 'flow_out']print(df1.columns.values)# (23016, 8)print(df1.shape)# ['t_idx', 'bike_in_cnt']是取特定的列# df1['bike_in_cnt'] > 10是取特定的行df2 = df1[['t_idx', 'bike_in_cnt']][df1['bike_in_cnt'] > 10]# (328, 2)print(df2.shape)以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
开始之前,pandas中DataFrame删除对象可能存在几种情况1、删除具体列2、删除具体行3、删除包含某些数值的行或者列4、删除包含某些字符、文字的行或者列
pandas是python中一个功能强大的库,这里就不再复述了,简单介绍下用日期范围筛选pandas数据。日期转换用来筛选的列是date类型,所以这里要把要筛选
假如有一列全是字符串的dataframe,希望提取包含特定字符的所有数据,该如何提取呢?因为之前尝试使用filter,发现行不通,最终找到这个行得通的方法。举例
BarTender字符筛选器可以强制所选数据源的内容符合特定规则。虽然可以将“字符筛选器”对话框上的选项用于任意不同的数据源类型,但通常
excel如何提取特定字符串前后的数据?下面一起来看看。 1、如下图,要提取#后面的字符,也即红色的“SDK”到B列。