时间:2021-05-22
注:以下代码是基于python3.5.0编写的
import pandasfood_info = pandas.read_csv("food_info.csv")# ------------------选取数据样本的第一行--------------------print(food_info.loc[0])#------------------选取数据样本的3到6行----------------------print(food_info.loc[3:6])#------------------head选取数据样本的前几行------------------print(food_info.head(2))# ------------------选取数据样本的2,5,10行,两种方法-----------# print(food_info.loc[[2,5,10]]) #方法一 two_five_ten = [2,5,10] #方法二print(food_info.loc[two_five_ten])# ------------------选取数据样本的NDB_No列--------------------# ndb_col = food_info["NDB_No"] #方法一 col_name = "NDB_No" #方法二ndb_col = food_info[col_name]print(ndb_col)# ------------------选取数据样本的多列-------------------# zinc_copper = food_info[["Zinc_(mg)", "Copper_(mg)"]]columns = ["Zinc_(mg)", "Copper_(mg)"]zinc_copper = food_info[columns]print(zinc_copper)# ---------------------综合小例子----------------------------col_names = food_info.columns.tolist() #把所有的行转化成listprint(col_names)gram_columns = []for c in col_names: #遍历col_names,找出所有以(g)结尾的位置 if c.endswith("(g)"): gram_columns.append(c)print(gram_columns)gram_df = food_info[gram_columns] #把所有以(g)结尾的列存放到gram_dfprint(gram_df.head(3))以上这篇基于pandas数据样本行列选取的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
Pandas主要统计特征函数:方法名函数功能sum()计算数据样本的总和(按列计算)mean()计算数据样本的算术平均数var()计算数据样本的方差std()计
Pandas中的resample,重新采样,是对原样本重新处理的一个方法,是一个对常规时间序列数据重新采样和频率转换的便捷的方法。方法的格式是:DataFram
Pandas中的resample,重新采样,是对原样本重新处理的一个方法,是一个对常规时间序列数据重新采样和频率转换的便捷的方法。降采样:高频数据到低频数据升采
pandas.DataFrame选取特定行使用Python进行数据分析时,经常要使用到的一个数据结构就是pandas的DataFrame,如果我们想要像Exce
Pandas中根据列的值选取多行数据#选取等于某些值的行记录用==df.loc[df['column_name']==some_value]#选取某列是否是某一