时间:2021-05-22
对于这个问题,相信很多人都会很困惑,本篇文章将会给大家介绍一种非常简单的方式向DataFrame中任意指定的位置添加一列。
在此之前或许有不少读者已经了解了最普通的添加一列的方式,如下:
import pandas as pd feature = pd.read_csv("C://Users//Machenike//Desktop//xzw//lr_train_data.txt", delimiter="\t", header=None, usecols=[0, 1])feature.columns = ["a","b"]print(feature.head())feature['c']='1'print(feature.head())这种添加方式得到的结果如下:
a b0 4.459256 8.2254181 0.043276 6.3074002 6.997162 9.3133933 4.754832 9.2603784 8.661904 9.767977 a b c0 4.459256 8.225418 11 0.043276 6.307400 12 6.997162 9.313393 13 4.754832 9.260378 14 8.661904 9.767977 1同样的也会有人想到concat()函数(关于concat()函数的更多介绍,可以参考我的另外一篇博客《在Pandas中DataFrame数据合并、连接(concat、merge、join)的实例》),如下:
import pandas as pd feature = pd.read_csv("C://Users//Machenike//Desktop//xzw//lr_train_data.txt", delimiter="\t", header=None, usecols=[0, 1])feature.columns = ["a","b"]print(feature.head())feature = pd.concat([feature, pd.DataFrame(columns=list('c'))])print(feature.head())利用concat()函数添加的结果如下:
a b0 4.459256 8.2254181 0.043276 6.3074002 6.997162 9.3133933 4.754832 9.2603784 8.661904 9.767977 a b c0 4.459256 8.225418 NaN1 0.043276 6.307400 NaN2 6.997162 9.313393 NaN3 4.754832 9.260378 NaN4 8.661904 9.767977 NaN上述两种方法添加一列存在一个弊端,那就是只能在DataFrame的末尾即最后一列添加。但是在有些情况下,我们需要在DataFrame的第一列或中间列位置添加新的一列,那么,有没有一种方法可以指定位置添加一列呢?答案是肯定的,这就是本文一开始所说的那种及其简单的方法。
如下:
import pandas as pd feature = pd.read_csv("C://Users//Machenike//Desktop//xzw//lr_train_data.txt", delimiter="\t", header=None, usecols=[0, 1])feature.columns = ["a","b"]print(feature.head())feature = feature.reindex(columns=list('cab'), fill_value=1)print(feature.head())上面代码中的使用了reindex()方法,reindex()方法可以添加一列或多列数据,并且可以指定列的位置,也可以对原先存在的列进行重排。方法中的columns属性控制着列的位置,c是添加的一列,其位于a和b前面,这说明c列是新数据框的第一列,fill_value属性指定的是添加一列的值,其结果如下:
a b0 4.459256 8.2254181 0.043276 6.3074002 6.997162 9.3133933 4.754832 9.2603784 8.661904 9.767977 c a b0 1 4.459256 8.2254181 1 0.043276 6.3074002 1 6.997162 9.3133933 1 4.754832 9.2603784 1 8.661904 9.767977同时,reindex()方法也可以同时添加多列(其实上面的concat()函数也可以添加多列,添加方式与reindex()一样),如下:
import pandas as pd feature = pd.read_csv("C://Users//Machenike//Desktop//xzw//lr_train_data.txt", delimiter="\t", header=None, usecols=[0, 1])feature.columns = ["a","b"]print(feature.head())feature = feature.reindex(columns=list('cabd'), fill_value=1)print(feature.head())我们添加了c、d两列,结果如下:
a b0 4.459256 8.2254181 0.043276 6.3074002 6.997162 9.3133933 4.754832 9.2603784 8.661904 9.767977 c a b d0 1 4.459256 8.225418 11 1 0.043276 6.307400 12 1 6.997162 9.313393 13 1 4.754832 9.260378 14 1 8.661904 9.767977 1你们在此过程中遇到了什么问题,欢迎留言,让我看看你们都遇到了哪些问题。
以上这篇使用Python向DataFrame中指定位置添加一列或多列的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
Dataframe结构放在numpy来看应该是二维矩阵的形式,每一列是一个特征,上面会有个列标题,每一行是一个样本。对Dataframe结构的某一列进行排序方法
wps是我们常用的办公软件,有时为了排版需要,要把一列数据分成多列,那么wps表格里一列数据如何调成多列?下面小编带来一列数据分割成多列数据设置方法,希望对大家
一,extract方法的使用extract函数主要是对于数据进行提取。场景一般对于DataFrame中的一列中的数据进行提取的场合比较多。例如一列中包含了很长的
Python实现按某一列关键字分组,并计算各列的平均值,并用该值填充该分类该列的nan值。DataFrame数据格式fillna方式实现groupby方式实现D
有时候我们需要添加一列自动增加数字的列,可以用下面两种方法:第一种>>>importpandasaspd>>>df=pd.DataFrame([{'name':