时间:2021-05-23
DataFrame基础属性有:values(元素)、index(索引)、columns(列名) 、dtypes(类型)、size(元素个数)、ndim(维度数)和 shape(形状大小尺寸),还有使用T属性 进行转置
import pandas as pddetail=pd.read_excel('E:\data\meal_order_detail.xlsx') #读取数据,使用read_excel 函数调用# print(detail)print("索引",detail.index)print("所以 值 :",detail.values)print("所以列名:",detail.columns)print("数据类型:",detail.dtypes)print("元素个数:",detail.size)print("维度:",detail.ndim)print("形状大小 尺寸:",detail.shape)#使用T属性 进行转置print("转置前的形状:",detail.shape)数据print("转置后的形状:",detail.T.shape)查看访问DataFramezhon'的数据
(1.1)DataFrame数据的基本查看方式
(1.2) .DataFrame的loc和iloc访问方式;
dishes_name1=detail.loc[:,'dishes_name'] #DataFrame.loc[行索引名称或条件,列索引名称]print("使用loc提取dishes_name列的size:",dishes_name1.size)dishes_name2=detail.iloc[:,3] #DataFrame.iloc[行索引位置,列索引位置]print("使用iloc提取第3列的size:",dishes_name2.size)#使用loc、iloc 实现多列切片orderDish1=detail.loc[:,['order_id','dishes_name']]print(orderDish1.size)orderDish2=detail.iloc[:,[1,3]]print(orderDish2.size)#使用loc、iloc 实现花式切片print("列名为order_id和dishes_name 的行名为3的数据:\n",detail.loc[3,['order_id','dishes_name']])print('列名为order_id和dishes_name 行名为2、3、4、5、6的数据为:\n',detail.loc[2:6,['order_id','dishes_name']])print('列名1和3,行位置为3的数据为:\n',detail.iloc[3,[1,3]]) #这里为什么不可以loc函数, #因为loc函数传入的是列索引的名称(或行的名称或条件),而iloc传入的是位置print('列位置为1和3,行位置为2,3,4,5,6的数据和:\n',detail.iloc[2:7,[1,3]])#这里是位置索引,7是取不到的#使用loc和iloc函数实现条件切片print('detail中order_id为458的dishes_name为:\n',detail.loc[detail['order_id']==458,['order_id','dishes_name']]) #使用了locprint("detail中order_id为458 的第1、5列的数据为:\n",detail.iloc[(detail['order_id']==458).values,[1,5]])#values 获取元素 #使用iloc函数(1.3).ix切片方法
#使用loc、iloc、ix 实现切片 比较(DataFrame.ix[行的索引或位置或条件,列索引名称和位置])print('列名为dishes_name行名为2,3,4,5,6的数据为:\n',detail.loc[2:6,['dishes_name']])print('列位置为5行名为2~6的数据为:\n',detail.iloc[2:6,5])print('列位置为5行名为2~6的数据为:\n',detail.ix[2:6,5])2.更改DataFame中的数据
#将order_id为458 的改成 45800detail.loc[detail['order_id']==458,'order_id'] = 45800 #45800 这里 没有单引号的print('更改后detail中的order_id为 458 的:\n',detail.loc[detail['order_id']==458,'order_id'])print('更改后detail中的order_id为 45800 的:\n',detail.loc[detail['order_id']==45800,'order_id'])detail.loc[detail['order_id']==45800,'order_id'] = 4583.为DataFrame增添数据
#新增一列非定值detail['payment']=detail['counts']*detail['amounts']print('detail新增列payment的前5行数据为:\n',detail['payment'].head())#新增一列定值detail['pay_way']='现金支付'print('detail新增列的前5行的数据为:\n',detail['pay_way'].head())``4.删除某行或某列的数据(drop)#删除某列print('删除pay_way前 detail中的列索引为:\n',detail.columns)detail.drop(labels='pay_way',axis=1,inplace=True)print('删除pay_way后 detail中的列索引为:\n',detail.columns)#删除某几行print('删除1~10行 前 detail的长度:',len(detail))detail.drop(labels=range(1,11),axis=0,inplace=True)print('删除1~10行 后 detail的长度:',len(detail))1.数值特征的描述性统计
describe()函数描述性统计
2.类别类特征的描述性统计
object类型,categroy类型
到此这篇关于Python中快速掌握Data Frame的常用操作的文章就介绍到这了,更多相关Python Data Frame的常用操作内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
前言:近段时间学习R语言用到最多的数据格式就是data.frame,现对data.frame常用操作进行总结,其中函数大部分来自dplyr包,该包由Hadley
同expand.grid()一样,data.frame()也是一个生产数据框的命令不同的是,两者产生的结果,要求不一样data.frame()的命令,如data
本文实例总结了python中字典dict常用操作方法。分享给大家供大家参考。具体如下:下面的python代码展示python中字典的常用操作,字典在python
如下所示:library(ggplot2)library(ggthemes)dt=data.frame(obj=c('A','D','B','E','C'),v
mergedataframes(inner,outer,left,right)数据>df1=data.frame(CustomerId=c(1:6),Produ