时间:2021-05-22
最近在倒腾一个txt文件,因为文件太大,所以给切割成了好几个小的文件,只有第一个文件有标题,从第二个开始就没有标题了。
我的需求是取出指定的列的数据,踩了些坑给研究出来了。
import pandas as pd# 我们的需求是 取出所有的姓名# test1的内容'''id name score1 张三 1002 李四 993 王五 98'''test1 = pd.read_table("test1.txt") # 这个是带有标题的文件names = test1["name"] # 根据标题来取值print(names)'''张三李四王五'''# test2的内容'''4 Allen 1005 Bob 996 Candy 98'''test2 = pd.read_table("test2.txt", header=None) # 这个是没有标题的文件names = test2[1] # 根据index来取值 print(names)'''AllenBobCandy'''补充知识:关于python中pandas读取txt文件注意事项
语法:pandas.read_table()
参数:
filepath_or_buffer 文件路径或者输入对象
sep 分隔符,默认为制表符
names 读取哪些列以及读取列的顺序,默认按顺序读取所有列
engine 文件路径包含中文的时候,需要设置engine = ‘python'
encoding 文件编码,默认使用计算机操作系统的文字编码
na_values 指定空值,例如可指定null,NULL,NA,None等为空值
常见错误:设置不全
import pandasdata = pandas.read_table(‘D/anaconda/数据分析/文本.txt',engine=‘python')print(data)输出结果:
补全代码:
import pandasdata = pandas.read_table(‘D/anadondas/数据分析/文本.txt',sep = ‘,' ,#指定分隔符‘,',默认为制表符names = [‘names',‘age'],#设置列名,默认将第一行数据作为列名engine = ‘python',encoding = ‘utf8'#指定编码格式)print(data)输出结果:
以上这篇如何使用pandas读取txt文件中指定的列(有无标题)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
pandas读取txt文件读取txt文件需要确定txt文件是否符合基本的格式,也就是是否存在\t,,,等特殊的分隔符一般txt文件长成这个样子txt文件举例下面
Pandas读取大文件要处理的是由探测器读出的脉冲信号,一组数据为两列,一列为时间,一列为脉冲能量,数据量在千万级,为了有一个直接的认识,先使用Pandas读取
使用python中的pandas,xlrd,openpyxl库完成合并excel中指定sheet的操作#-*-coding:UTF-8-*-importxlrd
应用场景:使用pandas把多个相同结构的Excel文件合并为一个。原始数据:相关代码:importosimportpandasaspd#将文件读取出来放一个列
Python2.7编写的读取html中指定元素,并生成excle文件复制代码代码如下:#coding=gbkimportstringimportcodecsim