时间:2021-05-22
今天又帮女朋友处理了一下,她的实验数据,因为python是一年前经常用,最近找工作,用的是c,c++,python的有些东西忘记了,然后就一直催我,说我弄的慢,弄的慢,你自己弄啊,烦不烦啊,逼逼叨叨的,最后还不是我给弄好的?呵呵
好的,数据是这样的,我截个图
我用红括号括起来的,就是我所要提取的数据
其中lossstotal.txt是我要提取的原始数据,考虑两种方法去提取,前期以为所要提取行的数据是有一定规律的,后来发现,并不是,所以,我考虑用正则来提取,经过思考以后,完成了数据的提取,如下午所示,数据变的非常好看
代码如下:
#coding:utf-8#__author__ ='dell'import ref1=file('losstotal.txt','r')data1=f1.readlines()# print data1f1.close()results = []f2 = open('loss2.txt', 'w')# # 按照特定行提取,发现后面的行并无规律# i = 0# for line in data1:# i+=1# # print line# if((i-1)%3==0):# f2.write(line)# print line# 利用正则表达式for line in data1: data2=line.split() # print data2 for i in data2: n = re.findall(r"Iteration", i) # m=re.findall(r"loss", i) if n: # print line f2.writelines(line)f2.close()f3=file('loss2.txt','r')data3=f3.readlines()# print data1f3.close()f4 = open('loss3.txt', 'w')for line in data3: data4=line.split() # print data2 for i in data4: n = re.findall(r"loss", i) # m=re.findall(r"loss", i) if n: print line f4.writelines(line)f4.close()# 去掉逗号f5=open('loss3.txt','r')data5=f5.read()f5=data5.replace(',',' ')f6=file('lossfinal.txt','w')f6.write(f5)f6.close()# # 去掉等号=f7=open('lossfinal.txt','r')data7=f7.read()f7=data7.replace('=',' ')f8=file('lossfinal.txt','w')f8.write(f7)f8.close() # data3=lin.split() # for j in data3: # m=re.findall(r"loss",i) # if m: # print lin # # m=re.findall(r"sgd_solver.cpp",i) # n=re.findall(r"Iteration",i)我在同样的目录下,还建立了
这几个txt文件,要不然,代码跑不通的哟。
解释:我连续用了两个正则,各自把含有特定字符串的行进行提取,两个写一起,发现还是不太会,所以分开写了,但是结果还是完成的不错!
以上这篇python提取具有某种特定字符串的行数据方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
假如有一列全是字符串的dataframe,希望提取包含特定字符的所有数据,该如何提取呢?因为之前尝试使用filter,发现行不通,最终找到这个行得通的方法。举例
python从字符串中提取数字使用正则表达式,用法如下:?12345678910111213##总结##^匹配字符串的开始。##$匹配字符串的结尾。##\b匹配
excel如何提取特定字符串前后的数据?下面一起来看看。 1、如下图,要提取#后面的字符,也即红色的“SDK”到B列。
python字符串替换是python操作字符串的时候经常会碰到的问题,这里简单介绍下字符串替换方法。python字符串替换可以用2种方法实现:1是用字符串本身的
分析在Python中,字符串是不可变的。所以无法直接删除字符串之间的特定字符。所以想对字符串中字符进行操作的时候,需要将字符串转变为列表,列表是可变的,这样就可