时间:2021-05-22
本文实例讲述了Python使用defaultdict读取文件各列的方法。分享给大家供大家参考,具体如下:
#!/usr/bin/python"""USAGE: python *.py align_SNP_site out_file"""import sys#import timefrom collections import Counter#t0=time.clock()info=open(sys.argv[1])fast=sys.argv[2]d_c = {}d1={}d2={}for line in info: cols=line.strip().split("\t") if cols[0] == "SNP pattern": continue else: d1.setdefault(cols[4],[]).append(cols[1]) d2.setdefault(cols[7],[]).append(cols[1]) #d1.setdefault(cols[0],[]).append(cols[5]) #d2[cols[0]] = "\t".join(cols[0:3])info.close()print len(d1)print len(d2)my_list=[]ref_fa = open("some_example.fasta", 'r')for i in ref_fa.readlines(): if i.startswith(">"): my_list.append(i.rstrip())ref_fa.close()print len(my_list)#sys.exit()result = open(fast,'w')for k,v in d1.iteritems(): cnt1 = Counter(v) #print cnt1 result.write("%s\t" % k) for i in sorted(cnt1.items(), key = lambda x: x[1], reverse=True): result.write("%s\t%d\t"%(i[0],i[1])) result.write("\n")for k,v in d2.iteritems(): cnt2 = Counter(v) #print cnt2 result.write("%s\t" % k) for i in sorted(cnt2.items(), key = lambda x: x[1], reverse=False): result.write("%s\t%d\t"%( i[0],i[1])) result.write("\n")#t1=time.clock()#print (t1-t0)更多关于Python相关内容感兴趣的读者可查看本站专题:《Python文件与目录操作技巧汇总》、《Python文本文件操作技巧汇总》、《Python URL操作技巧总结》、《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python Socket编程技巧总结》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》
希望本文所述对大家Python程序设计有所帮助。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
目标:目标文件为一个float32型存储的二进制文件,按列优先方式存储。本文使用Python读取该二进制文件并使用matplotlib.pyplot相关工具画出
本文实例讲述了python中readline判断文件读取结束的方法。分享给大家供大家参考。具体分析如下:大家知道,python中按行读取文件可以使用readli
本文实例讲述了Python使用xlrd读取Excel格式文件的方法。分享给大家供大家参考。具体如下:使用xlrd能够很方便的读取excel文件内容,而且这是个跨
一、Python读取csv文件说明:以Python3.x为例#读取csv文件方法1importcsvcsvfile=open('csvWrite.csv',ne
通过python对多个txt文件进行处理读取路径,读取文件获取文件名,路径名对响应的文件夹名字进行排序对txt文件内部的数据相应的某一列/某一行进行均值处理写入