时间:2021-05-23
因项目需要根据指定格式的文件生成XML标注文件,可以方便使用LabelImg打开进行编辑和查看。其原始文件默认使用逗号进行分隔,如下所示:
在生成XML文件时,需要对其进行汇总,即将属于同一个原始文件的切图小文件的标注汇总到一起,其实现代码如下所示:
import osfrom Logger import MyLoggerfrom xml.dom.minidom import Documentfrom collections import defaultdictimport reclass OpeateXML: def __init__(self, srcPath: str, targetPath: str, srcFileName: str): self._srcPath = srcPath self._targetPath = targetPath self._srcFileName = srcFileName def readSrcFileName(self, fileEncoding="utf8") -> dict: data = defaultdict(list) s = re.compile("\.AIpng_\d{1,}", re.IGNORECASE) srcFileFullPath = os.path.join(self._srcPath, self._srcFileName) try: with open(srcFileFullPath, mode="r", encoding=fileEncoding, errors="ignore") as fr: for content in fr.readlines(): data[s.sub(".AIpng",content.strip().split(",")[0])].append(content.strip()) except Exception as ex: MyLogger().error(f"OperateXML:read file error:\n{ex}") return {} else: # data.sort(key=lambda x: x.strip().split(",")[0]) return data def createXML(self, data: dict, fileEncoding="utf8"): if data: try: for k,v in data.items(): doc = Document() # 创建根节点 rootNode = doc.createElement("annotation") # 添加根节点 doc.appendChild(rootNode) folder = doc.createElement("folder") folderText = doc.createTextNode(self._targetPath) folder.appendChild(folderText) rootNode.appendChild(folder) filename = doc.createElement("filename") filenameText = doc.createTextNode(k) filename.appendChild(filenameText) rootNode.appendChild(filename) path = doc.createElement("path") pathText = doc.createTextNode(os.path.join(self._targetPath,k)) path.appendChild(pathText) rootNode.appendChild(path) for i in v: tmpData = i.strip().split(",") if len(tmpData) == 6: _, ymin, xmin, ymax, xmax, labelName = tmpData objectObj = doc.createElement("object") rootNode.appendChild(objectObj) objectName = doc.createElement("name") objectNameText = doc.createTextNode(labelName) objectName.appendChild(objectNameText) objectObj.appendChild(objectName) objectBndBox = doc.createElement("bndbox") objectObj.appendChild(objectBndBox) objectBndBoxXmin = doc.createElement("xmin") objectBndBoxYmin = doc.createElement("ymin") objectBndBoxXmax = doc.createElement("xmax") objectBndBoxYmax = doc.createElement("ymax") objectBndBoxXminText = doc.createTextNode(xmin) objectBndBoxYminText = doc.createTextNode(ymin) objectBndBoxXmaxText = doc.createTextNode(xmax) objectBndBoxYmaxText = doc.createTextNode(ymax) objectBndBox.appendChild(objectBndBoxXmin) objectBndBox.appendChild(objectBndBoxYmin) objectBndBox.appendChild(objectBndBoxXmax) objectBndBox.appendChild(objectBndBoxYmax) objectBndBoxXmin.appendChild(objectBndBoxXminText) objectBndBoxYmin.appendChild(objectBndBoxYminText) objectBndBoxXmax.appendChild(objectBndBoxXmaxText) objectBndBoxYmax.appendChild(objectBndBoxYmaxText) objectObj.appendChild(objectBndBox) else: continue # save xml xmlName=os.path.splitext(k)[0]+".xml" targetPath = os.path.join(self._targetPath, xmlName) with open(targetPath, mode="w", encoding=fileEncoding) as fw: doc.writexml(fw, indent="\t", newl="\n", addindent="\t", encoding=fileEncoding) except Exception as ex: MyLogger().error(f"OperateXML:Save xml error\n{ex}") returnif __name__ == '__main__': srcPath = r"C:\Users\Surpass\Documents\PycharmProjects\data\TEST-8\outs" srcName = "locations.txt" targetPath = r"C:\Users\Surpass\Documents\PycharmProjects\data\TEST-8\outs\in_number" operateXML = OpeateXML(srcPath, targetPath, srcName) a = operateXML.readSrcFileName() operateXML.createXML(a)最终生成的XML效果如下所示:
在LabelImg中的效果如下所示:
PS:这里再为大家提供几款关于xml操作的在线工具供大家参考使用:
在线XML/JSON互相转换工具:
http://tools.jb51.net/code/xmljson
在线格式化XML/在线压缩XML:
http://tools.jb51.net/code/xmlformat
XML在线压缩/格式化工具:
http://tools.jb51.net/code/xml_format_compress
XML代码在线格式化美化工具:
http://tools.jb51.net/code/xmlcodeformat
对关于Python生成XML相关内容感兴趣的读者可查看本站专题:《Python操作xml数据技巧总结》
以上就是Python根据指定文件生成XML的方法的详细内容,更多关于Python生成XML的资料请关注其它相关文章!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
本文实例讲述了java生成XML的方法。分享给大家供大家参考,具体如下:下拉框的生成,我是通过javascript读取xml文件生成的。Xml文件是根据数据库生
本文实例讲述了python写xml文件的操作的方法,分享给大家供大家参考。具体方法如下:要生成的xml文件格式如下:samplexmlthingmaxiaoju
本文所述实例为Python处理文本文件并生成指定格式文件的方法,具体实现功能代码如下所示:importosimportsysimportstring#以指定模式
示例可以附件中下载1.加载xml文件加载XML文件共有2种方法,一是加载指定字符串,二是加载指定文件2.获取element的方法a)通过getiteratorb
本文实例讲述了使用Python生成XML的方法。分享给大家供大家参考,具体如下:1.bookstore.py#encoding:utf-8'''根据一个给定的X