python实现html转ubb代码(html2ubb)

时间:2021-05-22

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import redef Html2UBB(content): #以下是将html标签转为ubb标签 pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I) content = pattern.sub(r'[url=1]2[/url]',content) pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I) content = pattern.sub(r'[img]1[/img]',content) pattern = re.compile( '<strong>([sS]+?)</strong>',re.I) content = pattern.sub(r'[b]1[/b]',content) pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I) content = pattern.sub(r'[1]2[/1]',content) pattern = re.compile( '<[^>]*?>',re.I) content = pattern.sub('',content) #以下是将html转义字符转为普通字符 content = content.replace('&lt;','<') content = content.replace('&gt;','>') content = content.replace('&rdquo;','”') content = content.replace('&ldquo;','“') content = content.replace('&quot;','"') content = content.replace('&copy;','©') content = content.replace('&reg;','®') content = content.replace('&nbsp;',' ') content = content.replace('&mdash;','—') content = content.replace('&ndash;','–') content = content.replace('&lsaquo;','‹') content = content.replace('&rsaquo;','›') content = content.replace('&hellip;','…') content = content.replace('&amp;','&') return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章