时间:2021-05-19
第一步:引入Jsoup和lang和lang3的依赖:
Jsoup是HTML解析器
lang和lang3这两个包里有转换所需的工具类
第二步:直接使用即可:
import org.apache.commons.lang.StringEscapeUtils;import org.apache.commons.lang3.StringUtils;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.safety.Whitelist;/** * @author Piconjo */public class Html2PlainText { public static String convert(String html) { if (StringUtils.isEmpty(html)) { return ""; } Document document = Jsoup.parse(html); Document.OutputSettings outputSettings = new Document.OutputSettings().prettyPrint(false); document.outputSettings(outputSettings); document.select("br").append("\\n"); document.select("p").prepend("\\n"); document.select("p").append("\\n"); String newHtml = document.html().replaceAll("\\\\n", "\n"); String plainText = Jsoup.clean(newHtml, "", Whitelist.none(), outputSettings); String result = StringEscapeUtils.unescapeHtml(plainText.trim()); return result; }}使用测试:
到此这篇关于在Java中轻松将HTML格式文本转换为纯文本的方法示例(保留换行)的文章就介绍到这了,更多相关Java HTML转换为纯文本内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
下面这几个方法将能够帮你解决这个问题。PHP版将html中的换行符转换为文本框中的换行符:复制代码代码如下:functionbr2nl($text){retur
您知道将表格数据存储到纯文本文件背后的机制是什么吗?答案是CSV(逗号分隔值)文件,该文件允许将数据转换为纯文本格式。在这篇文章中关于“在Python如何阅读C
本文实例讲述了Python转换HTML到Text纯文本的方法。分享给大家供大家参考。具体分析如下:今天项目需要将HTML转换为纯文本,去网上搜了一下,发现Pyt
1.使用VI或者VIM命令状态下:%!xxd--将当前文本转换为16进制格式。:%!od--将当前文本转换为16进制格式。:%!xxd-c12--将当前文本转换
本文实例讲述了php自定义函数br2nl实现将html中br换行符转换为文本输入中换行符的方法。分享给大家供大家参考,具体如下:下面这几个方法将能够帮你解决这个