时间:2021-05-20
如题:
使用正则表达式,怎么匹配特定html标签内的内容。
比如,对于如下文本串:
... ignored content
prefix content
<html>inner content</html>
postfix content
... ignored content
我们要提取出<html>标签内的内容: inner content(这里的html标签可以换成任何其它的标签,比如<p>标签)
这里引入正则表达式的group概念:详细点击文章查看
比如:对于一个正则表达式( ( A ) ( B ( C ) ) )
这样,我们就能够构造出如下的正则表达式:.*(<(html>)(.*)</\2).*
此表达式的group概念为:
显然我们要求的就是group3的内容。
注意:\2是对group2的引用,也就是html>
该正则表达式也可以写成: .*(<(html>)(.*)</(html>)).* 化简其实就是.*<html>(.*)</html>.*
代码实现为:
String p = ".*(<(html>)(.*)</\\2).*";String m = "prefix<html>午休abc</html>postfix";System.out.println("Pattern: " + p);System.out.println("String to be test: " + m);Pattern pattern = Pattern.compile(p);Matcher matcher = pattern.matcher(m);if(matcher.matches()) { System.out.println("Matched String: " + matcher.group(3));} else { System.out.println("So sad, not matching anything!");}总结
到此这篇关于Java正则表达式如何匹配特定html标签内容的文章就介绍到这了,更多相关Java正则表达式匹配html标签内容内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
正则表达式在PHP中的应用在PHP应用中,正则表达式主要用于:•正则匹配:根据正则表达式匹配相应的内容•正则替换:根据正则表达式匹配内容
下面会举几个在grep命令中使用正则表达式从一个文件中匹配到特定的IP地址。下面的正则表达式将会匹配IPV4的地址。正则表达式匹配IP地址:使用下面的正则表达式
本文实例介绍了Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法,具体内容如下python正则表达式关键内容:python正则表达式转义
本文实例讲述了Python使用正则表达式过滤或替换HTML标签的方法。分享给大家供大家参考,具体如下:python正则表达式关键内容:python正则表达式转义
ASP通过正则表达式过滤非中文字符:[CODE=language]ASP通过正则表达式过滤非中文字符ASP通过正则表达式过滤html标签[/CODE]