如题:
比如,对于如下文本串:
… ignored content
prefix content
<html>inner content</html>
postfix content
… ignored content
我们要提取出<html>标签内的内容: inner content(这里的html标签可以换成任何其它的标签,比如<p>标签)
这里引入正则表达式的group概念:详细点击文章查看
比如:对于一个正则表达式( ( A ) ( B ( C ) ) )
- group 1为:( ( A ) ( B ( C ) ) )
- group 2为:( A )
- group 3为:( B ( C ) )
- group 4为:( C )
这样,我们就能够构造出如下的正则表达式:.*(<(html>)(.*)</\\2).*
此表达式的group概念为:
- group 1: (<(html>)(.*)</\\2)
- group 2: (html>)
- group 3: (.*)
显然我们要求的就是group3的内容。
注意:\\2是对group2的引用,也就是html>
该正则表达式也可以写成: .*(<(html>)(.*)</(html>)).*
化简其实就是.*<html>(.*)</html>.*
代码实现为:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
String p = ".*(<(html>)(.*)</\\\\2).*" ;
String m = "prefix<html>午休abc</html>postfix" ;
System.out.println( "Pattern: " + p);
System.out.println( "String to be test: " + m);
Pattern pattern = Pattern.compile(p);
Matcher matcher = pattern.matcher(m);
if (matcher.matches()) {
System.out.println( "Matched String: " + matcher.group( 3 ));
} else {
System.out.println( "So sad, not matching anything!" );
}
|
总结
到此这篇关于Java正则表达式如何匹配特定html标签内容的文章就介绍到这了,更多相关Java正则表达式匹配html标签内容内容请搜索快网idc以前的文章或继续浏览下面的相关文章希望大家以后多多支持快网idc!
原文链接:https://blog.csdn.net/qq_37206105/article/details/108323320
相关文章
- 个人服务器网站搭建:如何选择合适的服务器提供商? 2025-06-10
- ASP.NET自助建站系统中如何实现多语言支持? 2025-06-10
- 64M VPS建站:如何选择最适合的网站建设平台? 2025-06-10
- ASP.NET本地开发时常见的配置错误及解决方法? 2025-06-10
- ASP.NET自助建站系统的数据库备份与恢复操作指南 2025-06-10
- 2025-07-10 怎样使用阿里云的安全工具进行服务器漏洞扫描和修复?
- 2025-07-10 怎样使用命令行工具优化Linux云服务器的Ping性能?
- 2025-07-10 怎样使用Xshell连接华为云服务器,实现高效远程管理?
- 2025-07-10 怎样利用云服务器D盘搭建稳定、高效的网站托管环境?
- 2025-07-10 怎样使用阿里云的安全组功能来增强服务器防火墙的安全性?
快网idc优惠网
QQ交流群
-
2025-05-29 28
-
2025-05-25 65
-
PHP实现的mysql操作类【MySQL与MySQLi方式】
2025-05-29 58 -
创建站点时报错:PHP版本不兼容,应该如何选择合适的PHP版本?
2025-05-27 53 -
2025-05-29 47