Java使用正则表达式删除所有HTML标签的方法示例

2025-05-29 0 85

本文实例讲述了Java使用正则表达式删除所有HTML标签的方法。分享给大家供大家参考,具体如下:

?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39
package com.xz.cxzy.utils;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class HtmlUtil {

private static final String regEx_script = "<script[^>]*?>[\\\\s\\\\S]*?<\\\\/script>"; // 定义script的正则表达式

private static final String regEx_style = "<style[^>]*?>[\\\\s\\\\S]*?<\\\\/style>"; // 定义style的正则表达式

private static final String regEx_html = "<[^>]+>"; // 定义HTML标签的正则表达式

private static final String regEx_space = "\\\\s*|\\t|\\r|\\n";//定义空格回车换行符

/**

* @param htmlStr

* @return

* 删除Html标签

*/

public static String delHTMLTag(String htmlStr) {

Pattern p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);

Matcher m_script = p_script.matcher(htmlStr);

htmlStr = m_script.replaceAll(""); // 过滤script标签

Pattern p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);

Matcher m_style = p_style.matcher(htmlStr);

htmlStr = m_style.replaceAll(""); // 过滤style标签

Pattern p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);

Matcher m_html = p_html.matcher(htmlStr);

htmlStr = m_html.replaceAll(""); // 过滤html标签

Pattern p_space = Pattern.compile(regEx_space, Pattern.CASE_INSENSITIVE);

Matcher m_space = p_space.matcher(htmlStr);

htmlStr = m_space.replaceAll(""); // 过滤空格回车标签

return htmlStr.trim(); // 返回文本字符串

}

public static String getTextFromHtml(String htmlStr){

htmlStr = delHTMLTag(htmlStr);

htmlStr = htmlStr.replaceAll(" ", "");

htmlStr = htmlStr.substring(0, htmlStr.indexOf("。")+1);

return htmlStr;

}

public static void main(String[] args) {

String str = "<div style='text-align:center;'> 整治“四风” 清弊除垢<br/><span style='font-size:14px;'> </span><span style='font-size:18px;'>公司召开党的群众路线教育实践活动动员大会</span><br/></div>";

System.out.println(getTextFromHtml(str));

}

}

希望本文所述对大家java程序设计有所帮助。

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信/支付宝扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在
点赞 (0)

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

快网idc优惠网 建站教程 Java使用正则表达式删除所有HTML标签的方法示例 https://www.kuaiidc.com/115900.html

相关文章

发表评论
暂无评论