当前位置:首页 > 行业动态 > 正文

java如何去掉html标签

要去掉HTML标签,可以使用正则表达式或者Java的Jsoup库,这里给出两种方法的详细步骤:

java如何去掉html标签  第1张

方法一:使用正则表达式

1、导入需要的库:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

2、编写一个方法,接收一个包含HTML标签的字符串作为参数,返回去掉HTML标签后的字符串:

public static String removeHtmlTags(String html) {
    String regex = "<[^>]+>";
    Pattern pattern = Pattern.compile(regex);
    Matcher matcher = pattern.matcher(html);
    return matcher.replaceAll("");
}

3、调用该方法,传入包含HTML标签的字符串,得到去掉HTML标签后的字符串:

public static void main(String[] args) {
    String html = "<p>这是一个包含HTML标签的字符串</p>";
    String result = removeHtmlTags(html);
    System.out.println(result);
}

方法二:使用Jsoup库

1、需要在项目中添加Jsoup库的依赖,如果使用Maven,可以在pom.xml文件中添加以下依赖:

<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.14.3</version>
</dependency>

2、编写一个方法,接收一个包含HTML标签的字符串作为参数,返回去掉HTML标签后的字符串:

import org.jsoup.Jsoup;
public static String removeHtmlTags(String html) {
    return Jsoup.parse(html).text();
}

3、调用该方法,传入包含HTML标签的字符串,得到去掉HTML标签后的字符串:

public static void main(String[] args) {
    String html = "<p>这是一个包含HTML标签的字符串</p>";
    String result = removeHtmlTags(html);
    System.out.println(result);
}

以上两种方法都可以实现去掉HTML标签的功能。

0