上一篇
java如何去掉html标签
- 行业动态
- 2024-04-05
- 2070
要去掉HTML标签,可以使用正则表达式或者Java的Jsoup库,这里给出两种方法的详细步骤:
方法一:使用正则表达式
1、导入需要的库:
import java.util.regex.Matcher; import java.util.regex.Pattern;
2、编写一个方法,接收一个包含HTML标签的字符串作为参数,返回去掉HTML标签后的字符串:
public static String removeHtmlTags(String html) { String regex = "<[^>]+>"; Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(html); return matcher.replaceAll(""); }
3、调用该方法,传入包含HTML标签的字符串,得到去掉HTML标签后的字符串:
public static void main(String[] args) { String html = "<p>这是一个包含HTML标签的字符串</p>"; String result = removeHtmlTags(html); System.out.println(result); }
方法二:使用Jsoup库
1、需要在项目中添加Jsoup库的依赖,如果使用Maven,可以在pom.xml文件中添加以下依赖:
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.14.3</version> </dependency>
2、编写一个方法,接收一个包含HTML标签的字符串作为参数,返回去掉HTML标签后的字符串:
import org.jsoup.Jsoup; public static String removeHtmlTags(String html) { return Jsoup.parse(html).text(); }
3、调用该方法,传入包含HTML标签的字符串,得到去掉HTML标签后的字符串:
public static void main(String[] args) { String html = "<p>这是一个包含HTML标签的字符串</p>"; String result = removeHtmlTags(html); System.out.println(result); }
以上两种方法都可以实现去掉HTML标签的功能。
本站发布或转载的文章及图片均来自网络,其原创性以及文中表达的观点和判断不代表本站,有问题联系侵删!
本文链接:http://www.xixizhuji.com/fuzhu/310366.html