如何从Java中的给定字符串中删除HTML标签?
一个字符串 是一个final类在Java中,这是不可改变的,这意味着我们不能改变物体本身,但我们可以改变的参考对象。可以使用String类的replaceAll()方法从给定的字符串中删除HTML标签。我们可以使用 正则表达式从给定的字符串中删除HTML标签。从字符串中删除HTML标记后,它将返回字符串作为普通文本。
语法
public String replaceAll(String regex, String replacement)
示例
public class RemoveHTMLTagsTest { public static void main(String[] args) { String str = "<p><b>Welcome to nhooo.com</b></p>"; System.out.println("Before removing HTML Tags: " + str); str = str.replaceAll("\\<.*?\\>", ""); System.out.println("After removing HTML Tags: " + str); } }
输出结果
Before removing HTML Tags: <p><b>Welcome to nhooo.com</b></p> After removing HTML Tags: Welcome to nhooo.com