java过滤html标签获取纯文本信息的实例
如下所示:
packagecom.lyt.base.util;
importjava.util.regex.Pattern;
publicclassFilterHtmlUtil{
publicstaticStringHtml2Text(StringinputString){
StringhtmlStr=inputString;//含html标签的字符串
StringtextStr="";
java.util.regex.Patternp_script;
java.util.regex.Matcherm_script;
java.util.regex.Patternp_style;
java.util.regex.Matcherm_style;
java.util.regex.Patternp_html;
java.util.regex.Matcherm_html;
try{
StringregEx_script="<[\\s]*?script[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?script[\\s]*?>";//定义script的正则表达式{或