Java里面去掉网页里的HTML标记的方法

2014-11-23 21:57:40 · 作者: · 浏览: 62

段落替换为换行
  content=content.replaceAll(" ","rn");
  //

替换为换行
  content=content.replaceAll(" ","rn");
  //去掉其它的<>之间的东西
  content=content.replaceAll("<.* >","");
  //还原HTML
  //content=HTMLDecoder.decode(content);
  returncontent;
  }