HTMLParser学习整理常用的解析代码

2014-11-23 17:39:06 · 作者: · 浏览: 16

  1.获取指定URL地址下面的全部的<>标签名称


  private void visitorFunction() {


  try {


  Parser parser = new Parser();


  parser.setURL("http://www.tianya.cn/publicforum/articleslist/0/no20.shtml"); parser.setEncoding(parser.getEncoding());


  NodeVisitor visitor = new NodeVisitor(){


  public void visitTag(Tag tag) {


  System.out.print("tag name is:"+tag.getTagName()+"\n class is:"+tag.getClass());


  }


  };


  parser.visitAllNodesWith(visitor);


  }catch (Exception e) {


  // TODO: handle exception


  }


  }


  2.获取指定页面的全部的链接地址即URL地址值


  private void visitorFunction() {


  try {


  Parser parser = new Parser();


  parser.setURL("http://www.tianya.cn/publicforum/articleslist/0/no20.shtml"); parser.setEncoding(parser.getEncoding());


  NodeVisitor visitor = new NodeVisitor(){


  public void visitTag(Tag tag) {


  System.out.print("tag name is:"+tag.getTagName()+"\n class is:"+tag.getClass());


  }