设为首页 加入收藏

TOP

JAVA技巧:Heritrix中扩展自己类的过程
2014-11-23 21:44:31 来源: 作者: 【 】 浏览:51
Tags:JAVA 技巧 :Heritrix 扩展 自己 过程

  首先在Heritrix工程中创建类包my.processor.
  接着创建类FrontierScheduleHangD。
  详细代码:
  package my.processor;
  import java.util.logging.Logger;
  import org.archive.crawler.datamodel.CandidateURI;
  import org.archive.crawler.postprocessor.FrontierScheduler;
  public class FrontierScheduleHangD extends FrontierScheduler{
  final static Logger logger=Logger.getLogger(FrontierScheduleHangD.class.getName());
  public FrontierScheduleHangD(String name)
  {
  super(name);
  }
  protected void schedule(CandidateURI caUri)
  {
  String url=caUri.toString();
  if(url.endsWith(".jpg")
  ||url.endsWith(".gif")
  ||url.endsWith(".doc")
  ||url.endsWith(".html"))
  {
  return;
  }
  getController().getFrontier().schedule(caUri);
  }
  }
  接下来就是把自己的类加入到mudules选项中,如下如所示: 




  最后Add自己的Frontier。
  



】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到: 
上一篇JAVA技巧:OSGi实现动态特性的关键.. 下一篇二级java辅导:有关于JVM的垃圾收..

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容: