写一个nodejs的爬虫框架

创建计划
2019-04-13 15:33:16
进行中
耗时4天 19时55分51秒
关闭计划
2019-04-18 11:29:07
已完成

初衷/目标

方便我爬取一些东西

  • 访问频率限制
  • Header 头信息校验
  • 断点续爬
  • 动态页面生成
  • IP 地址限制
  • Cookie 限制(或称为登录限制)
  • 验证码限制
  • 等等…

TODO类型

  • 类库
  • 框架
  • 服务
  • 命令行工具

预计时间

  • 一天
  • 一周
  • 两周
  • 一月
  • 更久

相关链接

https://github.com/axetroy/crawler

大牛们的评论:朕有话说

还没有人评论哦,赶紧抢沙发!