我大盘鸡已经爬了247g了,500g的盘占用了330g,爬的是起点,不知道剩下的170g够不够 提醒一下,用宝塔面板的,数据库记得关闭日志,不然会双倍占用硬盘 我这里采用的方案是,爬虫机器是8h4g的cac,数据库用的1h1g 500g 的大盘鸡,前台用的vir1h 10g 的凤凰城机器 不知道有没有大佬爬了超过450g的,我感觉我这盘好像不够 http://read.v2ex.ltd/ |
网友回复:
注册: 爬虫这么占资源的吗?
etc: 爬虫其实不咋占资源,只是我那个大盘机顶不住,vir又限流量限cpu占用,所以用的cac
我的辣文最好看: 这么猛的吗
etc: 楼主大盘鸡在哪买的,有链接吗
ByteCat: 牛逼啊 大佬 佩服佩服
糯米团: https://servarica.com/ 这家的,但是现在应该没有了
chenhong005: 现在应该还有10刀3t
etc: 爬到破产为止
airinf: 怎么绑定数据库啊我是小白
注册: jar文件一起的有个yml文件,里面有127.0.0.1 books 把127.0.0.1改成你的服务器ip(如果你爬虫数据分离的话,同一台服务器就还是127.0.0.1) books就是数据库名称
注册: 你买的多少钱/m
etc: 黑五活动,12刀一年,本来是1h1g 500g 1ipv6的 有几台bug机是 ipv4,官方也说不收回, 这台机器是和好朋友@我y零kk 送我的
糯米团: 好的谢谢啦,这么香的么这机器
etc: 这么多数据的吗 那楼主得爬了多少本书啊
13香: 大佬用的PTCMS嘛?
贰拾壹: 有收录了吗?
iwktd1220: 这个系统感觉真心不错,还可以下载txt的。
爱因斯坦: 只能搜到首页好像
老包子: 访问量才是最重要的,别的都好解决
注册: 为啥你的网站我秒打开啊。。。。。。。。。。。。。
注册: 套了cf的
qlwz: 最近更新时间都05-28了。时区不对吧
etc: 他这个程序有个问题,你所有数据都写在数据库里面,几百G的数据库岂不是很蛋疼
pwlm: 这种爬的直接入库的吗?感觉多了得txt才快
a87750530: 的确直接入库的,在前台点击下载是txt的文件
hellfires: 你咋不安装plus。plus的PC端好看很多
etc: 还是喜欢杰奇那种采集到本地的。
小黑: 宝塔怎么玩,想用彩虹云独服试试看
ffb: 论坛直接搜小说精品屋,教程很全的