-
Notifications
You must be signed in to change notification settings - Fork 148
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
关于爬虫采集小说与前后台页面响应的互相作用! #60
Comments
这是大概的访问统计情况!
|
可以考虑抽离出来,提供API的方式插入 |
我后来跟踪了一下 包括数据库 发现是与磁盘IO性能有关,当然独立之后也相对在一起要好一些!这样耦合在一起 在读写数据库时都集中到一起了! |
这个思路可行不: 抽离出来并不能解决根本问题吧,除非分布式,分库 |
也是呢,主要是IO占用过高 你的思路可以的 mogngo好像也会碰到IO问题,redis比较合适吧!!!毕竟是内存操作,批量的读写速度还是很快的! |
采用redis后 普通的数据查询走MySQL 采集先走redis 把采集的大量写对MySQL的影响屏蔽掉 |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
目前发现如果后台采集任务(更新小说任务)频繁的话,前后台的页面响应速度会非常不稳定!
目前个人想法是把爬虫部分分离出独立项目或进程,这样能增强整体稳定性,不知道作者有没有想到这方面的问题!
目前是开发机的桌面环境,采用win10系统,进程控制台可以看到非常繁忙的更新小说任务的日志输出,在这样的场景下目前发现能达到最高6s以上的页面访问延迟!
The text was updated successfully, but these errors were encountered: