forked from lqqyt2423/wechat_spider
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathconfig.js
68 lines (64 loc) · 1.89 KB
/
config.js
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
'use strict';
const fs = require('fs');
const config = {
mongodb: {
db: 'mongodb://admin:zxcvbnm@118.24.68.134:27097/wechat_spider?authSource=admin'
},
redis: {
port: 6379,
host: '118.24.68.134',
pass: 'zxcvbnm',
POST_LIST_KEY: 'wechat_spider:post_list',
PROFILE_LIST_KEY: 'wechat_spider:profile_list'
},
// 是否用本地图片替换所有的图片请求 加快网络速度
isReplaceImg: true,
// 是否替换显示在手机上的微信文章正文内容 加快网路速度
isReplacePostBody: true,
insertJsToNextPage: {
// 是否关闭自动跳转页面
disable: false,
// 跳转时间间隔 s
jumpInterval: 2,
// 跳转文章发布时间范围
minTime: new Date(2018, 0, 1),
maxTime: new Date(2018, 2, 1),
// 已有数据的文章是否再抓取
isCrawlExist: false,
// if true updateNumAt - publishAt
crawlExistInterval: 1000 * 60 * 60 * 24 * 3,
// 抓取公众号biz范围
targetBiz: [],
// 是否保存文章内容
isSavePostContent: false,
// 保存内容的形式: html/text
saveContentType: 'text',
},
insertJsToNextProfile: {
// 是否关闭自动跳转页面
disable: false,
// 仅scroll 不跳转
onlyScroll: true,
// 跳转时间间隔 s
jumpInterval: 10,
// 抓取到minTime就跳转至下一公众号
minTime: new Date(2018, 0, 1),
// 自定义最近多久更新的公众号本次就不用抓取
maxUpdatedAt: new Date(2018, 2, 15),
// 抓取公众号biz范围
targetBiz: [],
// 程序开始时间
beginTime: new Date()
},
// 是否抓取评论
isCrawlComments: false
};
try {
// 引入外部biz文件
fs.accessSync('./targetBiz.json');
config.insertJsToNextProfile.targetBiz = require('./targetBiz.json');
config.insertJsToNextPage.targetBiz = require('./targetBiz.json');
} catch(e) {
// Do nothing
}
module.exports = config;