- 如何执行更新?
在命令行切换到目录
C:\financenews\crawler
,执行命令node update.js --days 2
这个就对最近2天的文章进行重新rating。执行的结果保存在C:\financenews\crawler\caches\customrate_result.json
。以下是一个样例:
{
"2017-9-10": {
"pos": 9300,
"neg": 2980,
"sense": true
},
"2017-9-9": {
"pos": 0,
"neg": 0,
"sense": false
}
}
- 如何修改算法?
算法位于文件
C:\financenews\crawler\tagging\customrating.js
,主要需要修改两个函数:rateArticle
(对一篇文章进行评价)和calculateDailyResult
(对一天的结果进行汇总)。里面有实现一个最简单的算法。 - 如何进行单元测试
单元测试的文件在
C:\financenews\crawler\tagging\testrating.js
,如果想针对某个文章进行测试,可以随时把文章拷贝进去,替换掉当前的测试字符串,然后进行单篇的测试。运行测试的方法是npm test -- -g custom
mongod --logpath "C:\financenews\mongodb\logs\logs.txt" --logappend --dbpath "C:\financenews\mongodb\data" --directoryperdb --serviceName "MongoDB" --serviceDisplayName "MongoDB" --install
4.启动程序
在命令行切换到目录C:\financenews\crawler
,执行命令npm start
或 'node main.js'
5.计算不同的Score 输出文件不同,不同的关键词,算法可能会有不同,即rateArticle3函数会有多个。曲线有多个链接,比如当前是商品,后续会加一个资金政策。customrating有没有继承,我可以比较方便的增加子类,然后修改关键词,修改rateArticle3