SpringBoot + solr + webmagic 学习solr写的demo
根据https://github.com/ameizi/solrj-example 改的,原项目是Spring,改成Springboot solrj-example的webmagic价格和图片有点小问题,图片存取URL即可,爬取的数据从存入数据库改成直接放入solr
chromedrive是2.25版本的,支持的Chrome版本v53-55,如果版本不一致自行替换chromedrive或修改chrome版本
本人用的solr6.5.1,使用自带的jetty,无需配置,tomcat启动需8或者更高版本,jdk1.8或以上
windows启动 cd solr目录/bin + solr start
linux启动 cd cd solr目录/bin + ./solr start -force
solr windows tomcat配置参考http://blog.csdn.net/liuzhen917/article/details/70328214?utm_source=itdadao&utm_medium=referral
solr CentOS tomcat配置参考http://blog.csdn.net/l1028386804/article/details/70199983
- jetty 在\server\solr中添加product文件夹, tomcat 在web.xml中配置的 F:\solr_home 路径F:\solr_home下创建product
- 复制solr目录\server\solr\configsets\basic_configs 下的conf至上面的product目录下
- 启动solr在core admin 中添加core product
- 添加field ,把Product.java 中的属性都添加入core product中,可在页面scheme中添加或修改配置文件
运行爬虫DemoApplicationTests.main获取数据