Skip to content

EXP-Codes/jzone-crawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

jzone-crawler

 QQ空间爬虫(Java版)

暗恋神器
 在你心中是否有一个默默关注的小姐姐?
 你是否想知道在遇见她之前在她身边的一切?
 确认过眼神,让你总在对的时间遇上对的人


运行环境

 

软件介绍

 此程序用于QQ空间,主要功能包括:

  • 01. 模拟QQ登陆
  • 02. 爬取目标QQ空间的【相册数据】,根据相册专辑分类,自动下载高清原图、以及图片描述等
  • 03. 爬取目标QQ空间的【说说数据】,根据说说页数分类,自动下载高清原图、以及说说内容等
  • 04. 自动整理所下载的【相册/说说数据】
  • 05. 支持两种爬取数据的模式:
      xhr: 默认模式,用于发布版,爬取速度快,但QQ空间协议经常变动,需定期更新协议避免失效
      selenium-phantomjs: 仿真模式,仅限开发版,爬取速度慢,但能确保在QQ空间协议变动不大时依然有效

运行界面展示

※ 登陆界面

登陆界面

※ 爬取QQ空间相册

爬取QQ空间相册

※ 爬取QQ空间说说

爬取QQ空间说说

※ 分类整理所下载的图文数据

分类整理所下载的图文数据

安装与使用

  • 01. 安装JDK环境【jdk-8u191-windows-x64.exe】,一直 下一步 到完成即可(无需修改安装路径)
  • 02. 解压并运行【QQ空间爬虫.exe】
  • 03. 选择【爬取相册数据】或【爬取说说数据】即可自动批量下载 图片及其相关信息
  • 04. 所下载的数据会自动整理到程序根目录下的 data 文件夹:
      ○ 不同的QQ空间数据,存储在对应的 [QQ号文件夹] 内
      ○ [album] 文件夹下保存了目标QQ的每一个相册(非加密相册)的 [相册信息]、[照片]、[照片信息]
      ○ [mood] 文件夹下保存了目标QQ的所有说说的 [图文信息]
      ○ [mood/content] 文件夹根据页数保存了该页内所有说说的 [图文信息]
      ○ [mood/photos] 文件夹汇总了所有说说的图片

注:
 此程序需要授权才能使用(防止恶意使用),请加QQ群209442488申请
 此程序不包含盗号后门,若不放心请勿使用
 此程序不包含破解功能,请确保登陆的QQ号有访问对方QQ空间和相册的权限

升级记录

v2.2版本 (2018-09-15) :

  • 01. 更新软件授权通道为SSL协议
  • 02. 修正因QQ空间升级导致xhr协议失效问题

v2.1版本 (2018-08-06) :

  • 01. 修正软件授权校验接口

v2.0版本 (2018-05-27) :

  • 01. 增加自动升级功能

v1.1版本 (2018-05-26) :

  • 01. 相册爬取
  • 02. 优化相册和说说的爬取模式为XHR
  • 03. 同时支持前后端爬虫
  • 04. 增加软件授权校验

v1.0版本 (2016-06-09) :

  • 01. 支持说说图文爬取

版权声明

 Copyright (C) EXP,2016 License: GPL v3