Skip to content

ameame-yzq/Kanzhun-Scrapy

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Kanzhun-Scrapy

看准网职位数据爬虫

项目简介

这是一个用于从看准网(kanzhun.com)爬取职位数据的Python脚本。它能够根据用户输入的关键词搜索职位信息,并将结果保存到Excel文件中。

功能特性

  • 根据用户输入的关键词搜索职位
  • 自动处理网站的加密请求
  • 解析返回的JSON数据
  • 提取职位相关信息(工作经验、学历要求、薪资、所需技能)
  • 将提取的数据保存为Excel文件

依赖库

  • requests
  • execjs
  • pandas
  • re
  • openpyxl

使用方法

  1. 确保已安装所有依赖库
  2. 在同一目录下准备kanzhun.js文件(包含必要的JavaScript函数)
  3. 运行脚本
  4. 根据提示输入要搜索的职位关键词(如"python")
  5. 脚本将自动爬取数据并保存为Excel文件

输出文件

脚本将生成一个名为zhaopin_[关键词].xlsx的Excel文件,其中包含以下列:

  • experience(工作经验要求)
  • degree(学历要求)
  • salary(薪资信息)
  • skills(所需技能)

注意事项

  • 请遵守网站的使用条款和robots.txt文件
  • 频繁使用可能导致IP被封,建议适当调整爬取频率
  • 该脚本仅用于学习和研究目的,请勿用于商业用途

贡献

欢迎提交问题和改进建议。如果您想为这个项目做出贡献,请提交pull request。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published