http://www.datafountain.cn/projects/jdata/
我将在这个主页实现一些京东算法大赛数据进行分析的基本流程.包括:
- 数据清洗
- 数据分析
- 特征抽取
- 搭建模型
- 模型评估
语言为Python,工具主要采用pandas,numpy,matplotlib,sklearn,xgboost等.希望能给刚入门数据比赛的朋友有所帮助.
建议大家先阅读notebook,里面有较详细的介绍. 比如:
- data_cleaning.ipynb 数据清洗
- data_analysis.ipynb 数据分析
- exlpore_potential_user.ipynb 探索高潜用户行为