- final rank: 11
比赛说明:精品旅行服务成单预测
-
竞赛背景: 第二届智慧中国杯首发 皇包车(HI GUIDES)是一个为中国出境游用户提供全球中文包车游服务的平台。
-
比赛目标:我们提供了5万多名用户在旅游app中的浏览行为记录,其中有些用户在浏览之后完成了订单,且享受了精品旅游服务,而有些用户则没有下单。参赛者需要分析用户的个人信息和浏览行为,从而预测用户是否会在短期内购买精品旅游服务。预测用户是否会在短期内购买精品旅游服务
|- hi_guide
| |- data # 比赛提供的原始数据
| | |- test
| | |- trainingset
| |- features # 特征提取函数
| | |- action.py # 行为特征
| | |- comment.py # 评论特征
| | |- history.py # 历史订单特征
| | |- profile.py # 用户信息特征
| | |- train_data.csv # 保存提取的训练特征
| | |- test_data.csv # 保存提取的测试集特征
| |- log # 模型训练日志
| |- result # 模型预测结果
| |- model # 保存训练好的模型和特征重要度分析文件
| |- data_helper.py # 执行特征提取的代码
| |- my_utils.py # 工具函数库,主要用到其中的 xgb 特征重要度分析函数
| |- m1_xgb.py # xgb 模型
| |- m2_lgb.py # lgb 模型
| |- m3_cgb.py # catboost 模型
| |- stacking.py # stacking 模型融合
| |- get_no_used_features.py # 获取 xgb 和 lgb 中的特征重要度
# run the single model
python -u m1_xgb.py
# run the stacking model
python -u stacking.py
# 注意事项
# train_data, test_data = load_feat(re_get=True, feature_path=feature_path) # 如果没有修改特征,设置re_get=False,就会直接导入之前保存好的特征。