View Code? Open in Web Editor
NEW
京东Jdata2018"如期而至"用户购买时间预测
jdata_2018's Introduction
- 语言:python 3.6.5
- 硬件配置:(python的lightgbm库会因cpu的不同,训练结果出现微小误差,不过我们没遇到,为以防万一还是说一下)
- 型号:thinkpad x270 cpu:Inter(R) Core(TM) i7-6500 2.5GHz 内存:8GB 操作系统:Win7
- 型号:MacBook Pro (Retina, 13-inch, Early 2015) cpu:i5-5257U System:mac OS 10.13.5
注:程序在以上两个系统均可正常运行,且结果完全一致。
- pandas:0.22.0 (这个注意一下,如果版本升级到0.23.0的话无法复现,结果会有微小差异)
- numpy:1.14.3
- lightgbm:2.1.2
- datetime:python3.6.5原生库
- math:python3.6.5原生库
- time:python3.6.5原生库
- 文件夹说明:
data:原始数据
feature:生成的特征矩阵
fea_imp_sub:提交时特征重要性排行 fea_imp_train:训练时特征重要性排行
submit:提交文件
- 相关参数:main_final.py中tran = 0 sub = 1 fea_exist = 0时为生成提交文件
- 程序入口:main_final.py (直接运行该文件即可)
jdata_2018's People
Contributors
Watchers
jdata_2018's Issues
3、特征工程
3.1 总体示意
假设:用户是否购买以及购买日期只和近期的行为习惯有关
训练集构建思路:尽可能多的利用数据
时间窗口的选择思路:离标签月越近分的越详细
![image](https://github.com/Francis1986/Jdata_2018/blob/master/img/%E7%89%B9%E5%BE%81%E5%B7%A5%E7%A8%8B.png?raw=true)
这张图 没看太懂啊
官网的链接已经打不开了,下载不了数据集了,请问博主能分享一下数据集文件吗?