作业提交时间:2016.6.21
- 宁小东 2120151024
- 王新灵 2120150994
- 黄建峰 2120151042
随机抽样后的数据集文件(为了便于上传)
对原始文档(共4.08GB含6个文件)处理如下:
- 随机抽取了30000条数据进行分析,对测试集只抽取了10000条且不进行分析。
- 对每个文件进行数据摘要及可视化,分析对预测结果影响较大的因素。
- 中期报告请详见interim_report.pdf。
- extracted_item.csv等CSV文件 随机抽样后的数据集
- item_analysis.m等M文件 对每个CSV文件逐个进行可视化分析,这些M文件需使用matlab先手动载入CSV并命名各字段,进而在控制台执行M文件代码
- interim_report.pdf 中期报告,对实验结果进行了详细描述