Douban Top250 Movie Data Analysis
此项目为“数据挖掘与大数据技术”课程的团队实践项目,选题为“豆瓣 Top250 电影数据分析”。
此文件夹包含本次实践的代码及可视化分析结果,下面对该文件夹中的每个文件进行说明:
- analysis.py:可视化分析 Python 代码,其中“评论人数Top10”模块的结果存在问题;词云图部分未完成
- crawler.py:电影数据爬取代码
- test.py:测试文件
- 电影地区分布图.html:电影地区分布图
- 电影类型图.html:电影类型图
- 电影评分分布.html:电影评分分布图
- 电影上映年份分布.html:电影上映年份分布图
- 豆瓣Top250电影数据.xls:电影数据保存位置
- 排名与评分分布图.png:排名与评分分布图
- additional.zip:额外的可视化分析结果