该项目是北京邮电大学计算机学院2021年秋季本科三年级《Python程序设计》课程作业。
- 爬取学堂在线的计算机类课程页面内容
目标页面:https://www.xuetangx.com/search?query=&org=&classify=1&type=&status=&page=1
将课程名称、老师、所属学校和选课人数信息,保存到一个 csv 文件中。
- 爬取链家官网二手房的数据
目标页面:https://bj.lianjia.com/ershoufang/
爬取北京市东城、西城、海淀和朝阳四个城区的数据(每个区爬取5 页),将楼盘名称、总价、平米数、单价保存到 json 文件中。