Data acquisition(web crawler), processing, visualization and statistical inference
近年来,数据分析岗位的需求热度持续攀升。为了深入了解数据分析岗位的相关情况,本项目从拉勾网上爬取了2020年7月24日发布的数据分析岗位,通过数据处理、数据分析、可视化及统计推断,对数据分析岗位进行了一系列探究。
注:使用的package包括 pymysql, requests, re, random, time, json, pandas, numpy, matplotlib, seaborn, pyecharts, jieba, wordcloud, math, scikit-learn。其中 pyecharts 为1.8.1版本,scikit-learn 为0.22.2版本,部分参数与旧版本不一致,如果包为旧版本运行会报错。