100 民生 故事 news_story
101 文化 文化 news_culture
102 娱乐 娱乐 news_entertainment
103 体育 体育 news_sports
104 财经 财经 news_finance
106 房产 房产 news_house
107 汽车 汽车 news_car
108 教育 教育 news_edu
109 科技 科技 news_tech
110 军事 军事 news_military
112 旅游 旅游 news_travel
113 国际 国际 news_world
114 证券 股票 stock
115 农业 三农 news_agriculture
116 电竞 游戏 news_game
是基于selenium对网页版抖音进行数据爬取,运行后首先有60秒的时间手动进行滑块验证,扫码登录,保存cookies后重新打开抖音,开始爬取视频简介和评论。
过程中如果遇到文字验证,会自动退出重进,避免了除滑块验证以外的其他验证。
重新打开后的滑块验证可以自动破解,具体电脑对应的get_offset内数据不同。
原项目是用appium+python+虚拟机爬取app中出现的广告视频