Giter Site home page Giter Site logo

jieseo / hotsoon-crawler Goto Github PK

View Code? Open in Web Editor NEW

This project forked from loadchange/hotsoon-crawler

0.0 1.0 0.0 975 KB

Easily download all the videos from hotsoon.下载指定的 火山小视频(hotsoon) 用户下的视频,火山爬虫,火山小视频爬虫

Python 100.00%

hotsoon-crawler's Introduction

hotsoon-crawler

请在Python3下运行

这是一个Python的脚本,配置运行后可以从某些你指定的火山用户下载视频.

怎么样方便地讨论交流

  • 直接在Github上开新的issue;

环境安装

程序猿和程序媛见这里

配置好你的Python环境,然后pip install requests .

或者

$ git clone https://github.com/loadchange/hotsoon-crawler.git
$ cd hotsoon-crawler
$ pip install -r requirements.txt

大功告成,直接跳到下一节配置和运行.

小白见这里

  1. 首先你需要一个Python的环境,安装方法请 参照这里.

  2. 安装pip(主要是希望通过pip来安装Python的一些依赖包)

    • 当然也可以通过其他方式来安装这些包(此处自行百度),推荐通过pip来安装依赖包;
    • 如果你是Windows用户,按照上面第一个步骤来安装的Python,那么请忽略这一步, 因为已经安装过了; 如果忘记勾选,安装教程见这里
    • Mac用户,请参照这个教程
    • 然后在终端(terminal)里面运行 pip install xmltodict six "requests>=2.10.0" "PySocks>=1.5.6";
  3. 下载hotsoon-crawler并解压缩;

配置和运行

有两种方式来指定你要下载的火山用户,一是编辑user-number.txt,二是指定命令行参数.

第一种方法:编辑user-number.txt文件

找到一个文字编辑器,然后打开文件user-number.txt,把你想要下载的火山号或用户名编辑进去,以逗号/空格/tab/表格鍵/回车符分隔,可以多行.例如,如果你要下载 Gusyingyu and 英语秀,这个文件看起来是这样的:

Gusyingyu,英语秀

然后保存文件,双击运行hotsoon-video-ripper.py或者在终端(terminal)里面 运行python hotsoon-video-ripper.py

第二种方法:使用命令行参数(仅针对会使用操作系统终端的用户)

如果你对Windows或者Unix系统的命令行很熟悉,你可以通过指定运行时的命令行参数来指定要下载的站点:

python hotsoon-video-ripper.py 火山号1,火山号2

火山号或用户名以逗号分隔,不要有空格.

视频的下载与保存

程序运行后,会默认在当前路径下面的download目录中生成一个跟火山号名字相同的文件夹, 视频都会放在这个文件夹下面.

运行这个脚本,不会重复下载已经下载过的视频,所以不用担心重复下载的问题.同时,多次运行可以 帮你找回丢失的或者删除的视频.

然后重新运行下载命令.

喜欢就打赏吧!

如果您喜欢这个项目, 那就打个赏支持一下作者吧! 非常感谢!

hotsoon-crawler's People

Contributors

loadchange avatar

Watchers

James Cloos avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.