Giter Site home page Giter Site logo

Comments (11)

allanpk716 avatar allanpk716 commented on May 18, 2024

对于1

这里使用的是 shooter 给出的接口,需要读取视频文件计算出一个唯一ID(类似 MD5),然后通过这个 ID 去查询的。你提到的 assrt.net 这个是伪射手(射手关闭后出现的),貌似不是跟射手是一家。射手已经不提供网页服务了,伪射手提供网页服务。

本程序只有 zimuku 和 subhd 是通过爬虫去实现字幕查询的,shooter 和 xunlei 是有 API 接口。爬虫需要额外的精力去维护,所以就尽可能少就最优。所以 assrt.net 很可能不会增加爬虫搜索字幕的功能。

你提到的几个视频文件用 assrt.net 能搜索到字幕,我是了下直接复制其文件名去搜索是没有结果的。你能截图你提到的几个视频文件搜索的结果图吗?类似:

image

对于2、3、4

有 Web 后可以提供开关。

其中简繁优先级选择,暂时没看到有更多人提,所以写固化的。你说的简繁转换,粗略看了下,还是文件字符集的问题为主,可能会乱码,所以现在都是读取判断字幕预研而已,没有做转换。后面可以尝试。不过除了简,还是港、台,貌似还不是一样的。所以做这个需求对应使用者的反馈才行,不然体验估计不太好。

对于 5

这个可能需求就比较小众了。换个思路,我觉得如果大家是通过 Emby 去观看视频的,然后给官方提需求,能够获取到已播放视频选择的是那个字幕,再想办法汇总这个字幕选择的结果,提供统一的查询接口,这样匹配最佳字幕就有基准了。

对于 6

会加入 opensubtitles 的接口,但是应该不会考虑下载英文字幕,因为本程序目标是中文字幕。机翻可以考虑,但是质量堪忧。

对于 7

这个估计依赖 Web 会好操作一些

对于 8

这个还是更新和下载策略相关,需要收集更多的反馈

对于 9

我记得会判断当前视频的字幕是不是包含中文才跳过的,这个应该可以优化。或者我做过了记不住了···得看看代码

对于 10

这个估计依赖 Web 会好操作一些

对于 11

这个参考 #12 中的回复

不知道你使用了 sonarr 和 radarr 去自动化下载视频没有,建议用上,包你满意。

from chinesesubfinder.

jappiter1 avatar jappiter1 commented on May 18, 2024

辛苦了,没想到这么快就回复了。

对于1
截屏2021-07-28 下午8 26 36
截屏2021-07-28 下午8 26 53
是这样搜索的。
我以为射手shooter指的是assrt.net,是我的错。我不知道shooter还在运作,还以为只有伪射手🤦‍♂️。

对于3
如果实现简体转繁体会有一简对多繁的问题比较难以实现能理解,希望能实现繁体转简体的功能,因为我发现下载下来的字幕有一部分只有繁体字幕,那么其实我是希望能有简体的字幕在观影的时候看着更舒服。

对于5
可能我表达的不是很清楚,您理解错了,我提的建议不是指字幕的优先级,而是手动定制从每个字幕来源网站下载的字幕的数量,以期在万一遇到不匹配的字幕或者错的字幕时,可以随时有备选的几个选项可以选择的目的。

对于9
没错,是会判断是否是中文才跳过。而我的目的正是希望可以让程序忽视它的存在,即便已经有我自己下载的中文字幕,我依旧希望程序能自动帮我下载多几个字幕以达到冗余的目的。

sonarr 和 radarr 还没研究呢,我花时间研究看看,谢谢。

from chinesesubfinder.

allanpk716 avatar allanpk716 commented on May 18, 2024

辛苦了,没想到这么快就回复了。

对于1
截屏2021-07-28 下午8 26 36
截屏2021-07-28 下午8 26 53
是这样搜索的。
我以为射手shooter指的是assrt.net,是我的错。我不知道shooter还在运作,还以为只有伪射手🤦‍♂️。

对于3
如果实现简体转繁体会有一简对多繁的问题比较难以实现能理解,希望能实现繁体转简体的功能,因为我发现下载下来的字幕有一部分只有繁体字幕,那么其实我是希望能有简体的字幕在观影的时候看着更舒服。

对于5
可能我表达的不是很清楚,您理解错了,我提的建议不是指字幕的优先级,而是手动定制从每个字幕来源网站下载的字幕的数量,以期在万一遇到不匹配的字幕或者错的字幕时,可以随时有备选的几个选项可以选择的目的。

对于9
没错,是会判断是否是中文才跳过。而我的目的正是希望可以让程序忽视它的存在,即便已经有我自己下载的中文字幕,我依旧希望程序能自动帮我下载多几个字幕以达到冗余的目的。

sonarr 和 radarr 还没研究呢,我花时间研究看看,谢谢。

在学Web相关内容了,最近有点忙,估计年底前会大更新一次,提的需求部分可以同时加上。

from chinesesubfinder.

allanpk716 avatar allanpk716 commented on May 18, 2024

关于9

感觉跟 #38 的需求类似,考虑给一个临时方案吧,见这个 issue 下的回复。

from chinesesubfinder.

allanpk716 avatar allanpk716 commented on May 18, 2024

关于3

因为做了某些功能,现在再做,会比较合适。本地测试了下,还是编码问题很麻烦···可能会因为乱码导致不正确。

from chinesesubfinder.

zhouzm avatar zhouzm commented on May 18, 2024

我也经常使用 assrt.net 手动搜索,直接使用 rarbg 源的文件名搜索命中率很高,字幕质量也不错,而且可以直接下载压缩包内的特定字幕文件。
MacOS 的 IINA 也直接支持自动下载 assrt.net 字幕
API 文档地址:https://assrt.net/api/doc

from chinesesubfinder.

allanpk716 avatar allanpk716 commented on May 18, 2024

我也经常使用 assrt.net 手动搜索,直接使用 rarbg 源的文件名搜索命中率很高,字幕质量也不错,而且可以直接下载压缩包内的特定字幕文件。 MacOS 的 IINA 也直接支持自动下载 assrt.net 字幕 API 文档地址:https://assrt.net/api/doc

  1. 暂时不考虑使用这个 API,因为是面向个人的,需要用户自己去申请
  2. 源头上并不希望引入过多用文件名去搜索的逻辑,还是以视频的唯一ID去匹配更好
  3. 如果这个网站开放了新的 API ,且支持上述特性、能够授权使用,那么应该会加入支持

from chinesesubfinder.

zhouzm avatar zhouzm commented on May 18, 2024

回复好快,感谢。
我再阐述一下更多的理由供参考:

  1. 可以使用 config.yaml 配置 token 的方式使用,对于能使用 docker 的使用者来说,申请 api token 不是困难的事
  2. 我觉得文件名搜索是一个较灵活的使用方案(至少 rarbg 的文件名例如:Raya.and.the.Last.Dragon.2021.1080p.BluRay.x265-RARBG 是非常容易搜索匹配的),考虑 rarbg.to 是 BT 网站排名前3,并且视频质量最高的现实,哪怕是为它写特别解析代码也是很有价值的。一部分用户(比如我)仅仅是想自动下载字幕,为了获取视频的唯一ID,还要去部署 emby 或其他刮削工具,感觉又麻烦又增加了系统的开销。

from chinesesubfinder.

allanpk716 avatar allanpk716 commented on May 18, 2024

回复好快,感谢。 我再阐述一下更多的理由供参考:

  1. 可以使用 config.yaml 配置 token 的方式使用,对于能使用 docker 的使用者来说,申请 api token 不是困难的事
  2. 我觉得文件名搜索是一个较灵活的使用方案(至少 rarbg 的文件名例如:Raya.and.the.Last.Dragon.2021.1080p.BluRay.x265-RARBG 是非常容易搜索匹配的),考虑 rarbg.to 是 BT 网站排名前3,并且视频质量最高的现实,哪怕是为它写特别解析代码也是很有价值的。一部分用户(比如我)仅仅是想自动下载字幕,为了获取视频的唯一ID,还要去部署 emby 或其他刮削工具,感觉又麻烦又增加了系统的开销。
  1. 搜索字幕的软件很多,为啥他们(特指使用文件名搜索的逻辑)都做的总觉得差那么点,就是因为用的是视频的文件名去搜索匹配的。
  2. 他们陷入了一个怪圈,如果你下载的资源名称规范,字幕上传字幕命名规范就好办。如果不规范,剩下的就需要下载器去额外的去补很多的逻辑,这就是为什么源头上不推荐使用视频的名称去搜索。
  3. 现在虽然支持了 zimuku 的搜索,但是优先都是 IMDB ID 去找,然后最差也是用 IMDB ID 去找名称,再去用或者规范的名称去搜索的原因。基本是不会直接用视频的名称去搜索的。
  4. 文件名搜索如果命名规范是可以从中解析出是 Web 还是 DVD 版本,那么对应的字幕也不同(有偏移),感觉是个好版本,起始不然。因为目前看到的 python 项目是可以很好的解决时间轴偏移问题的。现在也在复现对应的功能,那么文件名去搜索的意义是不大的。
  5. 那么多年了,射手和xunlei 的视频 ID的搜索方案(API)一直就应该是最佳的,只不过他们没怎么用心罢了···所以我也打算建立对应的 API 服务,但是需要评估。这个方案就是人越多越好,然后要解决可靠的上传源问题即可。
  6. 这个工具以后应该会进行差异化,给出 Web 配置方案,然后倾向于新手使用,然后另一个版本会优先考虑深度用户(寻求字幕的分享给新手用户),需要配置一些信息,给出更多的设置(也许有你提及的 API 支持)。

最后,这些都是体力活···有空填填坑,只能先关注必须的功能,然后尽可能目标明确些,就会在近期有所取舍。不然取名字就不会是“中文字幕下载者”了···

from chinesesubfinder.

six00 avatar six00 commented on May 18, 2024

兄弟 我觉得你这要求太多了 本身字幕自动化就是小众需求 然后你再弄这么多小众化的功能点 完全浪费开发资源,当然,你愿意配合开发那更好,如果不行,那最好还是能把精力集中放在整体功能的完整性和健壮性上

from chinesesubfinder.

allanpk716 avatar allanpk716 commented on May 18, 2024

没事,有啥想做的,只要是跟中文字幕相关的,我都可以想一下。主要还是得后期容易维护。现在举例这个 issues 已经很久啦,出来了很多功能,至少我觉得还是有必要的,v0.26 应该差不多稳定了,准备发布了

from chinesesubfinder.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.