Giter Site home page Giter Site logo

moyy996 / avdc Goto Github PK

View Code? Open in Web Editor NEW

This project forked from mvdctop/movie_data_capture

2.4K 30.0 221.0 12.37 MB

日本电影元数据刮削器,配合kodi,emby,plex等本地媒体管理工具使用。可批量抓取,也可单个抓取。可抓取子目录下视频,多集视频(-cd1/-cd2),带字幕作品(-c., -C.)。批量添加emby演员头像。

License: GNU General Public License v3.0

Python 100.00%
jav jav-scraper emby kodi plex nfo japanese-adult-videos adult-video fanart-poster jellyfin

avdc's People

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

avdc's Issues

fc2club 地址问题

[]======================================================
[!] - 3 - 92.3% - [12/13] -
[!]Making Data for [G:/PACK/3.FC2/FC2PPV-1409922.mp4], the number is [FC2-1409922]
[+] ---Debug info---
[+]-actor : FC2系列
[+]-cover : https://fc2club.com
[+]-imagecut : 0
[+]-number : FC2-FC2-1409922
[+]-score : None
[+]-source : fc2fans_club.py
[+]-website : https://fc2club.com//html/FC2-FC2-1409922.html
[+] ---Debug info---
[-]Movie Data not found!
[
]======================================================

[+]-website : https://fc2club.com//html/FC2-FC2-1409922.html
这里多了"FC2-"

刮削过程中提示Errno 2 并停止刮削

刮削若干电影后在[+]Nfo Wrote! .... 之后提示
[-]Error in AVDC_Main: [Errno 2] No such file or directory: 'Img/SUB.png'
并停止后续刮削动作,需要重启软件开始刮削

希望能跳過前面的統計

資源動輒好幾TB 跑本地的還好 跑雲端的每次都要等好久 希望能改不要統計影片數 直接開始削刮 感謝

当有无法识别的番号时的bug

大佬您好,首先感谢您的这个工具,非常好用而且速度和快,非常感谢。
自己发现了一个小bug,情况如下:
当软件无法识别一个小姐姐的番号,或者该番号出现错误的时候,软件不会自动跳过该文件识别下一个文件,会直接卡死并显示连接有问题请检查代理。
当我把这个卡死的文件移除时,程序又正常运行,和连接情况毫无关系。
因此希望大佬修复该bug,谢谢!!!

关于以制作商分类是的问题

比如刮削天然むすめ的片子,如果文件结构为制作商/番号的时候,有时会出现把同一制作商的片子刮削到两个文件夹当中。
天然むすめ的片子有时候会在10musume下面,有时候又会在天然むすめ的文件夹下面。

[建议] mgstage官网可通过修改封面缩略图链接获得封面大图

mgstage官网的search页以及product_detail页,封面缩略图链接格式均为
https://image.mgstage.com/images/[メーカー]/[品番前半]/[品番後半]/pf_[t1,o1]_[品番].jpg
例如
https://image.mgstage.com/images/nanpatv/200gana/2359/pf_t1_200gana-2359.jpg https://image.mgstage.com/images/prestigepremium/300maan/587/pf_o1_300maan-587.jpg
尺寸为86×124或166×236
将链接中的「pf_t1_」或「pf_o1_」修改为「pf_e_」
即可获得尺寸为422×600的封面图

FC2类型影片预览图(ExtraFanart)下载失败

AVDC_QUVH0YqA6a
示例影片番号:FC2-1454239
运行日志:见附件
代理软件:V2ray 西雅图节点
使用代理可正常访问fc2club及图片,刮削时日志提示连接失败。
如果关闭代理,无法访问fc2club(其实javdb也有fc2支持的呀。。。还不用翻墙)

Series(系列)等参数只能用于媒体库的title,在emby中搜索不便

由于对于emby媒体库目前控制title,所以只有两个选择:
1.要不将番号和标题放进title————这样的后果就是Series(系列)字段就丢了,在nfo中是没有存的;
2.要不就把series放进title————这样的副作用就是没有series字段的作品,title全都是unknown

总之目前对系列这个字段没有一个好的支持,把系列用起来之后对媒体的整理效果会有下降
提出一个小建议:
类似于series,发行的字段,是否可以算在“类别”里,也就是生成nfo的时候可配置为tag

translate

hi your app is GREAT can you translate to english or spanish please
thanks a lot

Connect Failed错误,但是使用AV_Data_Capture就是正常

使用的日本代理,使用AV_Data_Capture刮削jav321或者javdb都是正常,但是AVDC刮削同一个影片,无论全局还是设置代理,都会出现Connect Failed! Please check your Proxy or Network!,报错信息如下:
jav321:[+] ---Debug info---
[+]-website : timeout

javdb:[!]Please Wait Three Seconds!
[+] ---Debug info---
[+]-website : timeout

求解决,谢谢!

请问3.963的单独刮削如何填写

image
我需要刮削的文件名FC2-PPV-1470071.mp4
但是程序说not found,网络代理正确,就是这几个FC2的没法识别。麻烦开发大大帮忙查看下,谢谢。

CDC

鄙人在使用过程中遇到蚊香社影片封面有时会出现抓取错误的问题,软件抓取到的封面看起来是裁切过得,而且有些没有将人物裁切进去,比如GANA-2164 MIUM-504 MIUM-343等。
拿GANA-2164举例,软件获取到的jav321的该影片地址为www.jav321.com/video/200gana-2164,手动访问该地址能够在页面左侧获得其正确封面地址为www.jav321.com/images/nanpatv/200gana/2164/pf_o1_200gana-2164.jpg,对比软件获取到的封面地址为www.jav321.com/images/nanpatv/200gana/2164/pb_e_200gana-2164.jpg。

而软件出来的封面更像是pb_e_200gana-2164.jpg裁剪后的图像,像是这样
GANA-2164-poster

以下为软件日志

[]======================================================
[!]Update Checking!
[!]No Newer Version Available!
[
]======================================================
[+]Created folder named D:/av/failed!
[+]Find 3 movies
[!] - 1 - 33.3% - [1/3] -
[!]Making Data for [D:/av/GANA-2164.MP4], the number is [GANA-2164]
[+] ---Debug info---
[+]-actor : Unknown
[+]-cover : https://www.jav321.com/images/nanpatv/200gana/2164/pb_e_200gana-2164.jpg
[+]-imagecut : 1
[+]-number : GANA-2164
[+]-release : 2019-10-31
[+]-runtime : 78
[+]-score : 3.6
[+]-source : jav321.py
[+]-studio : ナンパTV
[+]-tag : 白领女职员, 御姐, ナンパ, 巨乳, 素人, 颜射
[+]-title : マジ軟派、初撮。.1406.ガード固めの美人OLを必死に口説き落とし軽くおっぱいを触るとビクビク体を震わせて感じまくり!背中をなでればすっかりとろけてにおま○こも知らないうちに大洪水!
[+]-website : https://www.jav321.com/video/200gana-2164
[+]-year : 2019
[+]-naming_media : number-title
[+]-naming_file : number
[+]-folder_name : number-title-release
[+] ---Debug info---
[-]Error in Length of Path! Cut title!
[+]Folder : D:/av/JAV_output/GANA-2164-マジ軟派、初撮。.1406.ガード固めの美人OLを必死に口説き落とし軽くおっぱいを触るとビクビク体を震わせて感じまくり!背中をなでればすっか-2019-10-31
[+]From : https://www.jav321.com/video/200gana-2164
[+]Thumb Downloaded! GANA-2164-thumb.jpg
[+]Poster Cut! GANA-2164-poster.jpg
[+]Thumb Delete! GANA-2164-thumb.jpg
[+]Movie Moved! GANA-2164.MP4
[*]======================================================

Function调用javdb时有bug

Function.py第210行json_data = json.loads(javdb.main(file_number, isuncensored, appoint_url)) 这里参数传错了isuncensored应该是最后一个参数

FC2club网站无法抓取

FC2club网站好像关闭了,如果访问会重定向到http://adult.contents.fc2.com/。
但是AVDC不会重定向,只会返回网络错误。希望修改Getter/fc2fans_club.py第91行中的网址让FC2的元数据可以正常抓取。
感谢
日志
[*]======================== AVDC ======================== [*] Version 3.963 [*]====================================================== [-]Created log file: Log/2020-10-14-17-04-31.txt [*]====================================================== [!]Making Data for [X:/XXX/input/FC2-PPV-419792.mp4], the number is [FC2-PPV-419792] [+] ---Debug info--- [+]-website : timeout [+] ---Debug info--- [-]Connect Failed! Please check your Proxy or Network!

3.96 未知原因, 水印添加失效。时灵时不灵。

同一个备份,今天能识别无码,明天就不能识别,后天有可能又可以识别了。
检查各种参数,发现的确是个bug, 因为用未做任何调整的刚下载的备份,对识别 n1111 的无码片 也会出现这个问题。

建议在修复的同时,能不能加下一个 强制添加水印。
PS:3.96运行时 版本号依然显示 AVDC-3.95

刮削出现内存读取出错问题,求教

开始刮削后出现弹窗闪退。
The instruction at 0x00007FF801600BEA referenced memory at 0x00000000000000000. The memory could not be read.
在笔记本下和虚拟机中均出现这情况,小白一名,虚心求教解决办法。

Log最后一段
[*]======================================================
[!] - 3 - 12.5% - [6/48] -
[!]Making Data for [V:/New folder/06-10 中文字幕新作10連發/SSNI786.mp4], the number is [SSNI-786]

同一个资源,用3.963削刮不成功,3.961可以~貌似是proxy为no的时候javdb.py的代理有问题

使用3.963源码和release都试过了
结果是无法获取正确的url,貌似是proxy为no的时候javdb.py的代理有问题
番号为VRTM-356

QObject::connect: Cannot queue arguments of type 'QTextCursor'
(Make sure 'QTextCursor' is registered using qRegisterMetaType().)
Error in get_html :Invalid URL 'True': No schema supplied. Perhaps you meant http://True?
[-]Connect retry 1/2
Error in get_html :Invalid URL 'True': No schema supplied. Perhaps you meant http://True?
[-]Connect retry 2/2
[-]Connect Failed! Please check your Proxy or Network!

但是网络应该是没有问题的...同一个网络可以上javdb也可以上DMM也可以上javbus~并且在javbus削刮成功
切换版本为3.961之后成功削刮


[!]Making Data for [Z:/others/aria2/VRTM-356/VRTM-356-C.mp4], the number is [VRTM-356]
[!]Please Wait Three Seconds!
[+] ---Debug info---
[+]-actor : 松下美織,春菜はな,桜ちなみ
[+]-cover : https://pics.dmm.co.jp/mono/movie/adult/h_910vrtm356/h_910vrtm356pl.jpg', 'https://pics.dmm.co.jp/mono/movie/adult/h_910vrtm356/h_910vrtm356pl.jpg
[+]-director : ビンセント・ギャル
[+]-imagecut : 1
[+]-number : VRTM-356
[+]-outline : 2人っきりのプールでボディータッチ満載レッスンに男子生徒の股間がギン勃起!!濡れた競泳水着が余計にボディーラインを際立たせてる。はち切れそうな競泳水着から漏れ出すデカ乳とハミ尻に男性生徒の理性が崩壊し、競泳水着の隙間からスルッと生挿入に膣痙攣!!生徒の暴走チンポに自ら腰をくねらし勃起しっぱなしの生徒チンポを丸呑みインストラクター!!
[+]-publisher : V&R PRODUCE
[+]-release : 2018-06-08
[+]-runtime : 135
[+]-score : 4.0
[+]-series : 地元プールの水泳教室
[+]-source : javdb.py
[+]-studio : ブイアンドアールプロデュース
[+]-tag : 巨乳, 企畫, 女上位, 乳房, 學校泳裝, 戀乳癖, 屁股, 泳裝, 故事集, **
[+]-title : 地元プールの水泳教室の参加者は僕1人だけ…。競泳水着のハミ乳ハミ尻のインストラクターのマンツーマン指導で大興奮!水着ズラしてヌルッとチ○コ挿入したら膝ガクしまくりながらイキ乱れた!3
[+]-website : https://javdb.com/v/RkRb4
[+]-year : 2018
[+]-naming_media : title
[+]-naming_file : number
[+]-folder_name : number
[+] ---Debug info---
[+]Folder : Z:/others/aria2//VRTM-356
[+]From : https://javdb.com/v/RkRb4
[+]Thumb Downloaded! VRTM-356-C-thumb.jpg
[+]Poster Cut! VRTM-356-C-poster.jpg
[+]Movie Existed! VRTM-356-C.mp4
[+]Nfo Wrote! VRTM-356-C.nfo
[+]ExtraFanart Downloading!

由于代理在路由器,在软件不使用代理的情况下,无法用最新版本削刮...望大佬修正

只要开启检查更新就几乎无法刮削,单片刮削功能功能也几乎不可用,已经排除代理的因素了!

开启检查更新功能刮削影片几乎百分之百无法刮削,提示网络连接失败,请检查网络或代理,但是关闭检查更新就正常了,刮削也正常。
还有一个问题,单片刮削不可用,提示跟检查更新一样,jav321直接无法访问,javdb提示等待一会,然后依旧网络错误检查网络。
我怀疑这两个问题是一个bug导致的!

JavDB刮削无码无法获取影片发行日期

image
因为JavBus没有该片信息,所以程序默认走的JavDB,但是无法正确获取发行日期,JAVDB官网是有发行日期的

[!]Making Data for   [Z:/Porn/UnCollect/杂/HEYZO-2395.mp4], the number is [HEYZO-2395]
[+] ---Debug info---
   [+]-actor        : すみれ美香
   [+]-cover        : https://jdbimgs.com/covers/kb/KBvBm.jpg
   [+]-imagecut     : 0
   [+]-number       : HEYZO-2395
   [+]-runtime      : 66
   [+]-source       : javdb.py
   [+]-studio       : HEYZO
   [+]-tag          : 知名女優, 巨乳爆乳, 乳交, 立即口交, 打手槍
   [+]-title        : すみれ美香のパイでズッてあげる!--すみれ美香
   [+]-website      : https://javdb.com/v/KBvBm
   [+]-naming_media : number title
   [+]-naming_file  : number
   [+]-folder_name  : actor/【release】number title
[+] ---Debug info---
[+]Folder : Z:/Porn/UnCollect/杂/JAV_output/すみれ美香/【unknown】HEYZO-2395 すみれ美香のパイでズッてあげる!-すみれ美香
[+]From   : https://javdb.com/v/KBvBm
[+]Thumb Downloaded!  HEYZO-2395-thumb.jpg
[+]Poster Cut         HEYZO-2395-poster.jpg from HEYZO-2395-thumb.jpg!
[+]Fanart Copied!     HEYZO-2395-fanart.jpg
[+]Thumb Delete!      HEYZO-2395-thumb.jpg
[+]Movie Moved!       HEYZO-2395.mp4
[+]Nfo Wrote!         HEYZO-2395.nfo

FC2刮削疑似失效

(没错又是我。。。晚上试了下FC2的刮削,发现直接Movie Data not found了。。。)
notepad_vHulq7fbdh
示例影片番号:见附件
运行日志:见附件
代理软件:V2ray 西雅图节点
使用代理可正常访问fc2club及图片,刮削时日志提示Movie Data not found。

3.96 mgstage 刮削數據有多餘的[ , ]

如下的 actor, studio

[+] ---Debug info---
[+]-actor : 黒崎麻里奈27歳外資系企業勤務,
[+]-cover : https://image.mgstage.com/images/luxutv/259luxu/1040/pf_o1_259luxu-1040.jpg
[+]-imagecut : 0
[+]-number : 259LUXU-1040
[+]-release : 2018-11-16
[+]-runtime : 78
[+]-score : 4.5
[+]-series : ラグジュTV
[+]-source : mgstage.py
[+]-studio : ラグジュTV,
[+]-tag : 高身長グラマラス, 独占配信, 配信専用, 素人, お姉さん, 美尻, スレンダー, 美乳, 美脚, 顔射
[+]-title : ラグジュTV.1026
[+]-website : https://www.mgstage.com/product/product_detail/259LUXU-1040/
[+]-year : 2018
[+]-naming_media : number-title
[+]-naming_file : number
[+]-folder_name : #actor/[number]-[year]
[+] ---Debug info---

DMM刮削失效

DMM的刮削不行了 全局和工具刮削都不行了 我用的日本的代理 网页可以进去。麻烦帮忙看看吧 谢谢!!

[]======================== AVDC ========================
[
] Version 3.96
[]======================================================
[-]Created log file: Log/2020-07-16-17-02-29.txt
[
]======================================================
[!]Update Checking!
[!]No Newer Version Available!
[]======================================================
[+]Find 1 movies
[!] - 1 - 100.% - [1/1] -
[!]Making Data for [C:/Users/nxa06444/Downloads/ssni00111.mp4], the number is [ssni00111]
[+] ---Debug info---
[+] ---Debug info---
[-]Movie Data not found!
[
]======================================================
[+]All finished!!!
[*]======================================================

無碼影片識別错误

開了Uncensored,
但無碼影片抓取错误, 未能識別為无码
poster, thumb, [tag]無碼[/tag], [genre]無碼[/genre] 都不成功

无码
Javdb、Javbus、Avsox: 111111-1111、111111_111、HEYZO-1111、n1111
Ja321: HEYZO-1111

image
image

3.96 无法刮削 有相同number 所有影片

无法刮削 有相同number的影片 比如像 Studio: REDHOTCollection 所有red开头的影片 只正确刮削了86 不足一半。 是否在单文件刮削下 能添加 像 tinyMediaManager 那样对相同number的影片的手动选择识别功能。

jav321 无法刮削 actor 數據

用jav321 刮削 MCDV-022, MMDV-037,MMDV-038,MMDV-046。。。。。。
发觉jav321 刮削 无码影片 都无法获取 actor 的 數據

建議增加測試模式

測試模式 不會實際改寫或搬運檔案, 但會掃瞄整個目錄的影片並輸出 CSV
CSV 內有

  1. 流水號
  2. 檔案路徑
  3. 檔名
  4. 系統偵測番號
  5. 能刮削到的站點 (最好支持多個)
  6. 影片名稱 (首個刮出來的就可以)
  7. 角色 (首個刮出來的就可以)

最完美的是可以修改 這個CSV 後再用導入來作刮削源.

  1. 可以人手修改偵測番號
  2. 可以手動個別檔案刮削站點

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.