Comments (14)
这个项目的问题我后续改过一版,但是会产生新的问题,我因为工作的原因,还没办法抽时间去解决。如果你们有好的方法,可以集成进去。
好的,感谢您对这个issue的持续关注
或许您可以把优化的思路po下,或者代码branch出来下?
提交了一个分支beta
from sadtalker-video-lip-sync.
想问下这个后续会有更新么?
原因我已经查到了,项目代码bug,视频是根据第一帧的嘴型进行合成,所以后续帧嘴巴张的大,合成的也会很大。我改了一版但是会面部抖动和对齐的问题,还没解决,所以就没更新。
temp_issue3.issue3.mp4
我有一种猜想(针对beta branch的视觉抖动问题,不是口型问题),在这里提出来可以讨论下:
猜想是:在ExpNet中,如果将beta0从第一帧的固定值,更改为每一帧的表情系数,有可能会天然引入面部细节的抖动。
可以观察到的事实/实验是:
-
早先master branch的结果并不抖动(因为送给ExpNet的beta0是固定的),但是beta branch的结果在抖动
-
如果将第一帧图片做成一个静态视频,用音频来驱动,使用beta分支来跑结果,则可以发现每一帧脸部都会有细小的动作
如果在ExpNet中输入的beta0是随每一帧变化的话,细小动作会不连贯的持续变化(类似于布朗运动),也就是会产生视觉上的抖动
另外,我还做了对landmark的均值平滑实验,但是还是会出现抖动。这个实验应该可以排除landmark引入抖动的可能性
可能需要额外的网络训练来适配这个问题
from sadtalker-video-lip-sync.
from sadtalker-video-lip-sync.
from sadtalker-video-lip-sync.
更新了代码,但是效果仍不佳,求帮忙看下?
感觉result-2的嘴型更大了,但是和音频还是对不上,倒是和raw.mp4很接近
原视频(视频带音频,声音用的是ffmpeg -i raw.mp4 raw.wav得到)
raw.mp4
更新代码前效果 (result-1.mp4)
result-1.mp4
更新代码后效果 (result-2.mp4)
result-2.mp4
剪映做的对比效果(compare.mp4)
https://drive.google.com/file/d/1JpC_2za5b0DYHuaxL2d275xsigYLHZCJ/view?usp=sharing
from sadtalker-video-lip-sync.
想问下这个后续会有更新么?
from sadtalker-video-lip-sync.
想问下这个后续会有更新么?
原因我已经查到了,项目代码bug,视频是根据第一帧的嘴型进行合成,所以后续帧嘴巴张的大,合成的也会很大。我改了一版但是会面部抖动和对齐的问题,还没解决,所以就没更新。
temp_issue3.issue3.mp4
from sadtalker-video-lip-sync.
嗯,我也发现用第一帧作为参考,会导致效果不稳定。
不稳定是指:发现如果视频第一帧是闭嘴,效果会好一些,如果视频人脸第一帧是张嘴,效果会比较差。
也就是说,哪怕是同一段视频,不同的剪辑方法也会导致嘴型效果不同。
不知道能否引入类似video-retalking的stablized的方法来做好归一化?
这个对于图片人(sadtalker)来说没问题,但是对于视频驱动来说,可能效果不太好。
作为对照组的wav2lip这种方案,应该没有这种问题
from sadtalker-video-lip-sync.
感觉wav2lip本身产生的唇形就不稳定,插帧+修复感觉无法解决长视频问题
from sadtalker-video-lip-sync.
感觉wav2lip本身产生的唇形就不稳定,插帧+修复感觉无法解决长视频问题
不好意思,没太懂你的这个回复和本issue的关联性?是否能详细说下
wav2lip是久经考验的lip sync SOTA战士
想问下您说的长视频问题是什么?为什么插帧+修复无法解决?
from sadtalker-video-lip-sync.
最近一直在看这个项目,看到议题,有感而发
1、一个是运行效率,感觉速度有点太慢了,冗余计算比较多
2、wav2lip的下半张脸是糊的,几乎必须靠面部修复来拉
3、插帧会减少唇形的同步效率
总之没想到一个比较好的方案来高效的解决
from sadtalker-video-lip-sync.
这个项目的问题我后续改过一版,但是会产生新的问题,我因为工作的原因,还没办法抽时间去解决。如果你们有好的方法,可以集成进去。
from sadtalker-video-lip-sync.
这个项目的问题我后续改过一版,但是会产生新的问题,我因为工作的原因,还没办法抽时间去解决。如果你们有好的方法,可以集成进去。
好的,感谢您对这个issue的持续关注
或许您可以把优化的思路po下,或者代码branch出来下?
from sadtalker-video-lip-sync.
想问下这个后续会有更新么?
原因我已经查到了,项目代码bug,视频是根据第一帧的嘴型进行合成,所以后续帧嘴巴张的大,合成的也会很大。我改了一版但是会面部抖动和对齐的问题,还没解决,所以就没更新。
temp_issue3.issue3.mp4我有一种猜想(针对beta branch的视觉抖动问题,不是口型问题),在这里提出来可以讨论下:
猜想是:在ExpNet中,如果将beta0从第一帧的固定值,更改为每一帧的表情系数,有可能会天然引入面部细节的抖动。
可以观察到的事实/实验是:
- 早先master branch的结果并不抖动(因为送给ExpNet的beta0是固定的),但是beta branch的结果在抖动
- 如果将第一帧图片做成一个静态视频,用音频来驱动,使用beta分支来跑结果,则可以发现每一帧脸部都会有细小的动作
如果在ExpNet中输入的beta0是随每一帧变化的话,细小动作会不连贯的持续变化(类似于布朗运动),也就是会产生视觉上的抖动
另外,我还做了对landmark的均值平滑实验,但是还是会出现抖动。这个实验应该可以排除landmark引入抖动的可能性
可能需要额外的网络训练来适配这个问题
抖动问题的优化,可以参见这个pr
from sadtalker-video-lip-sync.
Related Issues (20)
- is there a Google Collab for this?
- 这个和ernerf比哪个效果更好?
- 我发现本项目没有对应的微信群,不方便大家进行交流,我这边建立了一个仅限于技术交流的群,想邀请加入讨论,后续想邀请作者入群。 HOT 2
- Paddle and CUDA version conflicts?, and missing file "cudnn64_7.dll" and question about the DAIN algorithm HOT 9
- 分享经验:分辨率低的解决方法 HOT 6
- 我建立了一个非商业仅限技术讨论的群 HOT 1
- 使用--use_DAIN发生了InvalidArgumentError相关错误
- 建立的视频有长度限制吗?
- RuntimeError: Unable to open ./checkpoints/shape_predictor_68_face_landmarks.dat
- 是否支持多显卡执行?
- 用python-3.9.13终于成功
- 此项目支持Windows 上面运行么?
- 程序被kill了,有人遇到过什么原因吗 HOT 1
- scipy==1.5.3 在哪下载?pip最高版本1.3?
- enhancer lip 视频脸部出现光条
- 希望可以搞一个在webui上面可以使用的谢谢~
- ModuleNotFoundError: No module named 'skimage'
- How to generate 30fps, instead of 25fps?
- 微调后的wav2lip模型可以直接在项目中使用吗,如果需要使用要如何进行更改? HOT 1
- Who needs high-quality lip sync - contact me! HOT 1
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from sadtalker-video-lip-sync.