本地视频生成大模型
📅 2026/7/3 17:55:00
👁️ 阅读次数
📝 编程学习
研究了近两个月的本地部署大模型视频生成,
最终锁定的消费级显卡能跑的两大最新的大模型ltx 2.3和wan2.2。
Ltx 2.3的优点就是音画同步生成,不需要后期的对口型配音,它的缺点就是人脸大幅度运动的时候会出现漂移变脸,面部表情不够细腻丝滑。Wan2.2的优点就是面部表情生动,画质比lts 2.3好那么一些,缺点也很明显,没有音画同步,后期还需要配音对口型,另外速度也慢几倍。
最终下来,目前为止最靠谱的办法2条线生产线:
1、单独使用用ltx 2.3的魔改版Sulphur2,用首尾帧控制人脸的漂移变形。
2、利用wan2.2的魔改版的SkyReels-V3音画同步功能,结合wan2.2的画质细腻特点,共组一个工作流。
编程学习
技术分享
实战经验