开始创作
历史记录
私密创作vip-icon
详情
原创

Ltx2.3 说话与歌唱应用

804
0
224
2026-03-28 13:58:28 更新

这是一个使用 LTX2 唇形同步技术生成约 10 秒说话视频的应用。该模型仍在开发中,即使是很小的偏差也会导致生成失败,但与其他模型相比相对稳定,因此我还是发布了它。如果遵循以下条件,成功率将显著提高。 1. 使用中景照片:从腰部以上,面部和肩膀清晰可见。如果图像太远或从远处显示整个上半身,失败率会大幅上升。请参考类似简历照片的构图。 2. 音频目前限制在 10 秒内。如果您想尝试更长的音频,请查看我工作流中的 LTX2 部分。 音频目前限制在 10 秒内。如果您想尝试更长的音频,请查看我工作流中的 LTX2 部分。

评分与评论

4.8 /5
0个评分

尚未收到足够的评分或评论

no-data
暂无数据