开始创作
历史记录
私密创作vip-icon
详情
原创

Ltx2.3 说话与唱歌应用

1.3K
0
292
2026-05-15 06:36:41 更新

此应用使用 LTX2 的同步系统生成约 10 秒的说话短视频。该模型已停止开发,整体较为稳定,但在输入条件不合适时仍可能失败。遵循以下指南可大幅提高成功率。支持最长 30 秒音频(受 Seaart 限制),但当视频超过 20 秒——尤其搭配背景音乐时——更容易出现动作重复。为获得最佳效果,请使用主体面部清晰可见、整体画质锐利的图像。提供关于预期动作的清晰指令,并在必要时用结构化提示格式明确节奏/时间点,也有助于提升一致性。LTX2 偶尔会在视频结尾添加视觉元素,因此请在提示词末尾加入 'unprocessed footage' 或 'clean version' 以减少此行为。1)请使用中景/半身图:从腰部以上,面部和肩部清晰可见。若图像过远或从远处展示上半身,失败率会显著上升。可以参考简历照片的构图。2)当前音频时长限制为 10 秒。如需尝试更长音频,请查看我工作流中的 LTX2 部分。当前音频时长限制为 10 秒。如需尝试更长音频,请查看我工作流中的 LTX2 部分。

评分与评论

4.8 /5
0个评分

尚未收到足够的评分或评论

no-data
暂无数据