

Esta es una aplicación que utiliza la sincronización de labios (lip-sync) de LTX2 para generar videos de personas hablando de unos 10 segundos. El modelo aún está en desarrollo, por lo que incluso pequeños desajustes hacen que falle de inmediato, pero es relativamente estable en comparación con otros, así que lo publico de todos modos. Si sigues las condiciones a continuación, la tasa de éxito mejora significativamente. 1. Usa una imagen de plano medio (medium-shot): de la cintura para arriba, con la cara y los hombros claramente visibles. Si la imagen está demasiado lejos o muestra todo el torso desde la distancia, la tasa de fallos aumenta drásticamente. Piensa en una composición similar a una foto de currículum. 2. El audio está limitado actualmente a 10 segundos. Si quieres probar un audio más largo, consulta la sección LTX2 en mi workflow. El audio está limitado actualmente a 10 segundos. Si quieres probar un audio más largo, consulta la sección LTX2 en mi workflow.