

Dies ist eine App, die LTX2 Lip-Sync verwendet, um sprechende Videos von etwa 10 Sekunden zu erstellen. Das Modell befindet sich noch in der Entwicklung, daher führen bereits kleine Abweichungen zum sofortigen Scheitern – aber es ist im Vergleich zu anderen relativ stabil, weshalb ich es dennoch veröffentliche. Wenn Sie die folgenden Bedingungen beachten, verbessert sich die Erfolgsquote erheblich. 1. Verwenden Sie ein Medium-Shot-Bild: von der Taille aufwärts, wobei Gesicht und Schultern deutlich sichtbar sind. Wenn das Bild zu weit entfernt ist oder den gesamten Oberkörper aus der Ferne zeigt, steigt die Fehlerrate dramatisch an. Denken Sie an eine Komposition ähnlich wie bei einem Bewerbungsfoto. 2. Audio ist derzeit auf 10 Sekunden begrenzt. Wenn Sie längeres Audio ausprobieren möchten, sehen Sie sich den LTX2-Bereich in meinem Workflow an. Audio ist derzeit auf 10 Sekunden begrenzt. Wenn Sie längeres Audio ausprobieren möchten, sehen Sie sich den LTX2-Bereich in meinem Workflow an.