

Bu uygulama, yaklaşık 10 saniyelik konuşan videolar oluşturmak için LTX2'nin dudak senkronizasyonunu (lip-sync) kullanan bir uygulamadır. Model henüz geliştirme aşamasındadır, bu nedenle küçük uyumsuzluklar bile hemen başarısız olmasına neden olur; ancak diğerlerine kıyasla nispeten kararlıdır, bu yüzden yine de paylaşıyorum. Aşağıdaki koşulları takip ederseniz başarı oranı önemli ölçüde artar. 1. Orta ölçekli (medium-shot) bir görüntü kullanın: belden yukarısı, yüz ve omuzlar net bir şekilde görünür olmalıdır. Görüntü çok uzaktaysa veya tüm üst gövdeyi uzaktan gösteriyorsa başarısızlık oranı önemli ölçüde artar. Özgeçmiş fotoğrafına benzer bir kompozisyon düşünün. 2. Ses şu anda 10 saniye ile sınırlıdır. Daha uzun bir ses denemek isterseniz, workflow'umdaki LTX2 bölümüne göz atın. Ses şu anda 10 saniye ile sınırlıdır. Daha uzun bir ses denemek isterseniz, workflow'umdaki LTX2 bölümüne göz atın.