Supporta prompt multilingue, può generare audio ad alta fedeltà, coprendo voce umana, ASMR, effetti sonori, musica e altri tipi, migliorando significativamente la qualità estetica e la capacità di seguire istruzioni complesse, e ottimizzando la coerenza dell'ID e la precisione del controllo dei video generati da immagini. Scegli liberamente la risoluzione; ogni risoluzione ha un prezzo diverso.