Unterstützt mehrsprachige Prompts, kann High-Fidelity-Audio erzeugen, das verschiedene Typen wie menschliche Stimme, ASMR, Soundeffekte, Musik usw. abdeckt, die ästhetische Qualität und die Fähigkeit zur Befolgung komplexer Anweisungen erheblich verbessert und die ID-Konsistenz und Kontrollgenauigkeit von Bild-zu-Video optimiert. Wähle die Auflösung frei; jede Auflösung hat einen anderen Preis.