Suporta prompts multilingues, pode gerar áudio de alta fidelidade, cobrindo vários tipos, como voz humana, ASMR, efeitos sonoros, música, etc., melhora significativamente a qualidade estética e a capacidade de seguir instruções complexas e otimiza a consistência de ID e a precisão de controle de vídeo gerado por imagem. Escolha a resolução livremente; cada resolução tem um preço diferente.