






PixArt-α é um Transformer-based Text-to-Image () modelo de difusão cuja qualidade de geração de imagem está no mesmo nível dos geradores de imagem de última geração, como Imagen, sdxl, e até Midjourney. Adicionalmente, ele se gaba de velocidades de treinamento significativamente mais rápidas em comparação com os geradores de imagem em grande escala existentes.