FLUX.1是由Stable Diffusion创始团队推出的最新开源文生图模型,由Black Forest Labs开发。这个模型以其卓越的图像质量、高度逼真的人体解剖学表现和先进的提示词遵循能力而脱颖而出,为AI图像生成设定了新的行业标准。FLUX.1拥有120亿参数,是迄今为止最大的开源文本到图像模型之一。它包括三种变体:顶级性能的FLUX.1 [pro]、开源非商业用途的FLUX.1 [dev]和快速高效的FLUX.1 [schnell]。
阿里云百炼平台已经上线了FLUX中文优化版,支持中英文指令输入,并提供一个月内1000次免费调用。这使得开发者可以在百炼平台的「模型广场」中直接调用FLUX.1开源模型API进行开发,并在百炼平台的「模型体验」区直接体验FLUX.1文生图模型的生成效果。
FLUX.1的技术创新包括多模态和并行扩散Transformer块的混合架构、流匹配训练方法、旋转位置嵌入和并行注意力层,这些都有助于提高模型性能和硬件效率。此外,该模型还引入了旋转位置嵌入技术,以增强模型对图像中不同位置特征的识别能力,从而提升图像的细节表现。
总的来说,FLUX.1是一个在图像生成领域具有显著创新和性能优势的开源模型,它的出现为AI图像生成领域带来了新的发展动力和应用可能性。