查看完整版本: [-- 最新文生图模型FLUX爆火,阿里云上线首个中文优化版[3P] --]

武当休闲山庄 -> 数码讨论 -> 最新文生图模型FLUX爆火,阿里云上线首个中文优化版[3P] [打印本页] 登录 -> 注册 -> 回复主题 -> 发表主题

huozm32831 2024-08-10 15:50

近日,由Stable Diffusion原班人马打造的开源文生图模型FLUX爆火,因逼近Midjourney的出色生成质量成为文生图领域的“开源王者”。在国内,阿里云魔搭社区第一时间上架FLUX模型,阿里云百炼平台上线首个FLUX中文优化版,可更好地理解和执行中文指令,开发者可以轻松在阿里云百炼上直接体验FLUX效果,并限时免费调用该模型。

FLUX官方生成效果图
FLUX由Stable Diffusion核心作者创办的Black Forest labs研发,首款模型FLUX.1一经推出便成为文生图界的黑马,获得众多AI开发者好评。FLUX.1采用了Stable Diffusion 3类似架构,但新引入了DoubleStreamBlock结构,达到了超越Stable Diffusion 3 甚至挑战Midjourney V6的生成质量。在对指令的精准遵循、文字生成能力、手部细节生成等方面,FLUX.1表现尤为突出,展现出在文生图领域的革新潜力。
为方便国内开发者,阿里云百炼平台第一时间上线了FLUX.1开源模型,并对模型的中文prompt生成效果进行了优化。无需下载模型和部署,开发者可以在百炼模型中心直接体验或调用FLUX模型,支持输入中文或英文prompt指令,可指定图片生成尺寸、调整seed值,生成图片效果还能与其他模型效果进行直观对比。同时,阿里云百炼平台限时一个月为所有用户提供1000次FLUX图片生成的免费算力。

阿里云百炼上测试FLUX.1:“一个时间旅行者的图书馆,书籍打开时展现出不同历史事件的全息场景”
近期,阿里云百炼平台模型上新不断,包括通义千问Qwen2、零一万物、百川智能、MiniMax、Llama3.1、FLUX.1等众多优质模型。不久前,零一万物CEO李开复便官宣,Yi-Large等四款大模型登陆百炼平台,阿里云因为完备的工具链和丰富的云上算力资源,成为零一万物通过云厂商提供API服务的第一选择。
据了解,阿里云百炼已成为国内模型最丰富的AI云平台,目前已集成上百款大模型API,覆盖国内外主流厂商。除了阿里云自研的通义系列,百炼还首家托管国内多家头部大模型公司的旗舰模型,同时第一时间集成全球主流开源模型,涵盖文本生成、图片生成和理解、音频生成和理解、视频生成等多种模态。此外,百炼还支持企业上架通用或行业模型,给开发者提供足够多的选择。

jjybzxw 2024-08-10 20:00
  FLUX.1是由Stable Diffusion创始团队推出的最新开源文生图模型,由Black Forest Labs开发。这个模型以其卓越的图像质量、高度逼真的人体解剖学表现和先进的提示词遵循能力而脱颖而出,为AI图像生成设定了新的行业标准。FLUX.1拥有120亿参数,是迄今为止最大的开源文本到图像模型之一。它包括三种变体:顶级性能的FLUX.1 [pro]、开源非商业用途的FLUX.1 [dev]和快速高效的FLUX.1 [schnell]。

  阿里云百炼平台已经上线了FLUX中文优化版,支持中英文指令输入,并提供一个月内1000次免费调用。这使得开发者可以在百炼平台的「模型广场」中直接调用FLUX.1开源模型API进行开发,并在百炼平台的「模型体验」区直接体验FLUX.1文生图模型的生成效果。

  FLUX.1的技术创新包括多模态和并行扩散Transformer块的混合架构、流匹配训练方法、旋转位置嵌入和并行注意力层,这些都有助于提高模型性能和硬件效率。此外,该模型还引入了旋转位置嵌入技术,以增强模型对图像中不同位置特征的识别能力,从而提升图像的细节表现。

  总的来说,FLUX.1是一个在图像生成领域具有显著创新和性能优势的开源模型,它的出现为AI图像生成领域带来了新的发展动力和应用可能性。



查看完整版本: [-- 最新文生图模型FLUX爆火,阿里云上线首个中文优化版[3P] --] [-- top --]


Powered by www.wdsz.net v8.7.1 Code ©2005-2018www.wdsz.net
Gzip enabled


沪ICP备:05041533号