跳转至

文本生图像模型

MaaS-DALL-E 模型根据用户提供的文本提示生成图像。 MaaS-DALL-E 3 可通过 REST API 供公众使用。

以下模型都已支持购买:

  • MaaS-DALL-E 3
  • MaaS-DALL-E 2(按需开通)

MaaS-DALL-E 3

  • 强大的图像细节和差异识别能力

能更好地理解细微差别和细节,从而更易将用户想法转化为准确的图像,比如解决了之前版本不会写字的问题,且在处理文本、人手等内容时效果更好

  • 高质量的图像生成

准确地反映提示内容,能够将提示中的每一个细节都较好地呈现出来,如半透明的质感、复杂的场景和文字展现等

  • 对上下文和长提示的理解能力增强

更好地理解文本的上下文,处理较长的提示效果更佳,能更全面、准确地理解用户的复杂需求并生成相应图像 。

MaaS-DALL-E 2

  • 高质量图像生成

生成的图像在逼真度和细节方面表现出色,分辨率更高,画质更真实 。

  • 多模态生成能力

可以根据文本描述生成各种形式的图像,包括物体、场景、抽象概念等,例如能生成 “宇航员骑在马背上” 等复杂场景的图像 。

  • 概念组合与创新

能够结合不同的概念、属性及风格来生成图像,展现出一定的创造性和想象力,比如以特定风格生成独特场景 。

  • 图像编辑与扩展

可以对现有图像进行逼真的编辑,添加或移除元素,同时还能考虑阴影、反射和纹理等因素,并且能够扩展原始画布中的图像,创造新的构图 。

  • 图像变体生成

能获取一幅图像并创造出受原始图像启发的不同变体,保持图片中各个元素之间的关系,每种变体看起来都十分自然 。

  • 零样本学习

支持零样本学习,即可以在没有相关训练数据的情况下生成与文本描述相匹配的图像,在个性化定制等领域具有更大的灵活性和适用性 。

  • 基于深度学习技术

采用了深度学习中的扩散模型、Transformer 架构等,经过大量数据的训练,能够理解文本语义并将其转化为对应的图像表示 。

  • 与自然语言紧密结合

依赖自然语言处理,通过对大规模自然语言和图像配对数据的学习,理解文本与图像之间的关联,从而根据文本提示准确生成图像 。