当前位置：酷居科技 > 科技 > 正文

OpenAI最新的文本生成图像大模型DALL·E3发布！生成的图像不忽略每一个细节的文本！

2023-09-21 分类：科技阅读(1740) 评论(0)

DALL·E 系列是由 OpenAI 开发的一系列基于大型语言模型的文本到图像生成系统。它们的核心目标是将文本描述转化为高度精确的图像。DALL·E2在2022年4月发布，但是一直没有公开使用，一年半后的2023年9月21日，OpenAI发布第三代DALL·E3，并承诺将与ChatGPT集成。

DALL·E3介绍 2021年1月份，OpenAI发布了他们的DALL·E模型，它能从文字说明中创建图像，用于表达各种可由自然语言表达的概念。一年后，OpenAI发布了第二代的DALL·E模型。相比较第一代的模型，DALL·E 2，以4倍的分辨率生成更真实和准确的图像。本次发布的DALL·E 3相较于OpenAI之前的系统更能理解更多的细微差别和细节，这使得大家能够轻松地将您的想法转化为极为准确的图像。简单来说，OpenAI此次发布的DALL·E3系列着重强调降低用户提示的负担，关注更多文本的细节。

DALL·E3与StableDiffusionXL-1.0对比 官方用一个实例描述了这种关注文本细节的图像生成模型的能力。例如，描述了一个熙熙攘攘的城市街道、一个红头发的年轻女子与一个脾气暴躁的老小贩的交互等。这些描述都被DALL·E3完美地转化为了图像，展示了其对细节的高度关注。

DALL·E3的使用 根据OpenAI的描述，DALL·E3是在ChatGPT上原生构建的，它可以让ChatGPT用作集思广益的合作伙伴和提示的细化器。只要问ChatGPT你想在任何内容中看到什么，不管是从简单的句子还是到详细的段落都可以。

DALL·E3的发布与其它资源 DALL·E 3目前正在研究预览中，将于10月通过API和今年秋季晚些时候在实验室向ChatGPT Plus和企业客户提供。需要注意的是，与之前的版本一样，OpenAI已经采取措施限制DALL·E 3生成暴力、成人或仇恨内容的能力。

赞(0) 打赏

未经允许不得转载：酷居科技 » OpenAI最新的文本生成图像大模型DALL·E3发布！生成的图像不忽略每一个细节的文本！

相关推荐

评论抢沙发

锦瑟无端五十弦，一弦一柱思华年

酷居科技联系我们