继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

DALL-E 3 可以将 AI 图像生成提升到一个新的水平

weixin_慕后端3532798
关注TA
已关注
手记 38
粉丝 1
获赞 1

image-20230802131953147

根据Decoder的说法,OpenAI可能正在准备其DALL-E AI文本到图像生成器的下一个版本,其中包含一系列alpha测试,这些测试现已泄露给公众。

Discord上的一位匿名泄密者分享了他的经历细节,可以访问即将推出的OpenAI图像模型,称为DALL-E 3。他于五月份首次露面,告诉基于兴趣的Discord频道,他是OpenAI的alpha测试的一部分,尝试了新的AI图像模型。他分享了他当时生成的图像。

五月 alpha 测试版本能够在图像模型内生成多个纵横比的图像。YouTuber,MattVidPro AI随后展示了以16:9纵横比生成的几张图像。这个版本还展示了该模型在高质量文本制作方面的实力,这仍然是竞争对手模型的痛点,即使是稳定扩散和Midjourney等顶级生成器也是如此。

一些例子展示了图像,例如融合在砖墙上的文字,文字的霓虹灯标志,城市中的广告牌标志,蛋糕装饰和刻在山上的名字。该模型认为DALL-E擅长产生人。其中一张照片从鱼眼镜头的角度展示了一个女人在派对上吃意大利面。

泄密者于 400 月中旬返回 Discord 频道,提供更多细节和新图像。他声称自己是“封闭alpha”测试版本的一部分,其中包括大约2名受试者。他补充说,他通过电子邮件被邀请参加试验,并且还参与了原始DALL-E和DALL-E 3的测试。这就是得出alpha测试可能针对DALL-E <>的结论的原因,尽管尚未得到证实。

image-20230802132006870

image-20230802132017989

该模型在 3 月至 <> 月期间进行了大量更新。泄密者通过分享基于同一提示生成的图像来展示这一点,展示了 DALL-E <> 随着时间的推移变得多么强大。提示读到一幅画,画的是一只粉红色的小丑在自行车比赛中向熊猫击掌。自行车是用奶酪做的,地面非常泥泞。他们在雾蒙蒙的森林里开车。熊猫很生气。

五月 Alpha 生成命中提示大部分点的一般场景。连接的指针有点变形,自行车的车轮是黄色的,而不是奶酪制成的。然而,七月的阿尔法要详细得多,粉红色的小丑和熊猫显然是高潮的,自行车车轮是几代奶酪制成的。

与此同时,在《中途》中,小丑从现场失踪,大熊猫骑着摩托车而不是自行车。有路,而不是泥泞。熊猫是高兴而不是生气。

有许多DALL-E 3月<>日的alpha图像示例显示了该模型的潜力。然而,由于alpha测试未经审查,泄密者指出,这也有可能产生“暴力和裸露或受版权保护的材料,如公司徽标”的场景。

一些例子包括一个血腥的动漫女孩、一个权力的游戏角色、侠盗猎车手 V 封面、一个僵尸耶稣吃地铁三明治,也暗示了温和的血腥,以及从考古挖掘中挖出的史莱克等。

MattVidPro AI指出,图像模型生成的图像就好像它们应该具有特定的样式一样。

DALL-E 2 于 2022 年 2022 月推出,但由于其受欢迎程度以及对道德和安全的担忧,受到严格监管,并列入候补名单。AI 图像生成器于 <> 年 <> 月向公众开放

编辑推荐

image-20230802132032268

像Dall-E,Stable Diffusion,Midjourney和Bing Image Creator这样的AI图像生成器会产生惊人的结果,但有时它们可能会令人非常沮丧。通过仅包含几个单词的简单提示,人工智能可以输出令人印象深刻的图像,这些图像似乎是专业照片和各种风格的令人信服的艺术。但是,相同的提示偶尔会创建一些可怕的生物或有滑稽缺陷的渲染。

负面提示可能有助于降低出现这些错误的可能性,但复杂性并不总是能拯救您。即使是人工智能专家也在与畸形生物和超凡脱俗的场景作斗争,需要长时间的提炼提示或使用传统的照片编辑器修饰图像。目前,如果您仔细查看图像的正确区域,您很有可能能够识别它是否由机器制作。 手沙拉和手指球

人工智能开发人员在教人工智能工具人类手应该是什么样子的斗争中取得了进展,但还有很大的改进空间。如果手指没有突出,很容易错过错误,但这是一个持续存在的问题。

打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP