随着ChatGPT的爆火,text-to-image文字生成图像、以及更广义的AIGC(AI Generated Content)相关的话题最近一直热度不减。相信大家这几天经常会在各类的自媒体、甚至是自己的朋友圈里看到用人工智能生成的图片。从今天开始,我会用几期视频给大家带来多个完全免费的文字生成图像工具的介绍,让心痒痒的各位好好的解解馋,如果不想错过的话请关注我们。废话不多说,咱们直接上攻略。
今天首先给大家介绍的是基于Diffusion Model的生成工具。Diffusion Model是现在文字生成图像领域的最核心方法,可能还没有之一,当下最知名也最受欢迎的文字生成图像模型Stable Diffusion、Disco-Diffusion、Mid-Journey,DALL-E2 等等,都是基于Diffusion Model的。
Stable Diffusion也是最知名的开源文字生成图像模型,它发布于2022年8月,在GitHub上已有多达18K的star。
Stable Diffusion提供免费试用,甚至连注册都不需要。除了非常友好的可以支持中文输入之外,它的试用网站上还提供了search prompts,prompt generator等不同的交互方式,大家有兴趣都可以去试一试。这儿的prompt就是大家输入的文字的意思。
我分别用中文和英文试验了在Stable diffution的世界里让中国队勇夺世界杯,但效果怎么说呢,着实是有点让人措手不及。明显Stable Diffusion能够一定程度上比较准确的判别文字的语义,而且对于英文的理解要强于中文。但是它所生成的图片就显得过于抽象派了一点,离远一些看还行,离近了看的话人脸都显得有些狰狞恐怖,而且也并非每一张都能够紧扣主题,所以我个人给它打60分吧。
介绍Stable Diffution,就也要提一下DreamStudio,它是Stable Diffusion的母公司Stability AI开发的一个文字生成图像工具,邮箱注册后可以免费生成125张图片。
虽然是基于同样的技术,但是DreamStudio生成的图片却呈现出了完全不同的效果。同样的英文输入下,图片中人物的效果明显更加逼真,但是它偏题过于严重,甚至第四张图片有日本队乱入的嫌疑。DreamStudio也可以支持中文输入,不过它对于中文的理解能力实在是过于堪忧,让人哭笑不得的是直接给了我四个瓶子出来。不过我后来仔细一想,好像不是AI的锅,它应该是把China翻译成了瓷器,而且非常精确的没有给我生成瓶子盘子碗,而是杯子,就冲这一点,我必须给它打个50分。
怕学AI太难,那我们就先和AI玩起来。关注我们,还有更多的免费工具介绍给大家,就差你的创意了。再见