Skip to content

Latest commit

 

History

History
69 lines (54 loc) · 4.41 KB

DALL·E 2、 Stable Diffusion、 Midjourney的区别.md

File metadata and controls

69 lines (54 loc) · 4.41 KB

在过去几年中,人工智能 (AI) 取得了许多进步,AI 图像生成器是 AI 的新增功能之一。 它是一种能够将输入语句转换为图片或绘画的工具。 文本生成图像的 AI 工具有很多选择,但最突出的是 DALLE 2、Stable Diffusion 和 Midjourney。

DALL·E 2

DALL·E 2 是由 OpenAI 创建的 AI 程序,可根据文本描述创建图像。 使用超过 100 亿个参数训练版本的 GPT-3 transformer 模型,解释自然语言输入并生成相应的图像。 prompt: An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula(一幅富有表现力的篮球运动员扣篮油画,被描绘成星云的爆炸) – created using DALLE 2

Stable Diffusion

Stable Diffusion 是一种文本到图像模型,它使用冻结的 CLIP ViT-L/14 文本编码器在文本提示下调整模型。 它在运行时将成像过程分成一个“扩散”过程——它从只有噪声开始,逐渐改善图像,直到完全没有噪声,逐渐接近提供的文本描述。 图片 prompt: A pikachu fine dining with a view to the Eiffel Tower(在埃菲尔铁搭下吃美食的皮卡丘) – generated by Stable Diffusion

Midjourney

Midjourney 是另一种基于 AI 的工具,可根据用户提示生成图像。 MidJourney 擅长调整实际的艺术风格来创建用户想要的任何事物组合的图像。 它擅长创造环境,尤其是幻想和科幻场景,具有戏剧性的灯光,看起来像视频游戏中渲染的概念艺术。

图片 prompt: Cloud Castle at night, cinematic(夜晚的云堡,电影的效果) – created by Midjourney

DALL·E 2, Stable Diffusion and Midjourney 三者比较

DALL·E 2 已经过数百万张图片的训练,使其输出更加复杂,非常适合企业使用。 当有两个以上的角色时,DALL·E 2 产生的画面比 Midjourney 或 Stable Diffusion 好得多。

DALL.E 2优点

  • 在多角色以及特写 服装设计上输出图片质量更高
  • 会防止你出于恶意使用它

DALL.E 2缺点

  • AI生成的图像的版权不清晰
  • 可能会生成错误的图片结果
  • 如果它不理解文本,它可能会从之前的训练中生成

Midjourney 是一种以其艺术风格而闻名的工具。 Midjourney 使用其 Discord 机器人向 AI 服务器发送和接收呼叫,几乎所有事情都发生在 Discord 上。 生成的图像很少看起来像照片; 它看起来更像一幅画。

Midjourney优点

  • 高质量的图片结果输出
  • 其他人的生成的作品是可见的
  • 多种不同订阅价格

Midjourney缺点

  • 只能在Discord上使用,没有API
  • 生成的图片没有隐私性
  • 不是很容易上手操作

Stable Diffusion 是一个开源模型,每个人都可以使用。 对当代艺术插画也有比较好的理解,可以制作出非常细致的艺术作品。 但是,它需要对复杂的原始prompt进行解释。 Stable Diffusion 非常适合复杂的创意插画,但在创建logo等一般图像时就显得力不从心了。

Stable Diffusion优点

  • 高质量的图片结果输出
  • 由于开源会有无限可能
  • 可以探索不同的艺术风格

Stable Diffusion缺点

  • 开源之后,商业版权不确定

相同的prompt 三者的表现

cherry blossom near a lake, snowing(湖边的樱花,下雪天) 图片 eerie forest , black and white ,night(夜晚中诡异的森林,透露黑白的光影) 图片 dark alley at night 4K raining aesthetic(夜晚下雨的黑暗小巷, 4K 唯美风) 图片 alone astronaut on mars,mysterious,colorful,hyper realstic(火星上的孤独宇航员,神秘,多彩,超现实主义) 图片 pyramid shaped mountain above a still lake, covered with snow (静谧的湖边傍座落着一座金字塔形状的雪山) 图片 由此可见Midjourney的图像更像艺术画,而DALL·E 2更像是实际相机拍出的照片更写生。本人更愿意使用midjourney同时也是它的氪金用户。下期可以给大家分享下《如何在midjourney中创造连续性的角色》

相关链接