AI作图工具Midjourney 5.1版本发布图像中不想要的边框减少

　　AI 作图工具 Midjourney 近日发布了最新的 5.1 版本，宣称能够为用户带来更高质量、更有个性的 AI 艺术作品。

　　Midjourney 是一家提供生成式 AI 艺术服务的公司，用户只需在 Discord 上输入一些文字或图片，就可以让 AI 根据自己的喜好和风格创作出独一无二的艺术作品。Midjourney 的引擎经过多次升级，目前已经达到了 5.1 版本，据官方介绍，这一版本的引擎更加“有主见”，能够生成出更接近 4.0 版本的效果，但质量更高。此外，还有一个“原始”模式，供那些不想要太强个性化效果的用户使用。其他方面的改进包括：准确度提高，图像中不想要的边框减少，文字失真情况减少，锐度增强。

　　为了验证 Midjourney 5.1 的表现，外媒 forbes 用同样的文字提示词在 5.0 和 5.1 版本中分别生成了四张图片，并进行了对比。所有其他设置都保持不变，Midjourney 设置为基础质量和中等风格。在所有下面的图片中，左边四张是 Midjourney 5.0 的结果，右边四张是 5.1 的结果。

　　第一个提示词是“女人走在鹅卵石街道上，走向日落”：

　　可以看到，在 Midjourney 5.0 中有一个一直存在的问题，就是过度强烈、不自然的镜头光晕效果，而在 5.1 版本中这个问题得到了解决。日落在 5.1 版本中看起来更自然，天空也更温暖、更有趣。

　　第二个提示词是“油漆厂爆炸，矢量艺术”：

　　同样地，5.1 版本的图片比 5.0 版本的更出色，颜色运用得更好，构图也更有动感。

　　人脸是 Midjourney 的一个强项，下一张图片的提示词是“戴着泳镜的孩子的特写”：

　　这次可以体现 Midjourney 5.1 版本更有“主见”，5.0 版本中的图片都很普通，就像是用智能手机拍摄的孩子戴着眼镜的快照。而 5.1 版本中右边的图片则有更强的艺术感，就像是由专业摄影师拍摄的。

　　最后外媒测试了一下 5.1 版本是否真的减少了文字失真的问题，提示词如下：“街角卖报纸的人，1950 年代风格，棕褐色”：

　　首先，值得注意的是，两个版本都误解了提示词，生成了一个拿着报纸的推销员，而不是一个卖报纸的人，但这可以通过修改提示词来改进。两组图片中背景都有文字，不过两者之间没有太大的区别。从远处看两组图片中的文字都还可以，但是当放大看时，就会发现它们大部分都是无意义的文字。5.1 版本中的图片构图更强，主题占据了更多的画面空间。

　　最新 Midjourney 5.1 版本目前还在测试中，Midjourney 的用户可以通过在 Discord 上输入 /settings 命令来默认使用 5.1 版本。该公司计划在本周末之前将 Midjourney 5.1 作为默认模式。