Root Nation服务评价中途回顾:创建人工智能生成的图像

中途回顾:创建人工智能生成的图像

-

您是否曾梦想过轻松地将想象中的图像转移到纸上? 现在,借助 Midjourney 等图像生成器,这一切成为可能。

无论您是才华横溢的艺术家还是根本没有画笔经验,现在您都可以创作杰作。 也就是说,借助人工智能,您可以在几分钟内创建出以前只存在于您脑海中的图像。 只需用文字描述它们,图片很快就会准备好。 这一切都归功于一项有趣的服务 中途,它创建由人工智能生成的图像。 感兴趣吗? 然后我建议您更详细地了解 Midjourney 是什么、它是如何工作的以及有关此人工智能工具的所有最重要的信息。

另请阅读: 我测试并采访了 Bing 的聊天机器人

中途:什么事?

从穿着鲜艳夹克的弗朗西斯教皇到韦斯·安德森风格的电影海报,人工智能生成的图像在互联网上变得越来越普遍。 原因很容易理解——现代人工智能工具已经变得如此令人信服,它们创作的照片甚至赢得了著名的照片奖。

中途

Midjourney 是生成式人工智能的一个例子,它可以根据文本指令创建图形。 这只是最近出现的众多基于机器学习的图像生成器之一。 尽管如此,Midjourney 已成为同类中最大、最受欢迎的 AI 工具之一,与 DALL-E 和 Stable Diffusion 并列。

您不需要任何特殊的硬件或软件来使用 Midjourney,因为它通过 Discord 聊天应用程序运行。 唯一的缺点? 所以他是。 需要支付一定的费用才能开始生成图像,这使得 Midjourney 与大多数竞争解决方案区分开来,这些解决方案通常至少提供一些免费的图像生成。

然而,使用 Midjourney 非常简单,任何人都可以使用,因为成本不太高,而且获得的结果确实令人惊叹。

也很有趣: 现代火炮是乌克兰的超级武器。 为什么 Elon Musk 在这里?

中途之旅的起源故事

与由 Chat 开发商 GPT 支持的 DALL-E 不同,Midjourney 将自己描述为一个自筹资金的独立项目。 该服务由 David Holtz 创立,他也是 Leap Motion 的联合创始人,Leap Motion 是一家著名的虚拟和增强现实初创公司,于 2019 年被 UltraHaptics 收购。

- 广告 -

中途

Midjourney 团队包括 Jim Keller(处理器工程师)等知名人士 Apple、AMD、Tesla、Intel 和 x86-64 的合著者)、Nat Friedman(Github 首席执行官兼 GNOME 基金会主席)和 Philip Rosedale(Second Life 创始人)。

中途

Midjourney 的文本和图像的人工智能开发开始于封闭测试版,然后于 2022 年 2022 月转入公开测试版。 这允许公众访问和使用该工具。 正是这一举措帮助中程服务广受欢迎。 与其他人工智能工具不同,Midjourney 早在 年 月就实现了盈利,证实了其在市场上的成功。

也很有趣: ChatGPT:简单的使用说明

如何使用中途?

使用 Midjourney 乍一看似乎有点难以承受。 特别是因为创作者做出了一个不寻常的决定。 也就是说,我们得到的不是用于生成图像的专用应用程序,而是一个名为 Midjourney Bot 的 Discord 机器人的链接。 因此,让我们详细了解使用 Midjourney 工具创建图形所需遵循的所有步骤。

注册不和谐

要开始使用 Midjourney,您必须拥有 Discord 帐户。 Discord 是一款类似于 Slack 的聊天应用程序。 虽然它最初是为玩英雄联盟和魔兽世界等多人在线游戏时需要协调战术的玩家开发的,但现在它在其他社区中也非常受欢迎。

因此,如您所见,在使用 Midjourney 之前,您需要创建一个 Discord 帐户。 这是免费的。 访问 Discord 页面进行注册。 在那里,根据出现的说明完成所有步骤。 如果您已经拥有或刚刚创建了 Discord 帐户,则可以跳至下一步。

报名参加中途之旅

设置您的 Discord 帐户后,前往 Midjourney 并单击“加入 Beta”。 将打开加入 Midjourney Discord 频道的邀请。 点击“接受邀请”。

作为免费会员,您将无法创建图像,但可以查看界面。 您还可以通过访问不同的房间(名为#newbies-14和#newbies-21)来查看其他用户的创作,以了解 Midjourney 的工作原理。

订阅中途之旅

要开始使用 Midjourney 生成图像,您需要购买订阅。 为此,请访问 Midjourney.com/account,使用经过验证的 Discord 帐户登录并选择适合您需求的订阅计划。 我们将在本文后面介绍各个计划的价格。

加入中途 Discord 服务器

一旦您加入 Midjourney Discord 服务器并订阅了计划,您就可以开始生成图像。 按着这些次序:

  • 打开 Discord 并确保在左侧菜单中选择 Midjourney 服务器。
  • 您应该在屏幕左侧看到一长串频道。
  • 选择以“新手”开头的频道之一。 您可能需要向下滚动列表才能找到它。
  • 您可以滚动浏览提要,查看其他用户在创建图像时使用了哪些技巧。

如何生成命令

在初学者频道或您自己的频道中,输入“/imagine”,然后输入说明文本。 要开始与机器人进行私人聊天,请在屏幕右侧的用户列表中查找 Midjourney Bot 图标。 右键单击它并选择“发送消息”或“消息”。

描述尽可能具体,以便为人工智能提供足够的信息来创建所需的图像。 例如,您可以包含风格、流派、情绪和其他元素等详细信息,以帮助 AI 创建您设想的外观。 您将在本文后面了解到这一点。

也很有趣: 什么是神经网络以及它们如何工作?

- 广告 -

如何在中途创建有效的提示

使用过 Midjourney 的人都知道,您对想要获得的图像描述得越好,结果就会越明亮、越独特。 用户通常使用简短而直接的提示。 例如,在发出“机器人使用人工智能创建图形”之类的简单指令后,Midjourney 将创建以下内容:

该图像是在中途创建的
该图像是在中途创建的

正如您所看到的,这样简单的说明不足以(或至少并不总是)获得所需的结果,因此成功的关键是编写完美的解释性工具提示。

你喜欢这个或那个艺术家的风格吗? 您希望您的图形具有另一个时代的风格吗? 或者您希望图像生成器使用某种特定技术? 这一切都是可以实现的。 人工智能是一个训练有素的系统,它需要无数的输入图像来创建完美的图形。 你唯一需要关心的就是向人工智能提供你期望它做什么的最佳描述。 但怎么做呢? 幸运的是,我们知道答案。

标点

您在提示中使用的大部分标点符号都会被 Midjourney 忽略。 Midjourney 唯一能理解的标点符号是:

  • 选项由双连字符分隔,例如“-ar 16:9”或“-v 5”。
  • 双冒号分隔正数和负数。 例如,“::-0.5”。
  • 空格是分隔词汇元素的主要符号。

构建中途提示

首先,请记住,在 Midjourney 中,提示必须用英语编写,这样程序才能最好地理解它们。 每个邀请都以命令 /imagine 开头,并且必须包含您希望收到的内容的描述。 最好给你的提示一些结构。 这不是必需的,但它绝对有助于尽快获得您想要的图形并在需要时轻松更改它们。

在描述的第一部分中,包含最能描述您的图像的所有元素。 例如,你可以要求中途遵循某种艺术风格,并提出以它为基础。 这是一个例子:“梵高风格的大象形象”:

该图像是在中途创建的
该图像是在中途创建的

然而,Midjourney 真正有趣的是它能够再现看起来像照片的图像。 为此需要考虑几件事。 例如,您可以选择 AI 应模拟的相机类型:用于胶片相机的 SLR 和用于 DSLR 相机的 DSLR。 您还可以建议镜头类型(18、35、50 甚至 250 毫米)和具体相机型号。

然后您可以发出其他命令。 它们前面必须有一个“-”符号,并允许您将 AI 定向到特定方面,例如 Midjourney 版本(v 4、v 5)、宽高比(3:2、16:9 等)或样式选项(s 100 为中型,p 250 为高型,p 750 为非常高型)。 样式选项的值较低会生成与工具提示非常匹配的图像,但艺术性较差。 高值会创建更具艺术性的图形,但与工具提示的相关性较小。

Midjourney 网站上提供了选项和命令的完整列表。

以下是提示和生成的图形的示例:

一只可爱的小老鼠躺在海滩上的图像。 使用 Canon R5、50mm、DSLR、–v 5 –ar 3:2 –s 750 拍摄的照片

(一只可爱的老鼠躺在海滩上的图像。使用佳能 R5,50 毫米,DSLR,–v 5 –ar 3:2 –s 750 拍摄的照片)

灯光、环境、视角——思考每一个细节

要为您的照片提供背景信息,请将您想到的对象放置在特定的环境中。 Midjourney 可让您将令人难以置信的场景变得超现实。 您可能想将您的角色放置在以某种风格装饰的房屋中、海滩上或某个城市的街道上。

另一个值得关注的方面是光线,因为它能带来巨大的效果。 没有人需要相信这一点在拍照时有多重要。 人工智能图形也是如此,它通常与真实照片非常相似。

根据一天中不同的时间,灯光会有所不同。 因此,照片中的颜色和对比度是不同的。 Midjourney 能够重现这些对比。 例如,您不再需要等待日落,只需添加“黄金时刻”一词即可创建一张特定的照片。

您可以考虑的另一个因素是图像的视角。 在某些情况下,您需要为此调整光学器件,这可能会显着改变您的图形。

以下是中途提示中可以包含的角度示例: 远距离拍摄、广角拍摄、超广角拍摄、远景拍摄、鸟瞰或卫星视图、平视拍摄; 特写——特写、魅力肖像、微距拍摄或微距摄影。

这是一个示例查询及其结果:

一个英俊的男人走在洛杉矶的街道上,黄金时段使用佳能 R5,50 毫米,数码单反相机拍摄的照片,–v 5 –ar 3:2 –s 750

(走在洛杉矶街道上的帅哥,黄金时段照片,佳能 R5,50mm,DSLR,–v 5 –ar 3:2 –s 750)

该图像是在中途创建的
该图像是在中途创建的

通过缩放和色散编辑图像

在每组生成的图像下方,您将看到八个按钮:U1、U2、U3、U4、V1、V2、V3 和 V4。 所有这些按钮都允许您微调和更好地控制中途图像的类型。

如果您使用的是 V5 之前的版本,U 按钮将用于放大,即调整原始图像的大小,创建一个具有更多细节的新的更大版本。 它们编号为 U1–U4,用于识别序列中的图像。 例如,如果您想放大第二张图像,请按顶行的 U2 按钮。 最新型号默认为 1024×1024 像素图像,因此 U 按钮只需突出显示它们,以便以后编辑和更轻松地保存。

第一行右侧是“重新滚动”按钮。 如果您对 Midjourney 为您创建的第一组图像不满意,这是一个很棒的工具。 单击此重新创建按钮,要求 Midjourney 根据原始请求尝试不同的概念,您将获得四张新图像。

V 按钮创建所选图像的四种新变体,在风格和构图上与它们相匹配。 通过在 V1 – V4 之间进行选择,您可以选择与要为其创建变体的图像相对应的按钮。

中途

最后但并非最不重要的一点是:/describe 函数

最后,我留下了一支优秀的团队,让您可以更轻松地创建完美的提示。 这是一个函数 /描述,它允许您上传自己的图像并根据该图像生成四个可能的查询。 它是如何工作的? 介绍完之后 /描述 将出现计算机磁盘中的照片选择窗口。 选择适当的图形文件,将其上传到服务器,Midjourney 将为您提供 4 条描述它的文本建议。 以下是我发送的照片的说明:

中途

正如您在上面的屏幕截图中看到的,对于给出的四个描述中的每一个,都会有一些按钮允许您使用 Midjourney 生成的提示。 选择图像后,会出现一个文本窗口,其中包含所选的描述。 此时,您可以决定是否要编辑文本或保留其创建时的样子。

如果您想获得最佳结果,我建议您尽可能扩展描述,仅使用程序生成的文本作为基础。 单击“提交”后,只需接受邀请并将其发送到 Midjourney。 一段时间后,您将收到包含示例图像的回复:

该图像是在中途创建的
该图像是在中途创建的

为了进行比较,下面是我作为示例上传的照片和我从建议中选择的照片:

另请阅读: 用简单的话说关于量子计算机

中途费用是多少? 可以免费使用吗?

虽然我们习惯了 ChatGPT 和 Bing Chat 等聊天机器人提供几乎无限的免费使用,但图像生成器的情况并非如此。 几乎所有这些都有一些限制,除了少数短暂的促销期外,Midjourney 不再免费。

该服务于 2022 年 25 月首次推出时,任何人都可以使用它免费创建 25 张图像。 您所要做的就是创建一个免费的 Discord 帐户并加入 Midjourney 服务器。 免费试用版在发送第一个请求后立即激活。 但是,当您达到 个图像限制时,您必须升级到付费计划。

中途

这一切在 2023 年 月发生了变化,Midjourney 首席执行官宣布暂停免费试用计划。 去年,Midjourney 变得非常流行,用户渴望在社交网络上分享他们创建的图形。 为什么创作者决定采取这样的步骤?

放弃免费版本的决定很容易理解。 每个成像任务都需要大量的计算能力,尤其是图形处理单元 (GPU)。 此外,每个 GPU 的视频内存有限,大量用于去噪过程。

更具体地说,图像生成器使用耗电的 GPU,不仅成本高昂,而且数量有限。 因此,为了保持服务质量,该公司停止了免费试用期,直至另行通知,这应该不会令任何人感到惊讶。

但免费试用可能有一天会回归。 例如,随着5.1版本的推出,Midjourney恢复了为期一周的免费试用。

但是,要随时使用 Midjourney,您必须购买四种订阅计划之一。 最低价格为每月 10 美元。 你得到什么回报? 平均而言,Midjourney 在一分钟内创建一个新图像。 但是,如果您想要调整大小的图像或具有非方形长宽比的图像,您可能需要花费更多时间。 因此我们可以假设最便宜的基本计划提供 3,3 小时的 GPU 时间,这足以生成大约 200 代图像。

每增加一个更高的订阅,您就会获得更高的限制,允许您每月创建更多图像。 因此,下一个计划“标准”提供 15 小时的快速图像生成和无限的慢速生成(放松模式),每月费用为 30 美元。 接下来是 Pro 计划,每月费用为 60 美元,提供 30 小时的快速成像、无限慢速成像和隐形模式。

2023 年 120 月,添加了 Mega 计划,售价 60 美元,可为您提供 小时的快速图像生成,当然还有无限时长的放松模式。

中途

正如您所看到的,所有更高级别的中途计划都在放松模式下提供无限的照片,但您必须等待最多 10 分钟才能获取图像。

最低级别没有此功能,但每月 10 美元,值得开始您的中途之旅。 该计划允许您探索平台、创建图像并熟悉界面以及文本建议的工作原理。 如果您喜欢所看到的内容,只需输入提示 /订阅即可进入您的帐户,在其中可以轻松更新您的中途工具,从而将其提升到一个新的水平。

还值得记住的是,Midjourney 有时会进行促销活动并提供 20% 折扣的年度计划:

  • 按年订阅的基本计划 - 每月 8 美元
  • 按年订阅的标准计划为每月 24 美元
  • 专业计划,按年订阅 - 每月 48 美元
  • 每年订阅的大型计划 - 每月 96 美元。

中途旅行和所有权

人工智能图像生成器从摄影师和艺术家的数十亿张图像中学习。 中途也不例外。 许多艺术家认为人工智能图像生成器将其作品用于教育目的侵犯了版权。 一些艺术家甚至在美国对 Midjourney、Stability AI 和 DeviantArt 等 AI 生成器提出投诉。 然而,另一方声称学习过程属于合理使用的范畴。 那么谁是人工智能生成图像的实际所有者呢?

Midjourney 的创始人 David Holtz 在接受《福布斯》采访时承认,他在未经业主同意的情况下使用图像,因为对于如此庞大的数据集,这实际上是不可能的。

那么,我们知道这些图像不受版权保护,但是您创建的图形是否受版权保护? 答案并不容易,但一般来说,人工智能艺术家可以使用中途创作的图像,甚至用于商业用途,但不能阻止其他人使用它们。

另请阅读: ChatGPT 的 7 个最酷的用途

中途替代方案

DALL-E

DALL-E 是第一个在社交网络中非常流行的生成人工智能。 最初,当它于 2021 年推出时,制作的图形还有很多不足之处。 然而,最新版本 DALL-E 2 凭借更好的语言理解和更高的图像质量,达到了完全不同的水平。 DALL-E 还可以编辑现有图像,允许您替换或添加全新的对象。

必应图像创作者

如果您想要 Midjourney 的免费替代品,您可以选择 Bing Image Creator。 Bing Image Creator 内置于侧边栏中 Microsoft Edge,以便您可以在使用浏览器时访问它。感谢合作伙伴 Microsoft 借助 OpenAI,您可以通过 Bing 免费使用 DALL-E 2 图像生成器。

梦想工作室

Midjourney 目前只能通过 Discord 运行,使用起来可能不是很直观。 另一方面,DreamStudio 提供了一个丰富的网站,其中有许多按钮和旋钮可供自定义,但它看起来相当复杂。 DreamStudio 使用开放的稳定扩散模型。

Sam Stable Diffusion 是免费的开源软件,您可以在计算机上安装和运行。 然而,这需要一些编程知识和强大的计算能力。 为此,负责该模型的 Stability AI 公司创建了一个名为 DreamStudio 的平台。 与中途模型类似,稳定扩散根据单个命令(提示)创建四个不同的图像。 然后,用户可以修改它们或使用它们作为创建新图形的基础。 该模型还可以进行微调,使其生成的图像更符合用户的请求,或者可以使用更多的计算步骤,从而获得更准确的结果。

中途值得你关注吗?

Midjourney 以生成结构良好、清晰且逼真的图像而闻名,这使其成为 DALL-E 和 Stable Diffusion 等其他 AI 工具的强大竞争对手。

该工具可以创建分辨率高达1792×1024像素的图像,从而提供更详细的图像。

Midjourney 由广泛使用的通信平台 Discord 提供支持。 用户可以使用简单的命令与人工智能机器人进行交互,即使没有编程经验的人也可以使用它。 尽管同时这是它的缺点之一,因为它仅与 Discord 平台绑定。 不是每个人都会喜欢它。 就我个人而言,我发现单独安装 Midjourney 应用程序更容易。

该图像是在中途创建的
该图像是在中途创建的

尽管开发人员保证,Midjourney Discord 服务器提供了一个活跃的社区,用户可以在其中分享他们的创作、提出问题并从其他用户和 Midjourney 团队获得帮助。

我不喜欢生成的图像是公开的。 也就是说,您使用 Midjourney 创建的图像并不属于您。 您可以使用它们(有限制),甚至可以用于商业用途,但其他用户也可以相当合法地使用它们。 Midjourney 甚至在自己的网站上展示了最成功的创作,包括文本提示。

Midjourney 团队不断致力于改进和扩展 AI 功能,确保该工具在不断发展的 AI 环境中保持相关性。 这就是该工具没有免费版本的原因。 这可能对许多潜在用户没有吸引力,但是用 Midjourney 生成您自己的“真正”杰作,10 美元是值得的。

也很有趣: 

Yuri Svitlyk
Yuri Svitlyk
喀尔巴阡山脉之子、不为人知的数学天才、“律师”Microsoft,实用的利他主义者,左右
- 广告 -
注册
通知关于
客人

1 评论
较新的
年纪大的 最受欢迎
嵌入式评论
查看所有评论
梁魏懋
梁魏懋
5 个月前

很棒的文章! :) Užsisakiau 标准 MJ planą。是否可以使用 10 张照片在互联网上拍摄照片 kuriant vizualus?