Root Nation应用中途回顾:创建人工智能生成的图像

中途回顾:创建人工智能生成的图像

-

© ROOT-NATION.com - 本文由人工智能自动翻译。如有不准确之处,敬请谅解。若要阅读原文,请选择 English 在上面的语言切换器中。

您是否曾梦想过轻松地将想象中的图像转移到纸上?现在您可以了,感谢 Midjourney 等图像生成器。

无论您是一位才华横溢的艺术家还是没有画笔经验,您现在都可以创作杰作。也就是说,借助人工智能,您可以在几分钟内创建出以前只存在于您脑海中的图像。只需用文字描述它们,图片很快就会准备好。这一切都归功于一项有趣的服务,名为 中途 创建由人工智能生成的图像。感兴趣吗?然后让我们详细了解 Midjourney 是什么、它如何工作以及有关此 AI 工具的所有最重要的信息。

阅读: 卫星互联网之战:欧洲面临的挑战 Starlink

中途:什么事?

人工智能创建的图像在互联网上变得越来越常见:从穿着色彩鲜艳夹克的弗朗西斯教皇到韦斯·安德森风格的电影海报。原因很容易理解——现代人工智能工具已经变得如此令人信服,它们创作的照片甚至赢得了著名的摄影奖。

中途

Midjourney 是生成式人工智能的一个例子,它可以根据文本指令创建图形。它只是最近出现的许多基于机器学习的图像生成器之一。尽管如此,Midjourney 已与 DALL-E 和 Stable Diffusion 一起成为此类最大、最受欢迎的 AI 工具之一。

您不需要任何特殊的硬件或软件来使用 Midjourney,因为它通过 Discord 聊天应用程序运行。唯一的缺点?是的,有一个。需要支付一定的费用才能开始生成图像,这使得 Midjourney 与大多数通常提供至少一些免费图像生成器的竞争解决方案区分开来。

也就是说,使用 Midjourney 非常简单,任何人都可以使用,因为成本不太高,而且结果确实令人惊叹。

阅读: 关于新型 MuWNS 导航系统的所有信息:在地下和水下工作

中途之旅的历史

与由 Chat 开发商 GPT 支持的 DALL-E 不同,Midjourney 将自己描述为一个自筹资金的独立项目。该服务由 David Holtz 创立,他也是 Leap Motion 的联合创始人,Leap Motion 是一家著名的虚拟和增强现实初创公司,于 2019 年被 UltraHaptics 收购。

中途

Midjourney 团队包括 Jim Keller(苹果、AMD 处理器工程师、 Tesla、英特尔、x86-64 的合著者)、Nat Friedman(Github 首席执行官兼 GNOME 基金会主席)和 Philip Rosedale(第二人生创始人)。

中途

Midjourney 文本和图像的 AI 开发始于封闭测试版,然后于 2022 年 2022 月转为公开测试版。这使得公众可以访问和使用该工具。正是这一举动,帮助中途走红。与其他人工智能工具不同,Midjourney 早在 年 月就实现了盈利,这证实了其在市场上的成功。

阅读: 台湾、中国和美国如何争夺技术主导地位:芯片大战

如何使用中途?

使用 Midjourney 乍一看可能有点复杂。此外,创作者决定了一个不寻常的解决方案。也就是说,我们得到的不是用于生成图像的特殊应用程序,而是一个名为 Midjourney Bot 的 Discord 机器人的链接。那么,让我们看一下使用 Midjourney 工具创建图形所需执行的所有步骤。

注册不和谐

要开始使用 Midjourney,您必须拥有 Discord 帐户。 Discord 是一款有点类似于 Slack 的聊天应用程序。虽然它最初是为玩英雄联盟和魔兽世界等多人在线游戏时需要协调战术的玩家开发的,但现在在其他社区中非常受欢迎。

因此,如您所见,在使用 Midjourney 之前,您需要创建一个 Discord 帐户。免费。访问 Discord 页面进行注册。从那里,按照出现的步骤进行操作。如果您已经拥有或刚刚创建了 Discord 帐户,则可以跳至下一步。

报名参加中途之旅

设置完 Discord 帐户后,前往 Midjourney 并点击“加入测试版”。这将打开加入 Midjourney Discord 频道的邀请。点击“接受邀请”。

作为免费会员,您将无法创建图像,但可以浏览界面。您还可以通过访问不同的房间(称为#newbies-14和#newbies-21)来查看其他用户的创作,以了解 Midjourney 的工作原理。

订阅中途之旅

要开始使用 Midjourney 生成图像,您需要购买订阅。为此,请访问 Midjourney.com/account,使用经过验证的 Discord 帐户登录,然后选择适合您需求的订阅计划。我们将在本文后面讨论个别计划的价格。

加入中途 Discord 服务器

一旦您加入 Midjourney Discord 服务器并注册了计划,您就可以开始生成图像。按着这些次序:

  • 打开 Discord 并确保从左侧菜单中选择 Midjourney 服务器。
  • 您应该在屏幕左侧看到一长串频道。
  • 选择以“newbies”开头的频道之一。您可能需要向下滚动列表才能找到它。
  • 您可以滚动浏览提要,查看其他用户用于创建图像的提示。

如何组建团队

在初学者频道或您自己的频道中,输入“/imagine”,然后输入说明。要开始与机器人进行私人聊天,请在屏幕右侧的用户列表中找到 Midjourney Bot 图标。右键单击它并选择发送消息或消息。

描述尽可能具体,以便为人工智能提供足够的信息来创建正确的图像。例如,您可以添加风格、流派、情绪和其他元素等详细信息,以帮助 AI 创建您设想的图像。您将在本文后面阅读更多相关内容。

阅读: 7 种最酷的使用方法 ChatGPT

如何在中途创建有效的提示

使用过 Midjourney 的人都知道,您对想要获得的图像描述得越好,结果就会越生动和独特。用户通常使用简短而直接的提示。例如,在提供“机器人使用人工智能创建图形”这样的简单指令后,Midjourney 将创建如下内容:

该图像是在中途创建的
该图像是在中途创建的

正如您所看到的,这样简单的说明不足以(或至少并不总是)获得所需的结果,因此成功的关键是编写完美的解释性工具提示。

您喜欢特定艺术家的风格吗?您希望您的图形具有另一个时代的风格吗?或者您希望图像生成器使用某种特定技术?这一切都是可以实现的。人工智能是一个训练有素的系统,拥有无数的源图像来创建完美的图形。你唯一需要关心的就是向人工智能提供你期望的最好的描述。但是,你是怎么做的?幸运的是,我们知道答案。

标点

Midjourney 无法识别您在提示中使用的大部分标点符号。 Midjourney 唯一能理解的标点符号是:

  • 参数由双连字符分隔,例如“-ar 16:9”或“-v 5”。
  • 双冒号分隔正数和负数。例如,“::-0.5”。
  • 空格是分隔词汇项的主要字符。

构建中途提示

首先,请记住,在中途,提示应该写成 English,以便程序更好地理解它们。每个提示都以 /imagine 命令开头,并且应包含您想要获得的内容的描述。最好给你的提示一些结构。这不是必需的,但尽快获得所需的图形并在必要时轻松更改它们肯定非常有帮助。

在描述的第一部分中,包含最能描述您的图像的所有元素。例如,您可以要求 Midjourney 通过建议将某种艺术风格用作基础来模仿它。示例:“梵高风格的大象形象”:

该图像是在中途创建的
该图像是在中途创建的

然而,Midjourney 真正有趣的是它能够再现看起来像照片的图像。为了实现这一目标,您需要考虑几件事。例如,您可以选择 AI 应模拟的相机类型:用于胶片相机的 SLR 和用于 DSLR 相机的 DSLR。您还可以建议镜头类型(18、35、50 甚至 250 毫米)和特定的相机型号。

然后可以发出附加命令。这些前面必须有一个“-”,并允许您指示 AI 专注于特定方面,例如 Midjourney 版本(v 4、v 5)、图像格式(3:2、16:9 等)。 )或风格设置(s 100 表示中,p 250 表示高,或 p 750 表示非常高)。样式设置的值较低会生成与提示非常匹配的图像,但艺术性较差。较高的值会产生更多的艺术图形,但与提示的相关性较小。

Midjourney 网站上提供了完整的选项和命令列表。

以下是工具提示和结果图表的示例:

一只可爱的小老鼠躺在沙滩上。照片上有 Canon R5、50mm、数码单反相机、–v 5 –ar 3:2 –s 750

灯光、环境、角度——考虑每一个细节

要为您的照片提供背景信息,请将您创建的对象放置在特定环境中。 Midjourney 可让您将令人难以置信的场景变得超现实。您可能想将您的角色放置在以某种风格装饰的房屋中、海滩上或某个城市的街道上。

另一个值得关注的方面是光,因为它能带来很大的效果。没有人需要相信拍照的重要性。人工智能图形也是如此,它通常看起来与真实照片非常相似。

根据一天中不同的时间,照明会有所不同。因此,照片中的颜色和对比度会有所不同。 Midjourney 能够重现这些对比。例如,您不再需要等待日落,只需添加“黄金时段”一词即可索取特定照片。

您可以考虑的另一个因素是图像的角度。在某些情况下,这需要调整光学器件,这会对您的图形产生很大的影响。

以下是您可以在中途提示中包含的一些角度示例: 对于远距离拍摄,您可以选择广角、超广角、远距离、空中或卫星、眼睛水平和特写;对于特写镜头,您可以选择向上、魅力肖像、微距拍摄或微距摄影。

以下是请求及其结果的示例:

一位英俊的男子走在洛杉矶街头,黄金时段的照片 Canon R5,50 毫米,数码单反相机,–v 5 –ar 3:2 –s 750

该图像是在中途创建的
该图像是在中途创建的

通过缩放和色散编辑图像

在每组生成的图像下,您将看到八个按钮:U1、U2、U3、U4、V1、V2、V3 和 V4。所有这些按钮都允许您微调和更好地控制从中途获得的图像类型。

如果您使用的是 V5 之前的版本,U 按钮将用于放大,即调整原始图像的大小,创建一个具有更多细节的新的更大版本。它们编号为U1-U4,用于识别序列中的图像。例如,如果您想放大第二张图像,请单击顶行中的 U2 按钮。最新型号默认创建 1024×1024 像素图像,因此 U 按钮只需突出显示它们,以便进一步编辑和更轻松地保存。

第一行的右侧有一个重新滚动按钮。如果您对 Midjourney 为您创建的第一组图像不满意,这是一个很棒的工具。单击此重新创建按钮,要求 Midjourney 根据原始请求尝试不同的概念,您将获得四张新图像。

V 按钮创建所选图像的四种新变体,在风格和构图上匹配它们。在 V1 和 V4 之间进行选择时,您可以选择与要为其创建变体的图像相对应的按钮。

中途

最后但并非最不重要的一点是 /describe 函数

最后,我留下了一个很棒的命令,它将使您更轻松地创建完美的提示。这是 /描述 函数,它允许您上传自己的图像并根据该图像生成四个可能的查询。它是如何工作的?输入后 /描述,将出现一个窗口,用于从计算机光盘中选择照片。选择合适的图像文件,将其上传到服务器,Midjourney 将为您提供 4 条文字建议及其描述。以下是我发送的照片的描述:

中途

正如您在上面的屏幕截图中看到的,对于四个描述中的每一个,都有一些按钮允许您使用 Midjourney 生成的工具提示。选择图像后,会出现一个文本框,其中包含所选的描述。此时,您可以决定是否要编辑文本或保留其创建时的样子。

如果您想获得最佳结果,我建议尽可能扩展描述,并仅使用应用程序生成的文本作为基础。单击“发送”按钮后,只需接受邀请并将其发送至 Midjourney。一段时间后,您将收到包含示例图像的回复:

该图像是在中途创建的
该图像是在中途创建的

为了进行比较,下面是我上传的照片作为示例,以及我从提出的提案中选择的照片:

阅读: 中国空间站天宫:迄今为止我们所知道的一切

Midjourney 的费用是多少?我可以免费使用吗?

虽然我们已经习惯了这样的聊天机器人 ChatGPT 和 Bing Chat 几乎提供无限免费使用,但图像生成器却并非如此。几乎所有图像生成器都有一些限制,而 Midjourney 不再免费,除了几个短暂的促销期。

该服务于 2022 年 25 月首次推出时,任何人都可以使用它免费创建 25 张图像。您所要做的就是创建一个免费的 Discord 帐户并加入 Midjourney 服务器。当您发送第一个请求后,免费试用就会被激活。但是,当您达到 张图像的限制时,您必须升级到付费计划。

中途

这一切在 2023 年 月发生了变化,Midjourney 首席执行官宣布暂停免费试用计划。在过去的一年里,Midjourney 变得非常受欢迎,用户渴望在社交媒体上分享他们创建的图形。为什么创作者决定采取这一步?

放弃免费版本的决定很容易理解。每个图像创建任务都需要大量的计算能力,尤其是图形处理单元 (GPU)。此外,每个 GPU 的显存有限,需要大量使用显存来进行降噪处理。

更准确地说,图像生成器使用高能耗的 GPU,不仅成本高昂,而且数量有限。因此,为了保持服务质量,该公司暂停了免费试用期,直至另行通知,这不应让任何人感到惊讶。

但免费试用可能会在某个时候回归。例如,随着5.1版本的推出,Midjourney恢复了一个周末的免费试用。

但是,要随时使用 Midjourney,您需要购买四种订阅计划之一。最低费用为每月 10 美元。你得到什么回报?平均而言,Midjourney 在一分钟内创建一个新图像。但是,如果您想要调整大小的图像或具有非方形长宽比的图像,则可能需要更长的时间。因此,我们可以假设最便宜的基本基本计划为您提供 3.3 小时的 GPU 时间,这足以创建大约 200 个图像生成。

每增加一个更高的订阅,您就会获得更高的限制,这使您每月可以生成更多图像。因此,下一个计划“标准”提供 15 小时的快速模式图像生成和无限的慢速生成(放松模式),每月费用为 30 美元。其次是 Pro 计划,每月费用为 60 美元,提供 30 小时的快速图像生成、无限慢速图像生成和隐藏模式。

2023 年 120 月,添加了 Mega 计划,售价 60 美元,提供 小时的快速图像生成,当然还有无限时间的 Relax 模式。

中途

正如您所看到的,所有更高级别的中途计划都在放松模式下提供无限的照片,但您最多需要等待 10 分钟才能收到图像。

最低级别没有此功能,但每月费用为 10 美元,因此值得开始您的中途旅程。该计划可让您探索平台、创建图像并熟悉界面以及文本建议的工作原理。如果您喜欢所看到的内容,只需输入 /subscribe 提示即可将其提升到一个新的水平,以便进入您的帐户,您可以在其中轻松升级您的 Midjourney 工具。

还值得记住的是,Midjourney 有时会举办促销活动并提供 20% 折扣的年度计划:

  • 每年订阅的基本计划 - 每月 8 美元
  • 标准计划按年订阅 - 每月 24 美元
  • 专业计划,按年订阅 - 每月 48 美元
  • 每年订阅的大型计划 - 每月 96 美元。

中途和产权

人工智能图像生成器接受了来自摄影师和艺术家的数十亿张图像的训练。中途也不例外。许多艺术家认为,人工智能图像生成器将他们的作品用于教育目的,侵犯了他们的版权。一些艺术家甚至在美国对 Midjourney、Stability AI 和 DeviantArt 等 AI 图像生成器提出投诉。然而,另一方则认为学习过程属于合理使用的范畴。那么,人工智能生成的图像的实际所有者是谁?

Midjourney 创始人 David Holtz 在接受《福布斯》采访时承认,他在未经业主同意的情况下使用图像,因为对于如此庞大的数据集,这实际上是不可能的。

那么,我们知道这些图像是无版权的,但是您创建的图形可以受版权保护吗?答案并不简单,但总的来说,我们可以说人工智能艺术家可以使用中途创作的图像,甚至可以用于商业用途,但他们不能禁止其他人使用它们。

阅读: 地球工程挑战:欧盟禁止科学家“扮演上帝”

中途的替代方案

DALL-E

DALL-E 是第一个在社交媒体上非常流行的生成人工智能。最初,当它于 2021 年推出时,制作的图形还有很多不足之处。然而,由于更好的语言理解和更高的图像质量,最新版本 DALL-E 2 已经处于另一个水平。 DALL-E 还可以编辑现有图像,允许您替换或添加全新的对象。

必应图像创作者

如果您需要 Midjourney 的免费替代品,可以选择 Bing Image Creator。 Bing Image Creator 内置于侧边栏中 Microsoft Edge,以便您可以在使用浏览器时访问它。由于 Microsoft与的伙伴关系 OpenAI,您可以通过 Bing 免费使用 DALL-E 2 图像生成器。

梦想工作室

Midjourney 目前只能通过 Discord 运行,使用起来可能不是很直观。另一方面,DreamStudio 提供了一个丰富的网站,其中有许多可以自定义的按钮和旋钮,但它可能会让人感觉相当复杂。 DreamStudio 使用开源稳定扩散模型。

Sam Stable Diffusion 是免费的开源软件,您可以在计算机上安装和运行。然而,它需要一些编程知识和相当大的计算能力。为此,负责该模型的 Stability AI 公司创建了一个名为 DreamStudio 的平台。与中途模型类似,稳定扩散根据单个命令(提示)创建四个不同的图像。然后,用户可以修改它们或使用它们作为创建新图形的基础。还可以对模型进行微调,使其生成的图像更符合用户的要求,或者可以使用更多的计算步骤,从而得到更准确的结果。

中途值得你关注吗?

Midjourney 以生成结构良好、清晰且逼真的图像而闻名,这使其成为 DALL-E 和 Stable Diffusion 等其他 AI 工具的强大竞争对手。

该工具可以创建分辨率高达 1792×1024 像素的图像,从而提供更多的图像细节。

Midjourney 通过广泛使用的交流平台 Discord 进行工作。用户可以使用简单的命令与人工智能机器人进行交互,这使得即使没有编程经验的人也可以使用它。同时,这是它的缺点之一,因为它仅与 Discord 平台绑定。不是每个人都会喜欢它。对我来说,单独安装 Midjourney 应用程序更容易。

该图像是在中途创建的
该图像是在中途创建的

尽管开发人员保证 Midjourney Discord 服务器提供了一个活跃的社区,用户可以在其中分享他们的创作、提出问题并从其他用户和 Midjourney 团队获得帮助。

我不喜欢生成的图像属于公共领域这一事实。也就是说,您使用 Midjourney 创建的图像并不属于您。您可以使用它们(有限制),甚至可以用于商业用途,但其他用户也可以合法使用它们。 Midjourney 甚至在自己的网站上展示了最成功的创作,包括文字提示。

Midjourney 团队不断致力于改进和扩展人工智能的功能,确保该工具在不断发展的人工智能环境中保持相关性。这就是该工具没有免费版本的原因。这可能不会吸引很多潜在用户,但用 Midjourney 生成“真正”的杰作,花 10 美元还是值得的。

中途的替代方案

Freepik

- AI图像生成器 是一款功能强大的视觉创作工具,自 2023 年起就已存在。它不断与时俱进,如今已成为一款多 AI 模型视觉创作工具,能够使用多种 AI 模式(包括 Mystic、Google Veo 和 Flux)生成具有竞争力的逼真图像和数字艺术。此外,您还可以将作品放入图像放大器、背景去除器和润饰工具中,以进行进一步的 AI 编辑。

阅读: 

Yuri Svitlyk
Yuri Svitlyk
喀尔巴阡山脉之子,未被认可的数学天才, Microsoft “律师”,实用的利他主义者,左普拉沃舍克
该作者的更多内容
订阅
通知
客人

0 留言
最新
最老的 最投票
内联反馈
查看所有评论
其他文章
关注我们
现在流行