LOADING

Midjourney创始人说“世界需要更多想象力”

2024/06/05 一起用AI
596

2022 年 4 月,由 Elon Musk、Sam Altman、Ilya Sutskever、Greg Brockman、Wojciech Zaremba 和 John Schulman 共同创立的人工智能 (AI) 公司 OpenAI 推出了 DALL-E 2,这是一种人工智能工具,可以从用自然语言描述,例如“泰迪熊在 1980 年代在月球上进行新的 AI 研究”。

OpenAI 试图通过视觉渲染向通用人工智能 (AGI) 迈出一步,这在互联网上引起了轰动。用该公司的话说,“DALL-E 2 将赋予人们创造性地表达自己的能力。”

想像任何像“Cookie Monster 对他的饼干库存下降做出反应”或“宇航员以 Andy Warhol 的风格骑马”这样随机的东西,DALL-E 2 都可以生成它。

该技术最近甚至被用于制作人工智能生成 的第一本杂志封面。

尽管 OpenAI 只是扩展了对该工具的早期访问,但它激发了许多类似图像生成器工具的创建,包括 Google 的 Imagen、Meta 的 Make-A-Scene、TikTok 的 AI 绿屏和Boris Dayma有趣但又令人恐惧的 DALL-E mini .

该技术最近甚至被用于制作人工智能生成 的第一本杂志封面。

尽管 OpenAI 只是扩展了对该工具的早期访问,但它激发了许多类似图像生成器工具的创建,包括 Google 的 Imagen、Meta 的 Make-A-Scene、TikTok 的 AI 绿屏和Boris Dayma有趣但又令人恐惧的 DALL-E mini .

在这些科技巨头争夺 AI 艺术霸权之际,《经济学人》在 2022 年 6 月号的封面上介绍了 该游戏的新成员——Midjourney 。

David Holz 的这项技术的版本,被称为 Midjourney,迅速声名鹊起,每个接触过这种文本到图像生成器的人都留下了深刻的印象。最近,科罗拉多州博览会的年度艺术竞赛将蓝丝带授予新兴数字艺术家 Jason M. Allen,他使用 Midjourney 创作了一件名为“Théâtre Dopéra Spatial”的艺术品。

Midjourney创始人说“世界需要更多想象力”

Théâtre Dopéra Spatial

要了解Midjourney,重要的是要回顾 2011 年——David Holz 在这一年推出了他的第一家基于 AI 的初创公司 Leap Motion。

“在很多方面,我对人工智能 (AI) 不感兴趣,因为我不太关心让机器变得更好,”Holz 告诉 VentureBeat。“来自[智能增强] 思想流派,我一直对赋予人们权力和努力让人们变得更好更感兴趣。”

许多 AI 专家相信使用机器来执行人类认为智能或聪明的任务,以及 IA 专家将人类置于系统的中心并使用技术来支持和补充人类认知功能,Holz 选择了一条道路那会让他享受两全其美。

“多年来,我意识到我们可以使用 AI 来赋予人们权力,让人们变得更好,而这些人可以创造出更好的 AI——这就像绕了一圈,每个人都赢了,”他说。

Leap Motion 就是从这种意识形态中诞生的。该公司开发了一种光学手部跟踪模块,可以使用 AI 捕捉人手的动作。“我们的目标不是取代手语人,而是让我们真正体现在计算机内部的虚拟空间中。而现在,有了 Midjourney,我们并不是要取代艺术家,而是为他们提供工具来探索新的思想媒介并扩展他们的想象力,”Holz 解释道。

Midjourney创始人说“世界需要更多想象力”

Midjourney绘制

2021 年,Holz 启动了 Midjourney 作为一个独立的研究实验室。大约在同一时间,每个人都在谈论“扩散模型”和“对比语言图像预训练 (CLIP)”等行业流行语。

在这些发展的基础上,该实验室于 2022 年开始提供其文本到图像的服务。与同行类似,人工智能系统以短语的形式接受设计提示或想法,并将其作为灵感来创建迷人的图像。Midjourney 之所以脱颖而出,是因为只能通过互联网语音协议、即时消息社交平台 Discord 访问 AI 机器人,而不是通过其自己的网站或移动应用程序。

当发出自然语言查询时,机器人会在大约 60 秒内用四张低分辨率图像做出响应。用户可以在此时生成变体和新一代,以更接近他们想要的想法。用户可以更改提示的宽高比,最大分辨率为2048×1280像素,远高于DALL-E 2的1024×1024分辨率。

离散对象的特写照片、流行文化参考、木炭或铅笔素描、各种知名艺术家风格的绘画——Midjourney 可以做到这一切。它在创建具有传奇色彩的场景方面表现出色。

对于竞争,Holz 说:“我真的不想花太多时间将自己与他人进行比较。我希望结果不言自明。有点像 Apple 不会花所有时间谈论 Android 有多糟糕。”

Midjourney创始人说“世界需要更多想象力”

Midjourney

鉴于 Midjourney 表演的规模宏大,艺术家和研究人员等已经开始对这项技术的附带损害表示担忧。在提出的众多问题中,三个问题引起了广泛关注:

1. 它能取代人类设计师吗?

2. 它是否违反内容政策?

3. 它会产生表明性别偏见、强化种族成见或包含任何明确内容的结果吗?

Holz 在下面广泛地解决了这三个问题:

Midjourney创始人说“世界需要更多想象力”

根据描述“frustrated blue creature, looking online for an appartment, at home, in Paris, style Ghibli ”生成图像

1. Midjourney 能否取代人类设计师?

不,它不能。根据 Holz 的说法,Midjourney 旨在增强我们的能力,而不是以任何方式取代我们。

“这有点像人类发明汽车的那一刻。仅仅因为汽车可以比人类跑得快,并不意味着我们会切断我们的腿。您将使用汽车更快地到达某个地方。这基本上是在提高我们的速度,”他说。“同样,我们的产品涉及一个迭代的、美丽的探索过程,它成为你想象力的延伸。您可以随心所欲地漫游、探索和找出您想要的东西。这是一件积极的事情。”

2.是否抄袭或违反内容政策?

这是一个特别有趣和有争议的问题,因为 Midjourney 从互联网上提取训练数据。然而,Holz 声称 AI 引擎旨在仅从数据中“汲取灵感”并确保输出完全新颖,也就是说,不同于任何公开可用的图像。奇怪的是,Holz 声称已收到艺术家的多次请求,要求加倍提高 Midjourney 从他们自己的作品和其他作品中汲取灵感的能力。

“艺术家的首要要求是让 Midjourney 更好地复制,我还不知道如何回应。他们就像,大卫,‘让我把我所有的艺术都放进系统里。我想尽可能地复制它,这样它就可以成为我艺术流程的一部分,”他解释道。“他们认为,越能模仿自己的个人艺术风格,就越有用。然而,如果它有自己的风格,他们就不得不半途而废,把他们的东西从中拉出来。这很有趣。这对我来说有点可怕,因为我看到了它如何被用于善恶。”

3. 它会产生显示性别偏见、强化种族成见或包含任何明确内容的结果吗?

Midjourney绘制

由于 Midjourney 打算默认打开,因此它有严格的政策来确保内容是 PG-13。Holz 证实,它会自动阻止本质上不尊重、攻击性、辱骂性或性行为的文本输入。最重要的是,这些规则适用于所有内容,包括隐私模式下的交互。

对于一切艺术,而不是商业

Midjourney 目前提供有限的“免费增值”模式,允许用户提交 20-25 个图像生成提示。之后,用户可以从一系列订阅套餐中进行选择——从包含 200 张图像的基本会员套餐、包含无限图像的标准会员,到包含无限图像和完全隐私的高级企业会员。

请务必注意,“企业会员”并非指企业软件即服务 (SaaS) 产品。事实上,Holz 明确提到该公司也没有兴趣构建一个,尽管他们有许多客户使用该产品制作商业视频游戏、概念艺术和视频。

“我们的技术发展如此之快,因此将重点放在消费者方面是有意义的,因为那是人们可以拿东西就跑的地方。此外,制作一件很酷的东西有一些非常简单和美丽的东西,”霍尔兹说。“只有当普通人可以付费并从中获得乐趣时,情况才会变得更好,而专业人士支付的费用低于他们为企业产品支付的费用,并且仍然喜欢该产品并将其用于工作。我认为这种简单性很有价值,我们希望保留它。”

Midjourney创始人说“世界需要更多想象力”

Midjourney绘制

未来是什么:文本到 3D?

虽然全世界都认为文本到图像演变的下一阶段将朝着成熟的视频或电影发展,但 Midjourney 却持不同意见。事实上,该公司可能会尽可能地避免这种情况——因为整合文本到视频的功能可能会使产品更加昂贵,而且如果没有经过深思熟虑,输出可能会破坏交易。

也就是说,Holz 确实计划通过文本到 3D 将事情提升到一个新的水平。他详细介绍了 Midjourney 寻求使输出更真实并转向增强现实和虚拟现实的追求。它渴望将流动的想象力带入现实世界。

Midjourney绘制

“我关心三件事:反思、协调和想象。为了创造一个更美好的世界,我们需要更加反思,更加富有想象力,我们需要更好地协调。我想在每个领域都建立一些大的东西,然后有一天将它们聚集在一起,”他说。

除此之外,该公司确实打算构建具有更多增强功能的现有产品,从而使输出更加真实和细致。

此外,Midjourney 的技术结合了自己的模型和开源代码来创作艺术。Holz 的近期目标是停止使用开源产品并 100% 在内部创建代码。

“我觉得有些技术人员基本上表现得好像我们没有过去,世界上有很多人害怕没有未来。但我觉得事实是我们实际上已经走到了一半,”霍尔兹说。“我们身后有这段美丽而丰富的历史,我们面前有一个同样丰富美好的未来,”霍尔茨乐观地总结道,暗示了 AI 对无限可能性的承诺和公司的精神。