LOADING

AI绘图正在逐渐取代中底层画师?

2024/04/20 一起用AI
555

在过去的几年里,人工智能取得了极快的发展,其中包括基于机器学习和深度学习的「图像生成技术」。运用该技术,只需输入文本语句就可输出具有独特风格和想象力的图像。面对AI绘图这个势不可挡的趋势,设计从业者们,是否做好准备了呢?

在过去的几年里,人工智能(AI)取得了极快的发展。

ChatGPT和GPT-4对话上的智能程度在不断刷新常人的认知,给大众带来了惊人的体验与惊叹。

同期发展的AI技术,还有基于机器学习和深度学习的「图像生成技术」。

该技术能够让计算机在一定程度上模拟人类进行绘画,用户只需输入文本语句(prompt提示)就可输出具有独特风格和想象力的图像。

文本->图像,AI绘图,指的就是这个过程。

随着大众对于AI绘图关注度的升温,相关的争议不断,有人开始提出「AI取代画师」的观点。

面对AI绘图这个势不可挡的趋势,设计从业者们,是否做好了准备?

一、AI绘图,高效无情的出图机器

2022年8月,在美国科罗拉多州艺术博览会上一幅名为《太空歌剧院》的画作在数字艺术类别比赛中获得了第一。

由AI绘制的《太空歌剧院》

人们也很快得知,这个画作并非真人绘制,而是由游戏设计师使用一个叫Midjourney的AI工具生成而来。

随着这则新闻的传播,AI绘画也开始进入更多人的视野。

1. 国外知名的AI绘画工具

下面先介绍几个国外具有代表性的AI绘画工具:

1)DALL·E2

DALL·E2 是一个由 OpenAI 公司开发的模型,也是一个在线服务。它通过输入一个文本描述(prompt提示)生成多个精准匹配文本的图像。

DALL·E2 结合”CLIP 预训练模型”和”Diffusion扩散模型”来实现了文本->图像(text-to-image)的生成。

扩散模型运行时的成像过程,就是一个”Diffusion 扩散”的过程——

从有噪声开始->逐渐改善图像->直到完全没有噪声->图像越来越接近所提供的文本描述。

DALL·E2 还有一个的特别的功能是”AI编辑”,可以在生成的图片上涂抹某些部分再让 AI 直接修改。

DALL·E2 只使用了已获授权的图片集来进行训练。

2)Stable Diffusion

Stable Diffusion 模型,前身是谷歌开源的 Disco Diffusion 模型。

Stable Diffusion 模型也结合了CLIP技术(OpenAI发布的技术)和Diffusion扩散模型,同样是通过输入文本(prompt提示)来生成图像。

比较特别的是, Stable Diffusion 是一个开源的模型,很多开发者基于这个开源模型开发训练出了更多不同的生成模型。

Stable Diffusion 的母公司Stability AI 在2022年10月宣布获得1.01亿美元融资,投后估值达10亿美元。

3)Midjourney

Midjourney由同名实验室开发,和大部分市面上的AI绘画应用采用的是同一个模型,但是模型使用了大量图像数据来训练。

Midjourney在生成图片的一致性和连贯性上做了很多努力,它生成的图像风格十分独特。

Midjourney几乎所有的生成和交互都发生在Discord社区里,使用其Discord机器人来接收请求和发送生成结果。

3种绘图工具的对比:我们进行测试,对于同样一句文本(其他参数默认的情况下),这3种绘图工具的图片生成效果。

输入文本:

An old man rowing a boat on a lake.

AI生成的图片:

收费标准:

3种绘图工具的体验地址:

①Stable Diffusion

Dream Studio:https://beta.dreamstudio.ai/dream

Hugging Face(免费): https://huggingface.co/spaces/stabilityai/stable-diffusion

②DALL·E2

https://openai.com/dall-e-2/

CLIP:https://openai.com/blog/clip/

③Midjourney

https://www.midjourney.com/home/

(注:某些服务只对部分国家开放)

Midjourney的效果更具艺术感:

对比生成效果可以明显看出,Midjourney生成的图像不太像照片,似乎更像一幅艺术画作。

在Discord社区里运作的Midjourney社区 ,因为其具有艺术感且画面注重细节的生成效果,收获了全球近千万用户,在线用户也是百万等级。

在社区频道里,用户仅仅需要使用/唤起命令行操作,在/imagine命令下输入prompt文本发送即可。

以下是输入简单文本后,Midjourney生成的图像:

效果如此惊艳的生成图片,只需几十秒内就能得到。

2. 国内的AI绘画产品

国内也相继出现了类似的AI绘画产品,几乎都有免费尝试的额度,通常支持多种风格/艺术家/模型。

以下是国内提供AI绘画服务的一些产品:

随着技术的逐渐普及和越来越高的热度,AIGC似乎就不再是大众试水画图画着玩儿的一个小工具。

这个”高效无情的出图机器”,似乎已经开始在影响和撬动设计行业的变革。

二、设计行业 X AIGC

1. 游戏制作× AIGC

很多游戏项目,开始利用AIGC生产游戏相关素材。

1)国外游戏工作室 Lost Lore《Bearverse》游戏

国外游戏工作室 Lost Lore 出品的主打 NFT 集换概念的F2P游戏《Bearverse》包含了大量的角色设计。

游戏工作室直言:采用AI画图节省了80%美术成本!

①17名角色的调整:

开发成本:从5万美元压缩至1万美元;

工时耗费:从6个月大幅减少至1个月。

②创作一张场景概念图:

工时耗费:从1-2周压缩至1天以内。

设计总监最后也坦言:

95%的效果和概念图呈现仍是由团队真人创作。

2. 商业设计 ×AIGC

大厂团队已经不甘观望,开始了AIGC在商业设计工作流中的实践。

1)腾讯-ISUX团队

腾讯的ISUX团队2023年3月1日刚刚发表在其官网的文章《运用AIGC人工智能生产内容》

https://isux.tencent.com/articles/aigc-design.html

文中提到了腾讯的ISUX团队运用AIGC进行商业设计的好几个案例,并进行了结合使用AIGC后设计团队的全新工作流的方法总结。

2)百度-AIGC营销赋能业务

百度也在试图利用AIGC满足商业设计上的需求。

百度发布了AIGC方向的产品负责人岗位,负责比如”商业广告平台部的内容生产相关工具的规划和落地”。

3. 个人头像设计× AIGC

1)国外的AI美图软件Lensa「魔法头像」功能

「魔法头像」是Lensa基于Stable Diffusion技术开发的头像生成功能,用户上传10-20张自拍照,能生成50~200张不同风格的AI自画像/头像。

生成50/100/200张的价格分别是:3.99/5.99/7.99 美元。

因为这项新功能的加入,2022年12月的前5天,Lensa下载量达到400多万次,”日收入”也一度达到了300万美元。

2)美图秀秀「百变 AI 头像 」功能

同样是美图软件的国内团队——美图秀秀,也随机发布了相似的功能。

从产品定位来看,也是输入真人头像就能批量地获得多种风格的头像。

和国外的AI美图软件Lensa相比,美图秀秀对于用户的输入门槛要求更低一些,只需要提供3张正脸无遮挡自拍照即可。

3)抖音「AI绘画」特效

继2021年的「漫画脸」特效(基于GAN技术)后,2022年抖音又上线了特效玩法「AI绘画」(基于Stable Diffusion技术)。

用户只要输入一张图片,AI就会根据图片生成一张动漫风格的图片。

抖音「AI绘画」功能的的峰值QPS(每秒请求量)一度达到1.4w。

4)QQ小世界AI画匠

腾讯QQ上线了”QQ小世界AI画匠”活动,主题为”异次元的我”。

用户上传1张个人照片,即可一键生成专属异次元形象。

4. 动画背景× AIGC

1)国产志怪类动画《神弦曲:猫儿与时光铃铛》

由十九号动漫出品的国产志怪类动画《神弦曲:猫儿与时光铃铛》将于明年上映。官方在2022年12月发布了预告片。

主创团队称,预告片三分之二的背景都是结合AI制作完成的。

制作预告片中的30多个背景,工时耗费从3个月降到2个月,效率上提升了至少30%。

主创在采访中提到:”有了这样的一个技术,把我们的预算从一个标准动画电影预算直接减半,我们就快速地获得了一些投资机会。”

5. 视频制作× AIGC

除了绘画领域外,AIGC也在动态的视频生成上有了很多突破。

1)Runway 新功能:视频转风格生成器 GEN 1

Runway AI 是一家图片和视频AI编辑软件提供商,为设计师、艺术家和开发人员提供一系列工具的平台,帮助他们利用人工智能技术创建作品。

Runway 平台推出了新功能 —— 把视频转换成任意风格的生成器 GEN 1。

GEN 1 这个能力和图生图功能(image-to-image)类似,只是变成了从视频到视频(video-to-video)的生成。

https://research.runwayml.com/gen1

看起来, GEN 1 是一个支持用户可订制化的视频滤镜的能力。

而定制化的方式极为简单,只需一张具有风格的图片。

2)Wonder Studio:一键替换真人为CG角色

这款由一家人工智能初创公司Wonder Dynamics推出的AI工具Wonder Studio,声称可以实现「一键把视频中的真人替换为CG角色」,简化电影制作流程。

https://wonderdynamics.com/

整个工具的使用流程大概是:

真人先替代CG机器人进行表演

视频拍摄完成,导入进软件

选择想要的CG角色,安装在实拍的真人身上

目前官方网站上开放了内测申请。

三、AI绘图的争议

在设计行业中,很多人的对于AI绘图的态度,都是不怎么正面的,主要集中在几点:

从业者的担忧

版权

学习信心的打击

争议1:从业者的担忧

在AIGC生成绘画能力效率和质量皆可的前提下,中底层画师好像确实慢慢就不需要那么多了……

论出图速度:人赶不上机器的出图速度;

论出图创意:AI 可以生成出关键元素外的细节,似乎更为惊喜;

论风格效果:AI 能训练出不同的绘画模型,对应不同画风;

输入相同的一段prompt文本后,不同的模型可以生成出不同风格的图片,且速度极快,通常是几秒~20秒内不等:

除了想要的关键元素外,生成图片中还包含更多精彩的细节描绘。

结合AI批量生成的能力,很多绘画需求,似乎只靠AI就都被高效地满足了。

随着AI作画的部署成本逐渐降低,一些中小企业和初创团队,也开始有能力在通用大模型的基础上进行模型的调教、设计师岗位的精减。

令从业者最担心的事情就是:

当AI绘画工具具备了一定绘画能力,也就同时具备了”抢人类设计师饭碗”的能力。

争议2:版权

我们在AI绘画出的作品中能看到很多有明显风格的影子。

也可以直白地说,一些AI绘画模型的训练数据中,有着很多未经明确授权的画师作品。

AI绘画侵犯了画师的版权,也开始遭到画师们的集体抵制。

2022年8月29日,一个名叫mimic的AI绘画网站上线了测试版,主攻日系二次元画风头像,允许用户上传15-200张图像让AI学习并输出相同画风的AI画作。没想到刚发布便遭到大量日本画师的抵制,画师们集体发表了”禁止将我的作品用于AI作画”的声明。有的画师为了防范于未然,甚至删除了发在推特上的画作,怕有心之人盗用上传至平台使用。

2022年12月,全球知名CG视觉艺术网站 Art Station也被上千名画师发起了联合抵制,画师们认为,任由系统学习模仿自己的画作是在侵犯版权。网站画师纷纷上传一张名为”NO TO AI GENERATED IMAGES(拒绝AI绘画)”的图片表明态度,首页一度被此图片占领。

对于画师们来说:

自己的画风,是独属于自己的独特标志和可贵财产。

如果让AI简单地模仿自己画风来作画,那无疑是对独有艺术的糟蹋。

即便有的画师愿意提供自己的绘画作为模型的训练数据,但似乎他/她们也没有收到任何版权上的收益。

AIGC产出的画作的版权归属于谁,成了关注和争议的话题。

争议3:打击小白学绘画的信心

AI 绘画的强势碾压的能力,似乎也打击到了不少绘画小白从零开始学绘画的信心。

有的人会感叹:

既然AI几天就能学到做到那么好的效果了,自己再花费数年去学习,还有没有必要…

四、AI 绘图的短板

AI绘画当然不是全能的,也永远不会是。至今的AI绘画也还存在着众多短板。

短板1:AI 无法准确还原想象中的创意

AI绘画的确具有非常强大的创造力和想象力。但这样的创造力和想象力,其实是一种「快速随机」的结果。

效果既受限于算法、数据的质量和数量,也受限于用户对于prompt的运用。

人类的创造力和想象力仍然具有独特的价值,想要AI生成还原出来十分贴合人脑想象中的创意,是很有难度的。

不少尝试了MidJourney进行AI绘图的人表示:

AI生成的图片效果确实是不错,但都并不是我脑海中想象的那个样子。

甚至,AI会理解失误,生成”离谱图片”:

输入的文本是:一个小女孩,一手拿着冰淇淋,一手牵着气球,走在公园里。

AI生成出的却是——”冰淇淋气球”。

短板2:AI 绘图还不足够满足个性化需求

AI 绘图是很强,但是还不足以满足个性化需求。比如:

针对不同场景类型进行统一且又独具个性的设计;

稳定一个主体使之在每一次生成结果中都保持成套效果;

以上能力的欠缺,使得AI无法高效地完成”成系列的商业设计”。

五、AI绘画的未来

尽管很多设计从业者对于AI绘画表示焦虑,但作者判断:未来很长一段时间内,大部分行业可能只会把AI绘画当成一个「辅助工具」来用。

前期,大家在拼AI的效率;后期,则是拼人工优化AI的能力。

人工优化AI能力,可以从以下3个方向出发。

优化AI方向1:AI 模型的定制

想要模型更稳定地产出特定风格的绘画图片,可以定制出一个AI模型。

但AI模型的定制的门槛比较高,通常至少需要一个设计师搭配一个算法工程师来实现,而涉及到模型训练的过程,则需要工程部署能力、硬件显卡的支持。

模型训练出的效果也取决于多个因素,比如:训练素材、模型选型、参数设置、训练方法等。

优化AI方向2:会用 prompt “咒语”

我们可以把”prompt”理解为”送给AI模型的文本指令”。

输入高质量有效的prompt,可以大幅度提升AI绘图的稳定度,让成图更加接近我们的描述。

prompt输入的格式通常可以是以下内容的一个组合:

prompt文本输入=[形容词+主语 / 主语+状语],[背景],[画面类型],[风格/艺术家],[灯光/色调],[视角/修饰词],[细节],[画面质量]

因为这一体验过于神奇,很多人不禁将prompt形容为”咒语”。

在市场上,还出现了买卖prompt词的平台:一家初创公司PromptBase,允许用户在该平台买卖提示词(Prompt),售价约为1.99美元~9.99美元不等。PromptBase将向卖家抽成20%。

平台上目前已上架不少提示词,适合不同模型、不同种类。

而在学术上,也有所谓”prompt engineering” 即” prompt 工程”的说法。

提示工程(prompt engineering):如何同人工智能交流,并得到你要的结果。

https://learnprompting.org/docs/intro

优化AI方向3:灵活组合模型,优化工作流

因为AI绘画工具的介入,现有设计的工作流程将随之而改变,整合诞生了全新的工作流:

AI绘画先进行生成-> 再从AI生成的十几张结果中挑选用作局部素材->再利用PS或其他工具精修处理

随着AI绘画相关的新技术不断出现,其AI绘画的工作流也需要随着新的技术来优化,进化为更适合的工作流。

比如,当发现了「根据图片提取prompt」的新技术后,可结合这个新技术优化设计工作流。

结合了「提取prompt」的设计工作流,也许就变成了这样:

再比如,当发现了出现「ControlNet插件」的新技术后,可结合这个新技术再次优化设计工作流。

ControlNet插件:可以完成对人物骨骼走势、形态、动作、姿势的精确控制。

结合了「ControlNet插件」OpenPose模块的设计工作流,也许就变成了这样:

以上提到的”人工优化AI能力”,第1点”AI模型定制”门槛较高,需要一定技术和硬件。

但”prompt实践”、”设计流程优化”,都是现今设计从业者可以探索和实践的方式。

六、画师的命运:等着被取代,还是转型?

我们经常看到一些新的AI技术应用的效果出现后,很多人立马开始感叹:AI抢饭碗了、AI取代设计师、失业倒计时+1……

AI绘画的能力不容忽视,但它也不是万能的。

AI解决了生成效率,能在一定流程上减少一部分工作量。但又因为AI绘画引入了新的工作流,同时会创造新的工作量。

相应地,一些新的就业岗位也会增加,比如现在就有俗称为”AI调教师”的一种存在。

在某些绘画领域中,也已经有了”AI插图绘制师”、”AI绘图师”的人力需求:

以下,也许是”AI绘图师”可以贡献的能力:

绘制优质的训练素材供模型学习

高效地使用prompt,测试出稳定的生成效果

将”生成结果的质量好坏”准确地反馈给算法(人类反馈强化学习RLHF)

结合AI技术,优化设计工作流

AIGC势不可挡,那些率先学习如何用AI进行美术工作的人,将会发现自己处于行业的顶端。

毕竟,差异化竞争的关键,就是让自己掌握”差异化的优势”。

截图源自Aisocia.com平台的AI对话

结语

借用一段”腾讯ISUX团队”文章中的结语:

随着AI模型能力的飞速迭代升级,现有的短板能力也会不断补齐,因此我们可以相信在不远的将来,设计师利用AI模型来开脑洞并辅助出图是趋势所向,但并不是说我们需要完全依赖AI,因为设计本身是理性而浪漫的工作,仅靠随机性做设计是完全不可取且不靠谱的。更合适的思路应该是,设计师首先定义好规则与框架,从AI模型提供的成百上千个结果中寻找到最匹配我们诉求的结果,从而辅助我们更快更好的达成目标。另外面对日新月异的的智能工具,我们应该保持终生学习的心态,做好时刻接受新事物的挑战,才能在越来越激烈的竞争中立于不败之地。——《运用AIGC人工智能生产内容》

AI绘画,还仅仅是AI技术应用的其中一环。未来,AI将涉足3D模型生成、AI视频创作、AI作曲等领域。

更多AI能力也会发展,就像现在的AI绘画一样,影响和撬动相关行业的变革。

AI绘图会取代所有画师吗?不可能。

AI绘图会逐渐取代中底层画师吗?不无可能。

留给从业者的忠告,还是那句话:保持终生学习的心态,做好时刻接受新事物的挑战。

最后,送给所有打工人的心声:

参考文章:

https://www.marktechpost.com/2022/11/14/how-do-dall%C2%B7e-2-stable-diffusion-and-midjourney-work/ How Do DALL·E 2, Stable Diffusion, and Midjourney Work?

https://www.thepaper.cn/newsDetail_forward_21420325

https://finance.sina.com.cn/blockchain/2023-03-03/doc-imyiqhat7670720.shtml

https://baijiahao.baidu.com/s?id=1759154697131925527

https://mp.weixin.qq.com/s/pkzXaW_-77zXLKQqx2nlcA

作者:葛晓玲,一个互联网重度依赖者。微信公众号:产品零感(feelingPM)

本文由 @葛零零 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于CC0协议

查看原文