当人工智能开始创作:谁来保护艺术家的创造性和知识产权?
【编者按】在人工智能赢得科罗拉多博览会的美术比赛之后,越来越多的艺术创作者意识到改变或许已经来临。事实上,插图画家、商业平面设计师和照片修图师早已感受到了“被AI取代”的危机感。包括艺术的本质,创作的归属权,以及风格、感觉或灵感等无形元素引发了AI创作平台、艺术家、平台工程师以及监管平台的矛盾与争论。许多艺术家表示,如果人工智能创作艺术的浪潮已无法停止,那么至少应该给予艺术家更多的保护。本文原载于《美国政治新闻网》,作者Gian Volpicelli是“美国政治新闻网·欧洲分部”的科技记者。
当杰森·艾伦参加科罗拉多博览会的美术比赛时,他不仅想赢,更想表明一个观点。
艾伦是一名视频游戏设计师。他提交的作品名为“太空歌剧院”(Théâtre D opéra Spatial),是一幅巴洛克式的幻境画,光线透过一扇敞开的圆窗,照射着三个身着礼服的人物。2022年8月,在该作品获得比赛第一名后,艾伦公开表示这幅画作是由AI绘图工具Midjourney生成的,该工具是一个能将文本描述转换为完整图像的人工智能程序。(艾伦说,他在提交作品时已经明确表示,这幅作品是他用人工智能工具创作的)。
《太空歌剧院》(Théâtre Dopéra Spatial)他的获奖引起了其他艺术家的愤怒,艺术家们认为艾伦没有遵守规则,并担心这样的作品会破坏他们的艺术。艾伦毫无歉意,不仅如此,他还非常欢迎这些批判。“我想作出一个声明:艺术家们说这永远不会发生,‘人工智能永远无法做我所做的事情’。但它可以,人工智能在这个美术比赛中赢得了第一名。”艾伦补充说,“我们应该更多地讨论是否要让人工智能接管我们的生活。”在艾伦赢得比赛后的几个月内,“人工智能的创造力”从互联网中最无趣的话题,迅速成为了关于“究竟什么是艺术”的对话核心;也有人质疑:传统艺术家和他们花费一生时间培养的技能是否还有未来?
只要稍微花点时间在网上冲浪,你就肯定会遇到人工智能艺术:包括Midjourney、Stable Diffusion和Dall-E-2等程序在几秒钟内生成的图像,以及最近由聊天机器人ChatGPT编写的诗歌、歌词和文章。2023年1月,谷歌透露它们开发了一款能够将文字描述转换成高保真音乐的程序。
人工智能插图涵盖了各种艺术风格:毕加索(Pablo Picasso)、马格利特(René Magritte)、H. R.吉格尔(H. R. Giger),并且可以模仿艺术家的笔触。如果需要生成照或写实型的图像,它还可以模仿不同类型相机的视觉效果。当然,这些程序也有一些限制:大多数模型都被设定为拒绝生成色情或暴力图像,拒绝生成在世的政治家或公众人物的图像。这些程序也会在复杂的细节上表现挣扎,最明显的是,他们在画手方面表现糟糕,经常把手指画错或多画出几根手指。但随着技术的改进,这些问题有望得到解决。
蒙特利尔人工智能伦理研究所(Montreal AI Ethics Institute)的创始人阿比谢克·古普塔(Abhishek Gupta)表示:“即使是人工智能行业的资深人士也不能完全预测事情会发展得多快。每当我们从惊讶中回过神来,其他的事情就会接踵而来。”
飞速发展的技术变革引发的经济焦虑,至少可以追溯到工业革命之初。当时英国纺织工人发动了反对机械化的骚乱,破坏了机器并与军队作战。他们的名字来自一个杜撰的人物,名叫内德·卢德(Ned Ludd)或国王卢德(King Ludd),这些横冲直撞的暴怒织工们被称为卢德派。此后的几个世纪里,“卢德主义者”一词被赋予了负面含义,因为技术的颠覆性浪潮并没有导致大规模失业,反而创造了新的产业、带来了更好的工作和更高的生活水平。随着人工智能进入创意层面,问题不在于历史是否会重演,而在于如何管理这一过程。
创造力曾经被认为是人类独有的能力,但它现在正经历着自动化。这迫使艺术家、工程师、律师和监管机构与艺术哲学中一些最大的难题进行斗争,包括艺术的本质,创作的归属权,以及风格、感觉或灵感等无形元素是否能被视作个人所有。
创造性的破坏
现在,人们不难在网上发现“卢德主义者”的影子,成千上万的艺术家在他们的推特账户或在线艺术展览上张贴了“别用人工智能”的标志。其中一个名为ArtStation的平台被反人工智能的表情包淹没了,以至于平台在2022年12月底禁止了这些表情包,并宣布将尽快对人工智能制作的艺术品进行标注。
人工智能项目背后的人很快指出,并不是所有的艺术家都在抱怨。“我不认为AI会取代艺术家,”Stable Diffusion 背后的母公司Stability AI的创始人伊马德·穆斯塔克(Emad Mostaque)说,“摄影师和数字艺术家并没有取代传统艺术家。人工智能创造了全新的表达形式。”
但不可否认的是,即使具有创造性的艺术家没有被替代,但日常插图画家、商业平面设计师和照片修图师正处于面临裁员的状态。在账簿的另一边,有迹象表明,一个新的行业已经诞生。2022年10月中旬,总部位于伊利诺伊州的人工智能咨询公司Addition发布了一则招聘新职位的广告:招聘提示工程师(prompt engineer)。这份年薪9万至10万美元的工作需要开发和测试“提示”,即通过文本告诉人工智能程序需要创建什么图像。据Addition首席执行官保罗·亚伦(Paul Aaron)介绍,理想的候选人应该有全面的背景,能将编程技能与创造力结合起来,还应该具有艺术感知力。
在许多从业者看来,清晰地写下提示本身已经成为一种艺术。小型的平台生态系统,包括PromptBase、KREA、 PromptHero在网上纷纷涌现,它们可以提供高质量的提示,每个提示只需几美元。英国艺术家盖伊·帕森(Guy Parson)为图像生成器DALL-E-2编写了一份82页的指南,其中有一个关于何为“好的提示”的例子:索尔·莱特(Saul Leiter)在20世纪60年代的纽约拍摄的一张颗粒状抽象的过期胶片照片,一个穿着红色裙子的女人愤怒地用手机说话,她愤怒地打手势,50mm镜头,电影色彩,过饱和滤镜,模糊,反射,折射,变形,雨滴,涂抹,污点,模糊,电影胶片800t。
在不同的平台,相同的提示可能产生不同的作品。但总的来说,细节、精确的提示和要点词语(例如某个历史时期、某种艺术风格、某种相机类型)是必不可少的。亚伦说:“这就像英国逻辑学家伯特兰·罗素分析句子一样。你不必做到那种地步,但你需要非常精确。”亚伦表示:“提示甚至可以被用来生成其他提示。你可以训练一个语言模型生成一个‘艺术提示。’”例如,制作一张有关未来的插图,起初可能不过是一封充斥着流行语的电子邮件,然后被聊天机器人改造成艺术提示,最后以完全成熟的数字图像出现:一个饱经风霜的枪手站在亚利桑那沙漠里;一只戴着粉红色墨镜的柴犬幼犬;或是一幅险恶的月球景观画。
“秘方”
人工智能创作的艺术作品激增引发了一场争论,这场争论不仅关于艺术的本质,也关于创作过程中的各种要素,以及谁可以合法地拥有作品的所有权。当艾伦赢得比赛后,他激怒了插画家,也惹恼了提示写手,因为他决定不透露自己创作艺术品时使用的提示文字,这违反了人工智能艺术社区的一条不成文规则。艾伦说:“我最初说过,当我完成项目后,我会公开我的提示。后来我对此有了更清晰的认识:这样的做法就像让厨师公布他的秘方。”
尽管输入相同提示不能保证每次都产生相同的作品,但艾伦说他已经设计出一种名叫“种子”的通用结构,能始终如一地创作出具有独特氛围的图像。艾伦的程序不会一直创作出相同的画作;但像梵高(Vincent van Gogh)一样,它生成的图像将共享标志性的、难以言喻的美。“这个提示很有价值,”他说,“这正是人们在寻找的东西。”
艾伦说,他正在和律师讨论如何保护自己的知识产权,包括他创作的艺术品,还有他输入的提示。虽然艾伦拒绝透露细节,但他表示将自己的提示版权化“肯定是我们可以着手的一个方向”,但他担心这一过程可能需要公开分享提示。“这些提示将进入公共领域,”他说,“这基本上是在告诉所有人,不要去想房间里的大象。”
传统艺术家也在要求赔偿。当他们的作品被用于训练人工智能模型时,他们会要求赔偿,或要求能选择完全退出。曾与漫威(Marvel)和工业光魔(Industrial Light