导言

如果你是深度学习领域的工作者,最近大火的 Diffusion model 你一定不会太陌生。在知名的机器学习模型托管网站抱抱脸(Hugging Face) 的 Treading 中,前几个无一例外的全是扩散模型。

而这些扩散模型生成的图也是非常惊艳,无论是风景还是人物亦或是各种风格的绘画,生成的图像都有极高的素质,这里简单放几张由这些模型生成的图片。

图源自 Midjourney Hanzo

图源自 Midjourney Hanzo

图源自 Midjourney LiaLöwenherz🦁💙

图源自 Midjourney LiaLöwenherz🦁💙

当然,不少大小企业也已经开始利用扩散模型进行商业化的运作。 比如,国外的:

国内的:

也有人用 AI 给 LOL 夺冠作图1,甚至人民日报还在 B 站发了一个利用扩散模型生成的中秋节视频,说明是真的 “火” 出圈了。

笔者最近在上自然辩证法的课,便也想来思考一下这件事,因此也就有了这篇文章。关于扩散模型的一些简史、原理、性能比较,可以去看我的另一篇文章

问题的提出

那么这些模型效果如此惊艳,或许有朝一日我们便不再需要艺术家来作画?

那么艺术家的工作,会不会被这样的生成艺术所取代?5 年?10 年?20 年?100 年?未来的艺术和艺术家会是什么样的?

AI 的飞速发展

AI 的历史可以追溯到很久,这里就简单说一下近几年 AI 领域,尤其是深度学习领域的重要进展,几个 milestone:

  • 2012,AlexNet 模型在 ImageNet 图像分类任务上超越人类
  • 2016,AlphaGo,在一个人类从来不认为会战胜人类的领域-围棋,大败世界围棋冠军李世石
  • 2018,StyleGAN,生成的人脸图像,人眼无法分辨真假
  • 2021,OpenAI - GPT3,基于上下文的大语言生成模型,可以生成各种各样的文本,甚至是代码。据说花费了 OpenAI 460 万美元才训练出来2
  • 2021,DeepMind - AlphaFold 2,蛋白质结构预测模型,对未知蛋白质有很高的准确率,有助于药物研发。
  • 2022,Stable-Diffusion(aka Dalle·E 2),高质量的文本到图像生成。

AI 已经在很多领域战胜了人类,并开始处于一个统治的地位。

这次的 CLIP + Diffusion 模型也是打破了很多固有认知,就像当初 AlphaGo 的出现,在此之前人们认为没有什么模型能够在围棋这种复杂的领域击败人类,但是结果大家自然都知道了,AlphaGo 以 3:1 击败围棋世界冠军李世石。此后,在围棋这个领域已经没有人能战胜 AI 了。

AlphaGo 战胜李世石之后,柯洁曾经就在直播的时候吐槽过,AI 让围棋变得非常“无聊”3。现在不是你有多厉害,而是你理解 AI 有多少,能和 AI 有多像,去学习 AI 下棋,但不可否认的是,AI 也让人类在围棋这个领域有了巨大的进步。

这次的 Diffusion 模型也是如同 AlphaGo 带来的冲击一样,先前的很多人认为深度学习模型不会具有创造性,只是对已有知识的归纳演绎,无法创造一个未曾看过的事物(包括我)。但在这里,它不仅能够理解一些奇怪语言的描述,无论多么天马行空,都能生成出一个合理的符合描述的图像,也可以生成一些没有见过或者人类的世界观中不能发生的事情,甚至还能够生成一些非常有创造性和想象力的事物。

图源自 Midjourney Discord 社区 BartonDH4,这张图片甚至被人拿去到 OpenSea 上作为 NFT 售卖,最终被举报下架,由此也可以看出 NFT 市场的版权还是非常难以解决的一个问题。

什么样的工作会被取代

从古到今,机器替代人工提高生产效率的事情是必然的。

2019 年 1 月,牛津大学未来研究所的人工智能管理中心学者 Baobao Zhang 和 Allan Dafoe 发布了 111 页的报告《Artificial Intelligence: American Attitudes and Trends》5 6,报告中提到了 AI 对一些重复性工作替代的风险。2013 年,Frey et al. 的《The future of employment: How susceptible are jobs to computerisation?》7中给出了 700 多项工作及其被替代的概率,指出在美国有 47% 的工作有很高的被替代风险,这其中就包括了电话销售、标题审查员、纺织工人等等。而这些大多是有着很多重复性的工作,比如电话销售,大多数的工作就是重复的打电话,而且几乎用着一样的话术,现在大家接到的一些骚扰电话也很多都已经不是人工来进行的了。而像艺术家、科学家这一类有创造性的工作他们认为是有较低概率被取代的。

当然这已经是 2013 年的文章,很多观点其实也有些过时了,原先他认为超低概率被取代的职业也已经有很大概率被取代的风险了。比如最近也是非常火的领域 AI in Science。比如 2021 年 12 月登上 Nature 封面的文章《Advancing mathematics by guiding human intuition with AI》8,就是用 AI 来引导数学公式的证明。虽然这并不意味着 AI 已经能够取代数学家的工作,但是 AI 已经引导科学家或数学家的数学直觉,具有一些数学素养,帮助数学家获得证明定理的灵感,在未来用 AI 引导直觉,提升研究效率也并不是空想。

AI 能做到什么程度?有什么问题?

那么重新讲回艺术,现在的扩散模型,大多的逻辑主线不会变,就是能够从一个随机噪声或初始值生成出一张完整的画。

Cavemen taking a group selfie

Cavemen taking a group selfie

An astronaut, riding a horse, in a photorealistic style

An astronaut, riding a horse, in a photorealistic style

并且除了生成之外9 10,也已经有了非常多的绘画技能,例如图像补全、图像超分根据语言描述来 P 图。

这就是一张由 OpenAI 的 Dall·E 补全的《戴珍珠耳环的少女(The Girl with a Pearl Earring)》11

Imagen 论文中的超分辨率12

Dall·E-2 的图像编辑10

AI 能做到这种程度其实是有一定风险的,毕竟 AI 能够去理解一些专有名词的含义,因为现在这些 AI 的训练数据大多是来自于网络图片,而非固定的数据集。那么这样会带来很多版权的问题( 除了著作权,还有肖像权,角色的各种所属权利),这也在网上引起了很大的争论,也被很多画师抵制 AI 作画13 14

Generated by Stable Diffusion, prompt: trump kiss putin

Generated by Stable Diffusion, prompt: trump kiss putin

很多插画师或者原画师的饭碗取决于自己独有的画风,但是一个很现实也是很容易的事就是,这些画师们用了几年设计了一个优雅完善的画风,AI 看了一眼,用了数据 train 了一下,轻轻松松几秒内生成了一堆同画风的作品,这创作效率是否有些不够平衡,画师们来抵制也就合情合理不足为奇了15。毕竟这种产品最终是要进行商业化运作的,而画师们的画通过免费的方式发布在互联网上被 AI 吸收和学习,这对画师们显然是不公平的。

DALL·E 2 VARIATIONS of The Girl with a Pearl Earring

DALL·E 2 VARIATIONS of The Girl with a Pearl Earring

但是这从来不是画师们说的算的,现有法律是没办法禁止这样的创作的。毕竟,画风的模仿,并不能算在抄袭或者侵权的范畴,至少在如今我国法律是没有保护这方面权利的条文,从这里也可以看出,“伦理的建设远不及科技的发展速度”。根据我国现有的法律案例来看,有两个方面,一个方面是对 AI 生成物的版权肯定,另一方面是“独创性”的定义。

法律是承认并且保护 AI 创作的版权的16,肯定对 AI 模型训练和 prompt 调参的工作(炼丹)。AI 生成的画作的过程中,只是用了数据进行训练,而对成品具有原作的某些元素而已,符合“独创性”,就像人类观摩其他作品后,不可避免有风格相近的地方17

而在国际上的对 AI 独创性方面的认可,一个非常典型的栗子就是最近发生的。2022 年 8 月,美国科罗拉多州举办艺术博览会,《太空歌剧院》获得数字艺术类别冠军18

《Théâtre D’opéra Spatial》 by Jason Allen via Midjourney

《Théâtre D’opéra Spatial》 by Jason Allen via Midjourney

AI 必将对绘画这个领域带来巨大的颠覆,同时也不仅仅是这样,更多的还有对动漫影视行业的冲击,虽然目前无法生成非常连续的视频,但是有插值补帧的一些方法,随着研究的更加深入,由 AI 生成视频也会很快的实现,已经有 AI 进行视频编辑19 以及 AR20 的 demo。

另外一点就是,AI 生成的图片会有其他元素的风险,比如色情、血腥暴力等元素,例如 Reddit 就已经 ban 了很多 NSFW 的帖21

“创作者” + 技术力 = “艺术家”

那么,AI 生成的图片现在有一些风险,但毕竟这是一个高速迭代的领域,这些风险会在后续的发展中逐渐规避。但不可否认的是,AI 生成的图像已经有很多是富有想象力和创造性的图片,那么或许我们真的不需要 “艺术家” 了?

让我们回到最原始的问题,什么是艺术家,将其所体验的世界通过各艺术种类的独特艺术语言和表现手段转化成艺术作品的人 被称为艺术家22。而在这一过程中,艺术种类、艺术语言、表现手法随着 AI 的发展必然可以占领到艺术的各个领域,例如音乐、水彩、油画、素描等等。而最关键的是什么,是艺术家们通过所体验世界得到的 idea,而不管形式如何,形式也就都是艺术家的一种表现手法而已。

因此,我认为 “创作者(creator)” 可能会在未来代替艺术家的地位,弱化了艺术家的艺术技能,而注重内容的表达。

在短期内,艺术家们可以利用 AI 作为工具,快速生成初代作品进行迭代升级和修补填充23;但在中长期来看,AI 取代艺术家的工作是必然的,它能够让没有技术技能的人,通过不同的形式去表达自己的思想和观点,让更多人参与到艺术创作当中。

现在的在 B 站就有一些 “创作者”,用 AI 生成图像和视频来进行盈利24。而同时也出现了很多衍生职业:例如进行 prompt 提示词的教学,售卖 高质量图像的 prompt 等等。也有像 openartprompthero 这样的 prompt 搜索网站的出现,真正出现了 “prompt 工程师”。

结语

虽然目前 AI 还不能完全取代 “艺术家” 的所有工作,但已经可以作为一个工具,提供给更多人进行艺术表达,能极大地提高 “创作者” 的生产力。在不久的将来,扩散模型一定能提供更多更细节的优化,比如光影、视角等等来进行更精细的场景控制,到时候每个人都可以成为 “创作者”,将自己的灵感随时展现在大众面前。

当然与此同时,也应该注重对艺术家的版权和思想的保护,可以利用如今 NFT、Web 3.0 等技术和方法,完善相关法律法规,保护艺术家的原创作品。

然而,在遥远的未来,如果 AI 真的发展到已经地步,有了自己的情感,和人类共存,那么他是一定能取代 “艺术家” 的所有工作的。那么人工智能的奇点也到来了25,可以看到艺术和科学是两大顶峰,AI 如果占领了艺术,那么最终全面战胜人类也不远了。而现在,无法推论这到底是福祉还是灾难。

Reference


  1. https://lol.qq.com/news/detail.shtml?type=6&docid=4934556576507716833 ↩︎

  2. https://www.sohu.com/a/429205048_120828615 ↩︎

  3. https://view.inews.qq.com/a/20220514A087C500 ↩︎

  4. https://discord.com/channels/662267976984297473/1008049088324972657/1015362328906182748 ↩︎

  5. https://isps.yale.edu/sites/default/files/files/Zhang_us_public_opinion_report_jan_2019.pdf ↩︎

  6. https://www.zhihu.com/zvideo/1326127307812700160 ↩︎

  7. https://ora.ox.ac.uk/objects/uuid:4ed9f1bd-27e9-4e30-997e-5fc8405b0491/download_file?safe_filename=future-of-employment.pdf&file_format=application%2Fpdf&type_of_work=journal+article ↩︎

  8. https://www.nature.com/articles/s41586-021-04086-x.pdf ↩︎

  9. https://www.reddit.com/r/midjourney/comments/wvoscd/cavemen_taking_a_group_selfie/ ↩︎

  10. https://openai.com/dall-e-2/ ↩︎

  11. https://openai.com/blog/dall-e-introducing-outpainting/ ↩︎

  12. https://arxiv.org/abs/2205.11487 ↩︎

  13. https://www.gamersky.com/ent/202208/1513964.shtml ↩︎

  14. https://www.zhihu.com/question/550660606 ↩︎

  15. https://www.zhihu.com/question/550997249/answer/2656595328 ↩︎

  16. https://zhuanlan.zhihu.com/p/565071999 ↩︎

  17. https://www.zhihu.com/question/552231525/answer/2665147875 ↩︎

  18. https://baike.baidu.com/item/%E5%A4%AA%E7%A9%BA%E6%AD%8C%E5%89%A7%E9%99%A2/61959625?fr=aladdin ↩︎

  19. https://twitter.com/runwayml/status/1568220303808991232 ↩︎

  20. https://twitter.com/StrangeNative/status/1569700294673702912 ↩︎

  21. https://zhuanlan.zhihu.com/p/560232893 ↩︎

  22. https://baike.baidu.com/item/%E8%89%BA%E6%9C%AF%E5%AE%B6/23418?fr=aladdin ↩︎

  23. https://zhuanlan.zhihu.com/p/378444440 ↩︎

  24. https://space.bilibili.com/335884771 ↩︎

  25. https://www.zhihu.com/question/284243786/answer/1131987569 ↩︎