在人与AI的长期角力中,力图证明人类还有独特性的一方,可能又失了一城。 从2023年5月开始,人类就因为担心AI使他们失去工作,而发起了长达5个月的好莱坞大罢工。 在这次罢工中,影视界人士担忧AI会逐渐侵入影视制作的核心地带,如剧本写作和影视拍摄,这样编剧和演员们的存在意义会越来越小。 在彼时,人们并不担心编剧会消失,只是担心行业中的部分人会面临失业问题。 因为大家的共识还是AI至多能替代一些重复性的剧本写作或前期绘画工作。而最具“创意”的剧情、美术等部分都还需要人类来编织。 人们认为:AI没有“创意”能力,而人这一种族价值的自留地中最核心的部分就是——“创意”。 但是,在今年十二月《创意研究期刊》中杜克大学和哈佛大学的联合研究中,这一共识被挑战了。 他们发现,人的创意对AI生成的结果有影响,但并没那么大。 AI时代,人的创意能力在贬值 这项研究着眼于一个引人入胜的问题:在人工智能辅助创作的时代,人类与生俱来的创意是否仍然重要? 为了寻找答案,研究团队设计了一个精巧的实验。他们通过在线平台Prolific招募了401名说英语的参与者,这些人来自不同背景,年龄跨度从19岁到81岁不等。 实验的核心是让参与者创作三组文字提示,然后看看生成的图像创意如何。为了让参与者理解任务,研究人员给出了一个示例提示"一个比纽约市还大的苹果",并展示了AI据此创作的图像。 为了测量参与者的创意水平,研究团队使用了两个经典的创意测试。 除此之外,研究人员还收集了参与者的年龄、性别、语言能力和智力等信息,保证一切可能影响创意的因素都被考量进来。 既有的创意理论中,语义多样性是创造性的基础,比如完美但出其不意的类比就被大家认为很有创意。 研究人员还用了谷歌的Gemini来分析这些文字提示的"语义多样性"——就是衡量提示中的词语之间的概念距离有多远。比如,"猫"和"狗"的语义距离就比"猫"和"宇宙飞船"要近得多。 为了评判这些AI生成的艺术作品,研究团队请来了三位评分员。他们需要给每幅作品的创意打分,分值从1分(毫无创意)到5分(极具创意)。但评分员们并没有被告知什么是"有创意",而是依据自己的判断去打分。这种方法看似主观,因为创意评价其实没有什么标准,直觉反而是最好的标准。 最终,实验产生了992张AI艺术作品。然而,研究团队通过一系列统计分析发现,那些在创意测试中表现更好的参与者确实能够产生更具创意的AI艺术作品,但这种优势并不如人们可能预期的那样显著。 首先,研究发现所有创意相关指标之间都存在普遍的正相关关系。AI生成图像的创意评分与参与者提供的文字提示的语义多样性呈现正相关(相关系数r=0.16),这意味着当参与者能够想出概念跨度更大的词组组合时,最终的艺术作品往往会被评为更有创意。比如,将"鲨鱼"和"月球迪斯科派对"这样风马牛不相及的概念组合在一起,比简单描述"雨中的狗"更可能产生富有创意的作品。 研究还发现,参与者在标准创意测试中的表现与其AI艺术作品的创意评分也呈现正相关。具体来说,替代用途任务(AUT)的原创性得分与AI艺术创意评分的相关系数为0.11,而发散联想任务(DAT)的得分与AI艺术创意评分的相关系数为0.14。这表明,那些在传统创意测试中表现出色的人,确实倾向于产生更具创意的AI艺术作品。 这一影响大概能占最终作品呈现的多大不同呢?具体来说,高创意的参与者往往能够产生语义多样性更高的文字提示,而这些提示又导致了更具创意的AI艺术作品。DAT得分通过文字提示的语义多样性影响AI艺术创意的间接效应约占总效应的18%,而AUT得分的间接效应约占16%。 这一影响实在说不上大。如果非要比喻一下就是,人的创意能影响到你画出马奈还是德加(两人都是印象派中风格和时期都相近的画家),但不可能影响到是创造出印象派还是野兽派。 马奈 德加 更要命的是,深入的统计分析揭示了另一个发现:在控制了年龄、性别、语言能力和智力等因素后,文字提示的语义多样性仍然显著预测了AI艺术作品的创意水平(β=0.10)。 换句话说,即使排除了其他可能的影响因素,提示词之间的概念距离的远近,甚至比参与者的创意评分对画作创意影响更大。 是平权,也是价值的剥离 确实,脑洞越大,创意越强。但过去脑洞之间的空隙会很难被联系起来,你需要足够的经验和创造才能发现其中隐藏的联系和表现。而现在,AI就可以帮你去完成这些细节的联系和想象。 人类的创意中可能最复杂的部分反而被替代了。你只要大胆开腔就可以。 如果排除了这种语义多样性本身的影响,那人的创意在这里发挥的余地就更小。 在很大程度上,人类可能正在与AI的对比中失守创意王冠。因为这一过程中的核心过程已经被剥夺。 另外一个令人惊讶的发现是,研究发现之前使用AI艺术生成器的经验并不影响作品的创意评分。这表明,仅仅熟悉AI工具并不足以提高创作质量,真正重要的是个人的创造思维能力。 连熟练应用AI产品,通过卷来提高创意这条路也似乎行不通了。 因为AI无情的利用其随机性来塑造创意,而人似乎只能成为一个指令发出者。 事实上AI的创造能力已经被认知很久了。当Midjourney推出风格化之后,万千风格已经被创作出来了。有很多风格美丽、诡异,并从未出现在大家的认知之中。甚至这些创造这些风格的创造者本人都无法料到。 说AI没有创意,这实在是有些武断了。 就在几天前,AI圈还爆发了一场关于AI是否有智能的讨论。一些经验主义者就表示,从经验哲学的角度去讲,人的智能也不过是对既往经验和知识的重新组合,并将其应用在新的场景中。而AI,在它明显掌握了海量知识,且已经有了将这些知识进行组合的方式,为什么不能称之为智能? 在创意这件事上,事情也是一样。创意,往往就是既有元素和技法的组合。比如印象派就融入了日本绘画的画法,形成了其独特的笔触。野兽派则取经于非洲艺术元素,构建了自己的语汇。 那么创意,还会是人类独占的吗? 在文章的结尾,研究者承认这种效应量偏小可能有几个原因:首先,实验设计没有允许参与者看到并改进他们的AI作品,而在现实中,艺术创作往往是一个反复迭代的过程;其次,研究使用的创意测试主要考量语言创意,可能没有充分捕捉到视觉艺术创意的特点。 有很多当下正在进行AI艺术创作的作者肯定也会讲,一个作品需要有一致性,需要传达思想、需要有剧情的编排和逻辑。这些AI现在还做不到。 但在不久的以后呢? 就像现在,如果影响AI绘画创意度的核心是“语义多样性”,我们甚至能做个专门条件词义更远词句组合的小型模型,去生产“更具创意”的绘画。 创造能力的消失 如果说人的创意价值越来越低是我们当下需要担心的事,那在晦暗未明的未来中,我们是否还能抱有创造能力都不好说。 在今年9月,一篇来自多伦多大学的研究《Human Creativity in the Age of LLMs》,系统的检测了使用AI工具对人创意的影响。 研究团队召集了1100名参与者,设计了两个平行实验,分别测试两种不同类型的创造性思维能力。第一种被称为"发散性思维"——也就是产生多个不同想法的能力,比如想出一个回形针的各种创新用途;第二种是"聚合性思维"——找到一个最佳答案的能力,就像解决一个需要巧思的谜题。 参与者被分成三组。第一组完全靠自己思考;第二组可以看到AI直接给出的答案;第三组则直接让AI当老师,指导他们做创作。但在实验的最后阶段,所有人都需要独立完成任务,不能再借助AI的帮助。 结果令人相当沮丧。在使用AI期间,参与者的表现确实更好,但当不能再使用AI时,情况就发生了戏剧性的变化。那些从未使用过AI的参与者反而表现得更好。这就像是一个依赖计算器的学生,在不能使用计算器时,反而不如那些一直用笔算的同学。 而这其中,被AI指导过的被测试者会出现被他们称之为"同质化"的现象。简单来说,就是接受过AI指导的人往往会产生相似的想法,即使在他们不再使用AI之后也是如此。这可能是因为他们把注意力都放在理解和运用AI提供的框架上,反而忽略了培养自己的思维能力。 而仅仅借助AI工具提供结果的对照组,其原创性介于纯粹自我创作和接受AI指导之间。 在发散性思维测试中,参与者需要为普通物品想出创新用途。比如,一条裤子可以用来做旗帜、储物袋或是临时降落伞。研究发现,虽然AI能提供大量创意点子,但参与者似乎对这些建议持怀疑态度。有趣的是,即使AI提供的想法实际上非常有创意,但人们也倾向于产生自己的、可能不那么出色的想法。 而在聚合性思维测试中,参与者需要找出能够连接三个看似无关单词的第四个词。例如,对于"书架"、"日志"和"书虫",正确答案是"书"。在这类需要找到唯一正确答案的任务中,AI的帮助似乎更受欢迎。但同样的,一旦失去AI的协助,那些习惯了依赖AI的参与者表现反而更差。 这说明人类可能既无法本能的用好AI带来的创意,甚至还在剥夺自身的创意。 比如这项研究还揭示了一个更值得去关注的现象:在使用AI的过程中,参与者的自信心普遍下降。他们对自己的创造能力的评估变得更低了。这种自信心的下降可能会影响人们未来面对创造性任务的态度和表现。 而在上面的研究中我们发现,大胆的脑洞可能才是创意的核心。一个自信不高的人很难有这样的胆量再去做尝试。 被剥夺创作过程中的核心思维过程,被AI打压掉自己创造的信心。就算AI给了你创造的工具,一个空无的灵魂又有什么理由再拿起画笔? 如果这一趋势不会改变,我们很可能迎来的将是人类创意的消失。