×

自知之明:人工智能的艺术挑战与机遇

hqy hqy 发表于2025-03-01 06:54:15 浏览19 评论0百度已收录

抢沙发发表评论

我显然已经离不开人工智能了。

因为我的日常生活受惠于人工智能技术极多:浏览网页时的自动翻译,节省了过去查字典的很多时间。备课的时候查找国外艺术家资料,印证作品题目和创作年份,用图片搜索很有用,这背后是图像识别技术和超强的智能数据库。多年前拍摄的老照片印画册时候需要变成大图片,人工智能修图和插值帮了大忙。现在甚至简单的海报设计和PPT都可以让AI先做个大概再来改一改。

我经常一边开车边写作。我用手机中的共享写作软件(如果可以做广告,我用的是石墨笔记),它的语音识别功能十分强大。我把共享写作软件分享给研究生们,我开车的时候遇到一个红灯,就拿起手机说上个500字。个别识别错误软件里蹲着的学生们瞬间就给改正了。其实软件的学习能力很强,我的福建普通话它也识别得越来越精准。这样我从学校开车到工作室十来个红绿灯,半小时之内一篇三、四千字的文章就可以交稿了。

不开车的时候,我不用手机,我用科大讯飞的语音识别鼠标,它更夸张,我讲闽南话它都能帮我写一封英文的邮件。央美的英语老师带着博士生们来我的工作室现场上英语课,我拿着这个鼠标和她开玩笑说,其实用不着学英语了,老师你快要失业了,弄得这位英语老师很后悔不应该带学生来我这里。

以这种方式写作,过去两年我每年写作的数量超过了两百万字。今年我要出版8本书,没有人工智能的帮助是不可能的。

带学生写毕业论文,我也要求他们都用共享软件来写作,同时分享给我和班上所有同学。这样某个同学已经写了6万字了,其他的同学会产生同侪压力,很快就有人写出了8万字。谁写的进度怎么样,哪一天有进度,我都能即时看到,随时留言,有时候整段帮着删掉。这样整个论文写作文件就成了一个米歇尔·福柯的全景监狱,我在那里挑动同学卷同学。同学们卷起来,学习就好办了,这都是拜托人工智能的帮助。

学生们说,用语音识别来写作,得能出口成章啊!我们逻辑性不够啊。我说:其实我们讲话的时候比用笔写作的时候逻辑性更强,道理都是靠说通的。因为……所以,既然……那么,当且仅当……话顶话一句句说下来,逻辑最为流畅,跳跃不得。写在屏幕上或者纸上的文字其实更加发散,更容易发生逻辑跳跃,所以德里达要用书写中心主义来对抗语音中心主义,语音就是逻各斯中心主义。语音识别软件帮我们实现出口成章,多用语音识别写作,就会越来越有出口成章的自信。当然,语音识别写出来的文字比较口水,没事,把它拿到GPT或百度文心一言里改写成文言文。比如此刻这段话改成这样:

“屏与纸,其文逸而逻跃,故德里达倡书以抗音,音者,逻各斯之核也。语识软件助人以言成文,频用之,渐生辞赋之自信”。

没有写作任务的时候,我就边开车边听书。经常看电脑眼睛容易疲劳,就闭上眼睛听书。一边画画的时候一边也在听书,乘飞机高铁,还是听书。这又是用到人工智能。

说到开车我十分渴望自动驾驶快点全面实现。因为我在车上不光想听书我还想看视频想翻开速写本画画。用司机没有隐私,还是自动驾驶好。而且我觉得每天开一小时的车来回学校,这车每天只用一个小时在路上跑,其他23个小时都在占用停车场太浪费了。它显然应该不停地跑送我到望京马上又把一个想去中关村的人送到中关村。这样北京就不需要这么多车了也不堵车了,也不需要这么多停车场,路也用不着这么宽了,整个城市都美好很多。上了楼,我用指纹去开办公室的门,又是人工智能。

学生们很快就学会用魔法打败魔法,他们开始用人工智能来写作。也用AI来做效果图,最近还开始做视频。我们看得出来,那些图一看就A里A气的。有的老师不让用,我鼓励学生要妙用人工智能,要设法把人工智能用出花来,用到觉得它还不够好用为止。用到AI黔驴技穷了,我们才能相信维纳说的《人有人的用处》。事实上,我认为今天的学院教育必须要全面渗透人工智能,不会用AI,等于不会用工具书,等于不会用电脑和手机。

就艺术学院而言,不但要建立人工智能艺术系,而是每个系,国画系油画系雕塑系美术史,统统都应该开人工智能课。不会用人工智能的书法家是义和拳。对于科技艺术专业的同学,AI已经开始帮着同学们编程了,这帮学校省下来聘两个技师的工资。

人工智能生成绘画

Dell-E、MidJourney 、Stablediffusion跳出来用大模型生成图片的时候,大家都开始大谈人工智能对绘画的危险。其实几年前机器学习就在生成图片,只不过那时候大部分用的是对抗性生成网络(GAN)。2018年我把我和微软(亚洲)互联网工程院合作培训他们的人工智能少女诗人“微软小冰”画画,用的基本就是GAN。那年刚好我策划中央美院的毕业展,我把小冰的画放进研究生毕业展里,为她起了个名字叫“夏语冰”,意思是“夏虫不可以语冰”,指导教师写的就是我。我们用小冰的诗句去让她画画,再把画面拿给她写诗,反复循环。展厅里面有她的视频和绘画作品,标题叫《历史的焦虑》——反正是没人认得出来,还有不知来由的观众给她献了两束花。过了一星期微软研究院公布说:他们的微软小冰从中央美院研究生毕业了。于是大家纷纷跑来看,纷纷说这个画得比真人还是差了一些。

其实就生成图像的速度和能力来说,人工智能是超越人类的。问题是这只是生成图像,并不是画画。现在的AI不管能力多强,还只是生成屏幕上的图像。离一个机器人眼睛看着竹子,机械臂灵巧理解颜料的厚薄、浓淡控制,在不同材质的纸上或者画布上绘画,留下或慢或快,或刚劲或暴怒或舒缓的笔触,还有很长的路要走,画家们暂时还是安全的。

人工智能生成图像目前主要是抢了摄影家的饭碗,我让MidJourney生成一张东北虎和大熊猫在水下搏斗的画面,秒出,而且毛发极其精细逼真,水里的气泡和波浪光影都处理得极好。我想中国找不到任何一位摄影家有能力把一头东北虎和一只大熊猫同时丢进水里——他会先被判刑,然后自己还得搞一套潜水设备在水下潜水拍摄。这不可能,所以你永远不要指望会看到这样一张照片。

摄影今天面临人工智能的这种挑战也算是报应,仅仅在190年前摄影也曾把绘画似乎逼得无路可走。世界上的第一张照片是1822年尼埃普斯拍出来的,达盖尔拿到摄影术的专利则是1839年。摄影刚出来的时候,把人画得栩栩如生,把风景画得让人身临其境这件事情,摄影比绘画做得更好还更快。尤其是在不久之后彩色摄影就出来了。很多画家就像今天大家面对人工智能那样感到了巨大的焦虑。有的画家开始吸收摄影的营养依靠照片去画画,比如花芭蕾舞女的印象派画家德加。有的画家改行去当摄影家,当然绘画的教养使他们拍出了画意摄影。也有的画家开始琢磨绘画应该怎么去画?怎么样画得不像摄影?怎么样画出摄影所做不到的画面?这些画家就变成了梵高和毕加索。可以说整个现代主义基本上是摄影给逼出来的。绘画在写实主义这件事情输给了摄影,于是就下岗了,下岗没关系,琢磨一些别的技能下岗再就业就是了。如果没有摄影的逼迫,我们今天还在走库尔贝和安格尔的道路。摄影只能消灭或收编二流人物,一流人物会在摄影的逼迫下成为梵高和毕加索。

今天人工智能在逼迫摄影,一流的摄影家也一定会开始思考要怎么把照片拍得不像人工智能所能做到的那样——画家们也一样。所以我欢迎人工智能来接管一些低端的摄影、设计和绘画工作,它会节省我们大量的时间精力,让我们去专注于绘画真正应该做的事情。能被摄影抢走的绘画工作,本来就不是绘画应该陶醉的工作,好的绘画应该是八大山人那种画,画那种画的画家怎么会害怕摄影术呢?

所以别怕,顶级人物是干不掉的。优秀的画家会迅速地把人工智能当作辅助设计和创作工具,让它处理一些它善于处理的东西,让人做人该做的事情。

郑板桥所说:眼里看到竹子,心里有竹子到手中的竹子,这三种竹子互相贯通下来,中间是无数的感觉、判断,不只是信息处理还有手感的拿捏。今天的人工智能绘画离这一步还差得非常远,它还只是在生成很像画面的图像,还不是眼心手相应相生画出来的。未来能不能做到呢?我希望它能够做到。但首先要解决手感问题。所有画种中最难被取代的肯定是水墨画家。简单的平面设计,字体设计,可能最容易被人工智能所取代。最后被取代的艺术,一定是书法家在行笔的过程中不断地将错就错临时拿主意的那种艺术。人工智能离画出八大山人那种画还差得十万八千里,这也是为什么我要去研究人工智能书法的原因,得挑最难的事情做。

我让“夏语冰”同学画水墨山水画,画得还真不错。亭台楼阁的细节画得不够好,但是可以调参数,让她把倪赞的比重调高一点,把范宽的比重压低一点,很快就能交上来作业,表现比一般的国画系学生要好。起码是交作业即时并且数量大,我利用这个数量大的优势就让她去做动画。这些山水动画在迪拜世博会、亚洲数字艺术展、北京服贸会都展出过。做水墨动画一起是很难的。过去上海美术电影场做水墨动画《牧笛》,得训练很多李可染先生的门徒去画很多中间帧,那是集体主义时代才可能产生的劳动密集型的艺术创作。现在AI来做水墨动画真的是多快好省,但是她提在画面上的书法就一塌糊涂:一些远远看有点像是书法的墨迹,凑近一看连字都不是。所以书法的问题才是难题。

人工智能转化传统艺术实验

和微软做“夏语冰”之前我就和京东人工智能研究院的何晓冬院长合作一起做了人工智能思维导图。前端是模仿我的水墨地图的风格做的,这是一个实时语音捕捉、语意理解、自动翻译、实时生成发散的联想词的程序,我花了很多精力去教会这个程序禅宗风格的逻辑跳跃和意象迁移。当时做的目标是想,今后在演讲的时候背后投影上随机地生成所讲的话中的关键词相关的思维导图,并且能够随机地抓取互联网上的相关图片和视频,那就可以取代PPT了。这个作品相关的论文出来之后,我开始有机会参加人工智能领域的顶会,如I EEE、IJCAI,ACM,会议听得多了,有时也觉得自己好像有点听懂了。

意识到人工智能绘画最终在手感和笔触上的难题,我又和京东人工智能研究院开始研发“情感驱动的人工智能书法”项目,这个目的是为了解决个性化中文字库的难题。我们现在的字库每个字的写法都是一样的,比如说:“张将军张弓搭箭射杀敌人,张府张灯结彩庆祝胜利”这句话,即使你用书法字体的字库比如你选了颜真卿的颜体字库,这句话中四个“张”字的写法还是完全一样的,这不是书法!我们知道,让书法家来写的话,“张弓搭箭”的“张”字应该写得警觉劲健,“张灯结彩”的“张”应该写出狂喜的感觉,“张府”的“张”字应该写得庄重崇敬。所以叫做“情感驱动的书法程序”。这样,书法能响应语句中蕴含的情感,调整每个字的风格。

最近我们又和亚马逊云科技做了一个可以和观众的身体姿态实时互动的人工智能皮影动画程序。主要是探索这种程式化极高的风格,在今天的技术条件下,是否有可能实现小样本学习。

大家可以注意到,我所做的这些跟人工智能有关的艺术工作,很大程度上都是中国传统艺术资源和人工智能技术的叠加。

我想这是因为书法、山水、皮影这些中国传统艺术是表面上看起来和人工智能技术最没有关系的,但也恰恰是最需要借用技术来激活它的能量。传统艺术资源的创造性转化和创新性发展,一定要走科技赋能的道路。绝不是简单地把《千里江山图》这样的传统经典印到杯子上印到鼠标垫上变成文创产品,那只是在消费传统文化资源。幅度更大的创新总是需要跨语境调取资源,比如《千里江山图》变成舞蹈就受到赞美。其实更好的例子是《梁祝》变成小提琴曲。传统艺术资源通过技术赋能创新地转化为今天的日常生活中最好用的工具,它们才会活过来。人们不会为了爱传统而爱传统,人们是因为传统好用才喜欢传统的,是因为传统在他们的生活中能帮得上忙。人工智能的重大意义可能就在帮助我们把传统带到明天。

他将会帮助我们用一个机器人执笔向孩子们演示王羲之是如何运笔的。它能讲解,能运笔示范,能给作业打分。目前人形机器人太贵,教教书法而已用不着它会奔跑,其实一个好的机械臂就能把成本降下来,让它便宜和小巧到能进入学校和家庭。能教书法,当然也就能教弹琴了。

我的虚拟替身

教写字画画弹琴的机械臂应该是企业去做,有企业看到商机愿意尝试的欢迎找我合作(此处插播广告)。但其实我最希望人工智能帮我做的是帮我上课。我疯狂地热爱上课,教博士教硕士教本科也愿意教小朋友也愿意搞社会教育。但是时间毕竟是有限的,有时候上课的时间和我写作的时间搞创作的时间毕竟还是冲突的。何况在美术学院虽然大家都说是“课比天大”,但也经常被迫停课去开会。我真的极其需要一个高级的AI替身替我教学。

我在和微软(亚洲)研究院一起研究“夏语冰”的时候,同时谈到过另一个计划就是做我的数字孪生。当时微软亚洲互联网工程院内部把这个计划开玩笑叫做“永生计划”,后来小冰公司从微软独立出来,这个计划至今都还在悬置。我还在中央美院报了一个自主科研课题“人工智能时代的艺术教育”,目标就是创造我的数字替身,帮我在微信群里面和学生们说话,帮我上网课,帮我盯那个共享软件写论文的全景监狱。我想的是,现在虚拟人上课不奇怪,但那些不写实没有原型的卡通人虽然可爱,但无法进行灵魂拷问,而教艺术,有些场景真的就是两个生命灵魂对话,一群生命灵魂围观。一个人工智能的艺术教师将是所有的虚拟教师里面的最高端——去攻克最难的事情才是有价值的。其他的虚拟人教师或者有真人原型的数字孪生教师只能是照本宣科读书,读输送给它的教材文本。就算是逼真的语音和视频生成也缺少互动性。互动性更强一点的人工智能可以解决简单的问答互动——

但是艺术课堂上的互动是很残酷的,正常人类都对付不了。你来几句套话,“嗯哒感觉还不错”“再深入一点”“注意整体关系”学生是不会买账的。最难的尤其是上创作课的时候艺术教师,因为学生会拿这个方案问你,说邱老师,我想这么做你觉得这个方案好不好?我得在课堂上马上给出判断好不好,为什么好为什么不好,还得帮着发展方案,经常是要演示当场推理的过程。我会在课堂上马上帮着学生分析这个方案,修改其中的细节,找出一些线索来推进。有时候运气好,当场就会得到惊艳的结果,往往掌声雷动,围观的同学都有共识。有一种高于我们每个人知识背景和审美趣味差别的道理显然在那里,大家都知道这么做是对的,那就是艺术真正伟大的魅力,祖师爷显灵的时候。这种场景其实很惊险的,要是当场我也卡住了,祖师爷也不是每次都显灵,在学生面前是很没面子的。大家看,这就是真正的艺术教师之难!

好了,我想要的人工智能数字孪生,应该像我一样经受这类严酷的场景,才能在我不在场的时候面对需要真正的艺术上的帮助的学生。不只是板着面孔讲艺术概论讲完下课。他要点评学生作业。这位人工智能教师要回答的,不仅是简单的事实问题,还要帮着把不那么好的艺术创意推进到变成好的艺术创意——这意味着他自己先得有做出好作品的能力。他要帮人改方案,自己先得等作出好方案。自己能做出好方案,意味着先得能判定好坏,知道利害深浅。也就是背后先得有一个人工智能艺术家才可能支撑起一个人工智能艺术教师的工作。

人工智能艺术家

为此,我构想了一个《作为艺术家和设计师辅助工具的Proposal Generator方案生成器》。并且已经想明白其工作逻辑:

通常决定艺术家风格的是他常用词汇库+结构的习惯+评估标准。而决定艺术家实际做法的则是:他常用的词汇库+结构的习惯+评估标准+受众需求、预算、场地等外部指标。每个艺术家的词汇库是有限的,艺术家常用的手法也可以标签化。整个艺术界的词汇库应该等同于万物,所以,关键是数据库。

操作中,艺术家提出初始方案,比如拥有的材料,或一闪而过的想法,或启发性的作品,并输入外部任务的指标,以及希望得到的意境的关键词,输入受众需求,核算成本等等。AI从多种要素考虑,展开系谱开发,提出这个初始方案的多种变体。并根据这个艺术家的过往作品风格,挑选出10个艺术家最可能接受的选项。艺术家从中挑选一个,这个挑选行动本身用来训练AI,使之越来越理解什么是这位作者需要的,什么是好的,这样这个AI将会越来越个性化。从而有可能进化为个人助手。

艺术挑选出来的这个方案(人工对齐)再次交给AI,再次产生出10个变体。重复以上过程,直到出现令艺术家本人叹为观止的“神来之笔”。这个程序的目的是把艺术家绞尽脑汁想点子的工作交给机器,艺术家真正需要做的是用心感受AI所提出的建议,从观众的可能反应,从他对人性的体察出发,选择正确有效的行动。

这个艺术家首先要根除自我表现论、浪漫主义、观念传达论等等心理主义的艺术理论的影响,去除心理障碍,开放地拥抱AI所开发出的可能性。这是总体艺术论必然的延展,总体艺术论强调的是根据可能世界的逻辑,来把现实世界理解为只是可能世界得到呈现的一种。还有更多的可能性弥散在黑暗中。我现在想要用AI去捕捉这些更多的可能世界,照亮他们。让他们有机会成为现实。

自知之明

更有意思的则是,如果这个数字艺术家要成为我的数字孪生,我们称为“AI邱志杰”,我为他提供的所有的资料,包括我的日记在内的所有资料(事实上我已经准备好了,包括我和学生的问答,以便它熟悉我的口吻和观点),他就会成为我吗?

这个准确度本身可能是有问题的。不过我就真的完全了解我自己吗?我自己拥有的所有的材料也依然是有所遗漏的。一个心理分析医生深入地挖掘我的潜意识之后,是有可能比我自己更了解我自己的。难道我在我的日记中就一定不会自我欺骗吗?所以这位“AI邱志杰”的不准确状态可能也并不是问题。他可能也不需要完全百分百的准确,只要他足以掌握我主要的想问题的模式。他与其他人的区别大于他与所谓的那个真正的我的区别,也就是可以操作的。

或者说此刻我们应该相信图灵测试。也就是说,如果在与他人交谈的时候别人无法分辨,以为是在和我交谈,那么我们就可以认为他和我没有区别。

其实,更有趣的是在于,当他成熟之后,我在每天和他交谈的过程中,我自己将会发生什么变化?很可能会发生的是,这个人工智能越来越像我。而我,因为他太像我了,所以我会被逼着做出一些平时我不会做的事情,或者我会故意地和自己自相矛盾。也就是说这位“AI邱志杰”已经把我自己给完成了,我的地盘被佔了我只能被迫离开去其他地方。我可能去做一些平时我做不出的事,说一些我平时说不出的话。这可能变成一场自我的双手互搏。

如果他能变成真正的我,那么真正的我就会出现在我的对面,成为对象。这会形成人格成长的第二个镜像阶段。靠着这个动态鲜活的镜像,我们或许能够抵达自知之明。因为“辩证法”将第一次真正实现。

我这是在催逼自己进化吗?

这又有什么可怕的呢,难道AI比文字更可怕?语言声音是长在人的身体上,完全是由具体的个人所控制的。而文字并不是,文字比人的记忆力更好。正如人工智能比人的计算能力更强。文字独立任何一个具体的个体,白纸黑字,胜于雄辩。但文字并没有害死人,而是使人变得更丰富了。

事实上,讲话的人开始向写字的人学习怎么思考,甚至于怎么讲话。人类甚至开始像写字那样地讲话。

机器自然有他自己的逻辑,并不需要完全对人脑的运行过程进行模仿,因此他跟人类是互相平行的存在,他不是人类的思维方式的复制品,“AI邱志杰”并不是我的复制品。但是向人类的思维方式学习使人工智能变得强大,反过来也会一样,主动向人工智能学习的人类将会变得比其他人类更强大。因此人类必须向人工智能学习,因为人工智能在某些事情上注定是会做得比较好的,在这些事情上的人必须学习人工智能,这样。人类或许还有机会。

目前的AI还在婴儿期。Open AI的成功让今天的人工智能在大参数、大模型、大算力(大能耗)的道路上越走越远,国内正在上演千模大战。但AI历史上本来就有派系和思路的斗争,风水轮流转,未来的通用人工智能的出现,走什么技术路线尚未可知,我们要多线程发展。不要总是一条道上追赶。也有可能是多种不同技术路线的人工智能各自割据一块场景,就像汽车分化出跑车、越野车,新能源车又分化出不同的电池技术路线。人类学习基本上是直觉学习和小样本学习,不是暴力学习,人类心有灵犀,浅尝辄止,偷师学艺,亦能自通。北大朱松纯老师的通用人工智能研究院引入价值函数的思路,就很有启发性。当然,另一方面,能够向机器学习的工作方式进行学习的人类,也就是能够暴力学习的人类,必定是人类中的学霸。

毛主席说:人猿相揖别,只几个石头磨过,小儿时节。被人工智能赋能的人将是“新智人”。

就人工智能艺术而言,生成任务一定程度上已经变成学生们交作业的好工具,也是我们对付低端设计任务的好工具。更高难度的生成任务,还要等得技术突破,也是艺术在这个场景中有机会回馈技术。因此,今天优秀艺术家和顶级科学家的联手分外重要。此外值得一提的是,集群智能和多智能体艺术的研究和实践,应该提到桌面上来了。

顺便需要提及,人工智能(AI)当然是当前技术进步的一个重要领域,它影响着我们生活的许多方面。但人工智能不是当代科技的全部。新技术还包括但不限于量子计算、生物技术、可再生能源技术、纳米技术、物联网(IoT)新材料,合成生物学、地球科学、海洋科学等等大量科学领域在酝酿革命。当然人工智能也渗透在这些领域,我们的艺术家们要尽快熟悉人工智能,更要去关注更广阔的科学世界和技术世界。艺术道路只会因为这些关注而宽广,“功夫在诗外”。

(本文部分由AI生成。)

邱志杰

中央美术学院副院长,中国人工智能学会艺术与人工智能专委会副主任。