人工智能让(ràng)历史(shǐ)“重生”
近日,一段被人(rén)工智能修(xiū)复的100年(nián)前北京(jīng)街景影像片段在网络上“刷屏”。有了AI的(de)帮助,那些原本卡(kǎ)顿、清晰度差(chà)的黑白画面被还原了色(sè)彩(cǎi),1920年的北(běi)京城(chéng)变得流畅(chàng)而(ér)生动(dòng),颇有生活气息。有人感叹:时间(jiān)两(liǎng)头的我们,被这段影片(piàn)连了起来,好像“穿越”了(le)一样。百年前的影像中我们看到了什么?AI修复,如何让历(lì)史“重生”?
AI再(zài)现历史风(fēng)貌(mào)
100年前(qián)的(de)北京城(chéng)和中国人(rén),究竟是什么模样?
从大全景来(lái)看,百年前(qián)的北京街景,充满了年代感(gǎn)。马路(lù)上人来(lái)人往,人流、马车(chē)、人力车交错而行,集市、食肆、仪仗、礼(lǐ)仪(yí)、买卖等,就这样呈现在我们眼前。不少网(wǎng)友在微博边看边讨论今昔(xī)的(de)不同:“骆驼出现在大街上,是(shì)当(dāng)时的运输工(gōng)具;现在(zài)要(yào)去沙漠里寻找骆驼”“100年(nián)前(qián)出来逛街的都是(shì)男人(rén),现在女人比较多”……
这段(duàn)影像(xiàng)由加拿大摄影师拍摄而成,而(ér)给它重新上色(sè)修(xiū)复(fù)的是(shì)中国一(yī)位年轻的(de)独立游戏开发者大谷。原本色彩单调(diào)、轮廓模糊的人影,变得面目清晰(xī)、动作流(liú)畅,再加上后期逼(bī)真的音效,生动再现了当时的历史风(fēng)貌(mào)。
记者通过网络联系到(dào)了人在美国纽约的大谷,他说,自己一直在B站(zhàn)做绘画、作曲等科(kē)普(pǔ)视频,这是第一(yī)次利(lì)用人(rén)工智能修复历史影像。“我从小在北京长大(dà),对老北(běi)京的风貌情有独(dú)钟。”大谷说,由于当年(nián)拍摄设备的(de)限制,我们(men)看到的黑(hēi)白影像损失(shī)了重要的色彩信息,AI可通过算法和(hé)大量的训练打造成“火眼(yǎn)金睛”,先对照片(piàn)进行图像分(fèn)割,区分出标志性物体,如树木、天空(kōng)、人脸(liǎn)、服装等,对黑白影像场景进行彩色化处理。
“传统的(de)影像修复,是由(yóu)艺术家们手绘,一帧帧影像(xiàng)重新上色(sè),比(bǐ)较耗时费力(lì),一段影片往(wǎng)往需(xū)要几十到数百(bǎi)人同时奋战几十天。”他说,而人工(gōng)智(zhì)能做的是同样的步骤,不(bú)过运(yùn)算效率更快。他截取了10分钟视频,一个人用了7天时间,尝鲜使用AI技术相继完成上色(sè)、修复帧率、扩大分辨率,最终呈现出流(liú)畅的彩色画面。
大(dà)谷(gǔ)同时表达了自己的(de)遗憾。“这段(duàn)影像的色彩,是AI自(zì)我学(xué)习的结果,不一(yī)定是历(lì)史的原色。”他(tā)说,这次AI修复所(suǒ)采用的模(mó)型是(shì)从国外老电(diàn)影中(zhōng)“学(xué)习”的,影片整体色彩比较淡(dàn),如果更好地了解历史,能做得更准确(què)。他表(biǎo)示人工智能不(bú)足的地(dì)方,也要通过训练不(bú)断加强。他准(zhǔn)备让(ràng)AI程序加强“学习”,多“看(kàn)”一(yī)些中国年代影片,在未来(lái)进行修复着色时将更有中国味道(dào)。
年代感的看点不少
这段“重生(shēng)”的(de)历史影像,虽然(rán)只有短短(duǎn)几分钟,却(què)留下了许多有年代感的看点。
一段画面中出现了多(duō)人(rén)互相行(háng)礼的片段,细细(xì)看来,包含(hán)了三种礼仪。比(bǐ)如“打千礼”,这是满(mǎn)族(zú)男子下对上通行的一种礼节(jiē),流(liú)行于清代(dài)。礼(lǐ)仪姿势为屈左膝、垂右手(shǒu)、上体(tǐ)稍(shāo)向前俯(fǔ),在(zài)清宫戏中(zhōng)常能看(kàn)到这类礼仪。第二个礼仪是“作揖”,是(shì)汉人男子之(zhī)间的见面礼——两手(shǒu)抱掌前(qián)推,身子略(luè)弯(wān),表示(shì)向人敬礼。孔子像中的孔子,也是作(zuò)揖的姿态。第三个是“万福礼”,这是(shì)汉人女子(zǐ)的见(jiàn)面礼。右手(shǒu)放(fàng)在左手上两手握拳,位于腹(fù)部正中央(yāng),右(yòu)脚向后撤一小步,两膝微曲,颔(hàn)首低眉,微微伏身而起。“万福”二字,出自《诗经》,最早是(shì)表(biǎo)示(shì)祝福的(de)吉祥(xiáng)语,意(yì)为福气满满。比如(rú)1987年版电(diàn)视(shì)剧《红楼梦》中,林黛玉初(chū)见贾宝玉时(shí),贾宝玉行的是作揖礼,林黛玉行的就是万福礼。
这段影像(xiàng)还闪过了一(yī)个(gè)镜头,是见证历史的白色牌坊“克林德(dé)碑”。当年(nián),京城老百姓(xìng)对这个名字很“硌硬”,大家(jiā)都叫它“石头牌坊”。
1900年6月2日,德国公(gōng)使(shǐ)克林德在此(cǐ)处被人开(kāi)枪打死,以此事件为导火索(suǒ)最终引发了(le)八(bā)国联军侵华和签订(dìng)《辛丑(chǒu)条(tiáo)约》。根(gēn)据德国要求,1901年6月25日,清政府在克林德殒命处(chù)开工建造一座纪念牌坊并祭祀谢罪(zuì)。直到1918年(nián)11月第一次世界大战结束(shù),德国成(chéng)为战败(bài)国,这座象征着(zhe)屈辱的(de)牌坊(fāng)立刻成为众矢之的,于1919年被拆除。拆除后,主(zhǔ)体的散件被运至中央公园(今中山公园)重新组装(zhuāng),题头被换成了“公理(lǐ)战胜”,在(zài)1952年召开的亚洲及太平洋区域和(hé)平会议上,为表彰中国人民(mín)保卫世(shì)界和平所做的(de)贡献,决(jué)定将“公理战胜”牌改为(wéi)“保卫和平”碑。
影视(shì)作品“修旧如旧”
“历(lì)史影像(xiàng)一上色,好像拉近了和(hé)我们(men)之间(jiān)的距离(lí),看(kàn)完十分亲切。”大谷表示(shì),许多网友和他交流中(zhōng)都谈到这一(yī)体会。其实,去年(nián)新中(zhōng)国(guó)成立70周年时,《开国大典》等经过AI和人工修复的(de)献礼片就惊艳了公众,许多观(guān)众(zhòng)看后热泪(lèi)盈眶(kuàng)。
修复版(bǎn)的(de)电影《开国大典(diǎn)》让人们目睹三次战役胜利到开国大典的历史过(guò)程。通过人(rén)工智能深度(dù)学习的方式,老片中(zhōng)常见(jiàn)的(de)噪点、色偏、模糊(hú)、抖动、划痕(hén)等“小伤小(xiǎo)痛”得以(yǐ)被批量化修(xiū)复。但是,一些老片画面由于(yú)损失(shī)严重或存在(zài)大片污渍,人(rén)工智能无法通过时间、空间信息“脑补”,在这种情况下,必须(xū)依靠有经验的修(xiū)复专家来完(wán)成。因此,专业修复师(shī)对影片《开国大典》进行了(le)修补,总共修复了1082个镜(jìng)头。虽然修(xiū)复历时仅40天,但(dàn)这是600人每天(tiān)工(gōng)作20小时之后的结果(guǒ)。可见,人工智能实际(jì)上不能完全(quán)代替手工(gōng)劳动,人机共同协作才能产(chǎn)生(shēng)最好的(de)结果。
为高(gāo)科技装上“指南针”
近年来,计(jì)算机视(shì)觉在人(rén)工智能和深度学(xué)习的大背景下变得流行(háng)起(qǐ)来,越来越(yuè)多的(de)应用场景被挖掘,图像处理技(jì)术成(chéng)为最(zuì)热门的应用(yòng)之一。而(ér)深受公众喜爱的是图(tú)像(xiàng)修复(fù)功(gōng)能,一(yī)键修复老(lǎo)照片等App应用,在(zài)社(shè)交网络上(shàng)掀起传播潮流。
大谷告(gào)诉记者(zhě),AI图像修复有(yǒu)许多神奇的玩(wán)法。比如人脸生(shēng)成(chéng),用新婚夫(fū)妇(fù)的照片通过AI程(chéng)序可以制作一(yī)张未来孩子的(de)照片;再比如,一些人没(méi)有童(tóng)年照片,这样的遗憾(hàn)也可以通(tōng)过人工(gōng)智能来(lái)弥补,AI通过对其(qí)现有(yǒu)照片的学习(xí)和判(pàn)断,生成童年照。“你也可以(yǐ)通过人(rén)工智能看看自己变老的样子。”他说。
许多(duō)科学家开始关注(zhù)人工(gōng)智能的注意力机制。注意力机制来源于人(rén)类的视觉注意(yì)力,即人类在(zài)进化过程(chéng)中形成的一(yī)种处理视觉信息的机制。对于人工智能来说,它是(shì)机器学习中的一种数据处(chù)理方法,主要功能是(shì)减少对无用线索的关注(zhù)。
目前,AI注(zhù)意力和真(zhēn)正(zhèng)的人类注意(yì)力差距仍然(rán)很大。在科学家们看(kàn)来,在未(wèi)经充分(fèn)训(xùn)练的情况下,让AI关注(zhù)人(rén)是容(róng)易的,但(dàn)关注某个特定的人(rén)是困难的(de)。目前来说,AI注(zhù)意力机制更接近直觉,科(kē)学家也在研究增加模型的知识储备,提升(shēng)模型的推(tuī)理能力,这样(yàng)AI才能在复杂的图像等语境下(xià)运用注意力完成更为复杂的操作。
人工(gōng)智(zhì)能修复,为公众呈现(xiàn)了一次遇见古人的时(shí)空穿梭(suō)之旅。然而,技(jì)术不(bú)仅仅是应用(yòng)工具(jù)。对(duì)于(yú)创造(zào)和应用技术的人(rén)类而言,在法律(lǜ)规范和(hé)道德约束(shù)下让技术“为我所用”,才能(néng)真正(zhèng)为技术装上(shàng)“指(zhǐ)南针”,实现人类和科(kē)技(jì)的(de)促(cù)进发展。