AI热(rè)潮不(bú)减(jiǎn)。过去一周,“双马对话”拉开(kāi)世界(jiè)人工智(zhì)能大会的讨论热潮,同一时间, 百度在北京举办(bàn)“百度(dù)云智峰(fēng)会”喊出“AI工业化”的口号。京东云发(fā)布智能城(chéng)市(shì)战略。仅(jǐn)一个周末,由陌陌推出的(de)AI换脸APP,一夜“ZAO”热……
放眼(yǎn)国内,AI技术正展现大变(biàn)革潜力,AI赛道也日益(yì)拥挤。站在今天回看,2017年或许是中国人工智能发展(zhǎn)的一个重(chóng)要节点。从那一年(nián)开(kāi)始,人工智能风起云涌。一夜之间,仿佛(fó)所有(yǒu)的公司都(dōu)变成(chéng)了人工智能公司,资本、人才向人工智能领域快速涌入。“人工智能”成(chéng)为科技界(jiè)、学界(jiè)、企业界最(zuì)热门、最受追捧的词汇之一。而彼(bǐ)时,科技巨(jù)头(tóu)Google、IBM等对人工(gōng)智能(néng)的研(yán)究已(yǐ)逾十(shí)年,近(jìn)几年(nián)部(bù)分研(yán)究成(chéng)果(guǒ)已经进入(rù)商业应(yīng)用。
从这些维度(dù)来看,人工智能可谓已经迎来一(yī)个非常好的时代,但是热闹背后一些问题也浮现(xiàn)出来。在释(shì)放巨大应用价值(zhí)和商业(yè)价值的同时,人工(gōng)智(zhì)能的推广(guǎng)使用也产生(shēng)了(le)一些“副(fù)作用”。个人隐私信息被非法采集、利用大数据实施精准诈(zhà)骗(piàn)等,已开始露出苗头;“人工智能可能拉大数字鸿沟(gōu)、取代工作岗位”的猜测(cè),也引发了一些担忧。
人(rén)工智(zhì)能需要“交通法规”
回应社会上(shàng)对人工智能的种种担忧(yōu),又为这一(yī)技术(shù)保留了(le)足够(gòu)的创新空间(jiān)。前不久,国家新一代人工智(zhì)能治(zhì)理专业委员会发布了《新一代人工智能治理(lǐ)原则——发展负责任的人工智能》,明确了人工智能治理(lǐ)的框(kuàng)架和行动指南。
这意味着,正在快车道上飞奔(bēn)的中国(guó)人工智能多(duō)了一部“交(jiāo)通(tōng)法规”。 作为一项影响深远的颠覆性技术,人工智能(néng)技术可能带(dài)来的“副作(zuò)用”不可小觑(qù)。特别是在人(rén)工智能(néng)进(jìn)入实用的新阶段,鼓励创新和(hé)规范应用必须双管(guǎn)齐下(xià)。我国(guó)已是人工智能发展大国,尽早立下“包容共享(xiǎng)、敏捷治(zhì)理”等规矩,将(jiāng)为人(rén)工(gōng)智能的健康发展保驾护航。
消除偏见,打造负责任(rèn)的人(rén)工智能
在探讨人工(gōng)智能可能带来(lái)的偏见和歧(qí)视问题时,微软(ruǎn)的研(yán)究团队,正在从称为“单(dān)词(cí)嵌入”的(de)自然语言处(chù)理工具做起,试图解决(jué)文本搜索中的性别偏(piān)见的(de)问(wèn)题(tí)。
所谓单词嵌入,是(shì)一(yī)种用来将单词转换为向量数字的算(suàn)法,它能够以来自新闻数据或者网页(yè)数(shù)据(jù)的海量文本(běn)数(shù)据为依据,为每个单词赋予一个对(duì)应的(de)向量数字。通过在(zài)向量坐标系(xì)中(zhōng),比对常见(jiàn)词汇与“他(tā)”、“她”这两个(gè)性别代词之间(jiān)的关联度,研究人员发现了(le)一些(xiē)明显的特征,例(lì)如“sassy(刁蛮)”、“knitting(编织)”这样的(de)词(cí)更靠近女性,而“hero(英(yīng)雄)”、“genius(天才)”更靠(kào)近男性。
算法之所以会为这些词汇(huì)赋予性别特(tè)征,原因在于训(xùn)练算法用的基准数(shù)据集——通常(cháng)是(shì)来自新闻和网页(yè)的(de)数据——本(běn)身就存在着由语(yǔ)言习惯造(zào)成的“性别偏见”,算法也自然“继承”了人类对(duì)这些词汇理解的性别差异。其结果就是(shì),当微(wēi)软用(yòng)试验算法,根据梅林达·盖茨的 linkedIn 信息推测其职(zhí)业时,得到了“教师(shī)”的判断,但只要将人称代词换成“他”,盖茨夫人的职业就会变(biàn)为“律师”。为了解决这个问题,微软的研(yán)究(jiū)员提出了(le)一个简单易行的方案:在单词嵌入中,删(shān)除(chú)区分“他”和“她”的判断维度(dù),从基准数据集中(zhōng)消除偏(piān)见(jiàn)。
AI芯片喧嚣背后(hòu)市场痛点犹存
AI芯片已成为中外科技企业竞争的(de)焦点(diǎn)之一,以至于(yú)清华大学(xué)微(wēi)电(diàn)子所所长魏少军用“无产业不(bú)AI,无应用不AI,无芯片不(bú)AI”这样的话语描述(shù)当下的人工(gōng)智能(néng)热潮(cháo)。
“我们离人工智能(néng)还有多远?目(mù)前(qián)很多企业所做的只是增强智能而不是真(zhēn)正的人工(gōng)智能,离真正(zhèng)的人工智能还(hái)差得很远”。魏少军表示,人工智能网络能够(gòu)崛(jué)起(qǐ)取决于三个因素,算法、数据和算力。当(dāng)前,AI芯(xīn)片面临两个现实问题:其一,算法(fǎ)仍在不断演(yǎn)进,新算法层出不穷,每隔几个月算(suàn)法就发生新的(de)变化;其二,一(yī)种算法对应一种应用,没有统一的算法,而让芯片处理不同的(de)算法十分困(kùn)难(nán)。
在魏少军(jun1)看来(lái),AI芯片(piàn)应该具(jù)备的要素包(bāo)括(kuò)可编程(chéng)性、架构(gòu)的动态可变(biàn)性、高效的架构变换能(néng)力、高计(jì)算效(xiào)率、高能耗效率(lǜ)、低成本等。按照这些要求,目(mù)前业界流行的一些做(zuò)法均不(bú)是理想的(de)架构。过去几年,AI芯片领域一个重(chóng)要变化就是架构的变化。人工智能芯片不在(zài)于(yú)追(zhuī)求算力,而(ér)在于架构(gòu)创(chuàng)新。业界也需要(yào)找到一种针(zhēn)对人(rén)工智能计算(suàn)的全(quán)新计(jì)算(suàn)引擎。
云(yún)从科技副(fù)总裁(cái)张立认为,传(chuán)统芯片企业通(tōng)常更关注(zhù)是如何把芯片做成通用(yòng)化,以支持各种不同应用(yòng)场(chǎng)景。但这样的通用化(huà),在(zài)AI场景落地时会遇到问题,比(bǐ)如公司对AI芯片考虑较(jiào)多的是单位功耗,而芯片企业对功耗要求(qiú)可能不是首要(yào)优(yōu)先级。公司在将AI场景落地的过程中,发现通用芯片完全(quán)满(mǎn)足不了需求。这给(gěi)从事AI解决方(fāng)案和核心算法的企业(yè)带来了难题——公司的(de)算法是统一的,但需要在(zài)不同的场景(jǐng)适配(pèi)不同的芯(xīn)片和模组。
“目前,AI芯片发展还(hái)处在婴儿期”。张立表示,现在企业使用的很多AI芯(xīn)片(piàn)因为工艺要求(qiú)较高,很难在大(dà)陆流片(piàn),都是在台(tái)积电进行流片。同时,也正因这工艺复杂(zá)度较高,导(dǎo)致芯(xīn)片(piàn)价格较高,使得下游很多(duō)使用其模组的产品无法量产(chǎn)。
AI+教育的变革与反思
日前(qián),某人脸识别系统在课堂上的应用在(zài)笔者朋(péng)友圈引起热议。图中显(xiǎn)示,两名在教室中的女(nǚ)生身边,显示出了相应(yīng)的课堂行为数据,比如趴(pā)桌子、玩(wán)手机、睡觉(jiào)、听讲、阅读、举手等(děng)等。业内某名(míng)嘴犀利点评:非(fēi)常反感这种应用,且毫(háo)无意义(yì)!教育,跟养猪的区(qū)别还是蛮大的!
联合国教科文组织在2019年3月份发布过《教(jiāo)育中的(de)人工智能:可持续发展的挑战和机遇》报告,比较系(xì)统综合了各国人工智能和教(jiāo)育相结合的做法。报(bào)告的愿景是促进人工智能教(jiāo)育可持续发展,但(dàn)更重(chóng)要(yào)的目(mù)标是(shì)怎么样体现教育个(gè)性化、包容化(huà)、公平性,驱动教育管理(lǐ)步入全新的轨(guǐ)道,以及帮助学生为“就业革命(mìng)”做好准(zhǔn)备。
上(shàng)海(hǎi)市人工智能学(xué)会理事长、同(tóng)济大学(xué)企(qǐ)业数字化技术(shù)教育部工程中心主任(rèn)、同济大学教授张浩(hào)就曾指出,数据驱动的智能教育主(zhǔ)要考虑几个因素:一方面是个性化(huà)“教”,作为教师,应该体现(xiàn)教学中的个性化。过去老师(shī)都是猜,现在可以通过数据辅助。另一方(fāng)面是个(gè)性(xìng)化的“学”,以前的学生总是听(tīng),现(xiàn)在(zài)可以通过个性(xìng)化数据辅(fǔ)助,可以学得(dé)更有序,从此建立个性化学习模(mó)式。目(mù)前,大数据主(zhǔ)要还是(shì)推(tuī)动个性化教育”。
未来学校的功能是转变的,教育的内容是转变的,教育的环(huán)境也(yě)是转变的。教育是永恒的话题,AI结合教育刚刚开始(shǐ)。《中国(guó)教(jiāo)育现代(dài)化2035》中提到“智能”为先(xiān)驱,以人才培(péi)养为核心,有四(sì)大方面的考量:提升校(xiào)园智能化、新(xīn)型教(jiāo)学模式、教育服务(wù)新(xīn)业(yè)态、推进教学治理方式变(biàn)革。人(rén)脸识别在课堂上(shàng)的应用,相(xiàng)信只是AI落地教育(yù)领域的最初(chū)尝试,经过(guò)不断的(de)试错、调整,最(zuì)终真正地辅助教育的目的。
人(rén)工智能要做(zuò)高产值关键要以人为本
人工智能要做高产值不是什么难事,关键是要以人为本(běn)。”上海人工智能安全专委会主任、中(zhōng)科院院士、计算机软件专家何积丰表示(shì):“上海人(rén)工智能的发展取得(dé)了很大的进步,政府投入了大量的(de)资源,给予了高度(dù)重视,但是在全(quán)面性方面(miàn)仍然有待完善。
何积丰院士所说(shuō)的全面(miàn)性,是指要关注科(kē)研(yán)创新体制改革,以及关注新技(jì)术带来的新挑战(zhàn),包括(kuò)人工智能的(de)安全性、人工智能的人(rén)才培养、核(hé)心基(jī)础研究的投入以(yǐ)及相应的配套设(shè)施(shī)的建设。
以安全为例,何积丰(fēng)院士援引数据称(chēng),上海人工智能三年(nián)的(de)产值规模要达到(dào)500亿人(rén)民币,五(wǔ)年产值规模(mó)要达到1000亿人民币。“要做高产值很容易,理论上一部分信息(xī)通信技术(ICT)行业的产值也(yě)可以算(suàn)到(dào)人工(gōng)智能(néng)领域。但要(yào)真正打造人(rén)工智能(néng)高地,让人工智能服务于我们的社会经济,还有很多工作要做。”何积丰院士表示。
他强调(diào),人工智能要解决的是基础的算法问(wèn)题,因此数学基(jī)础研究很重要。他(tā)认为,由(yóu)于中国基(jī)础研究长时间地被边缘化(huà),要鼓动基础(chǔ)研究(jiū)人员参(cān)与其中需要更(gèng)大的努力。此外,何积丰院(yuàn)士还强调应让(ràng)人(rén)工智能(néng)技术与5G技术充分结合(hé),尽快(kuài)建设完善各(gè)类网(wǎng)联(lián)基础设施,让(ràng)城市完(wán)成智慧协同,实现精(jīng)细化的治理。
无数据,不AI
2018年,全球(qiú)人工智能(néng)市场突破2700亿元,其中(zhōng)中国超过360亿元,相比(bǐ)2015年的(de)203亿元复合增(zēng)长率为21%。飞速上(shàng)扬(yáng)的(de)曲(qǔ)线背后是科(kē)技发(fā)展(zhǎn)的日新月异,于互联(lián)网下半场(chǎng),AI已经(jīng)成为很多公司、企(qǐ)业面向未来的武器和底气。
与之(zhī)对应的是另外一组数字,据We Are Social公司(sī)统计,全球独立移动设备用户渗(shèn)透率(lǜ)超过了(le)总人口的65%,活(huó)跃互联网用户突破了(le)40亿人,接入互联网的(de)活跃移动设备超过了50亿台。根据IDC预测,2020年,全球将总共拥(yōng)有35ZB的数(shù)据(jù)量。
这是一组每(měi)天都处于千(qiān)万亿次增长的数据曲线。
人工智(zhì)能,算法是发动机,数据是燃(rán)料。对于大(dà)部分(fèn)公(gōng)司的AI业务来说,获取海量而(ér)优质的标注数据是进(jìn)行人工智能的先(xiān)决(jué)条件。算法模型(xíng)是计(jì)算机基于大规模的训练数据集(jí),归纳出的识别逻(luó)辑,以实现精准的(de)物(wù)体和场景(jǐng)识别。可以说,实现机器精准识别的(de)重要一步,就是获取(qǔ)海量(liàng)而优质的标注数据。
但在现阶段(duàn)工业界的AI应用研发,标数(shù)据是一定跳不过去的,可(kě)能10年之(zhī)内都(dōu)要依赖(lài)于标数(shù)据。”一位业内人士表示。
就当下而言,从(cóng)最基本(běn)的构(gòu)建模式来看(kàn),数据是人工智能(néng)的原料(liào);但如果将数据(jù)与人工智能技术的整体发展相比,如今数据的(de)采集和标(biāo)注方(fāng)式(shì)却是后者发展的(de)“木桶短板”。
这门生意正(zhèng)在进(jìn)步。从粗放型(xíng)到如今的(de)精细(xì)化运作(zuò),数(shù)据的生(shēng)意模式正(zhèng)在不断升级。身处这(zhè)个赛道的玩家们,则是给它做了(le)最佳注(zhù)脚。可以预测,“无数据,不AI”将(jiāng)会成为常态。
结语
经历了这个(gè)夏天(tiān),AI热度有增无减。但(dàn)是(shì)相比最初(chū)由产业界、投资界(jiè)所推动的热潮,现在学(xué)界和基础研究领域也在逐渐(jiàn)产生一些革命性(xìng)变革,人才缺口问题(tí)也越来越受到重视,有望从根源上得到解决。
用一麻袋的钱买书(shū),书看(kàn)完了,卖了(le)书却发(fā)现钱(qián)不够买麻袋。生活(huó)中很多事情往往会落入这个套路。
无意于用(yòng)这个逻辑来暗讽(fěng)AI创业的(de)某(mǒu)些(xiē)乱象。只是希望热潮退却时,不只(zhī)是烧掉(diào)了投资人(rén)的钱,还有许多落(luò)在(zài)实处的(de)有意义的应用。
退一万步说,读书也好,投(tóu)资(zī)也好(hǎo),最重(chóng)要(yào)的(de)意义不在于是否能够回收麻袋成本,而(ér)是在这个(gè)过(guò)程中明白,自己是否真的需要(yào)麻袋(dài),以及在(zài)这个过程(chéng)中(zhōng),那(nà)些无法用金钱来衡(héng)量的收获。