由声智科技研发的(de)“AI数字(zì)人垃圾分类(lèi)管家”融(róng)合了人脸(liǎn)识(shí)别、智能语音交互、行为识别等技术,使垃圾分类管理更加方便快速。
一台(tái)可以书写的智能(néng)交互机械臂,用毛笔写下“一起向未来”;一部多足行走机器人(rén)和一部跳舞机器人(rén),共同跳起了一段(duàn)舞蹈,随(suí)后,跳舞机器人还(hái)单独进行(háng)了一段武术(shù)表演(yǎn),抱拳开臂,马步(bù)弓步,一招一式憨态可(kě)掬。这是记者在北京声智科技(jì)有限(xiàn)公(gōng)司(以下称“声(shēng)智科(kē)技”)展(zhǎn)厅里看到的景象。
声智(zhì)科技成立于2016年(nián),专注于声(shēng)学前沿技术和人(rén)工智能领域(yù),主(zhǔ)要面(miàn)向数(shù)智健康(kāng)、数智城市等场景提供产品(pǐn)和(hé)解(jiě)决方案。凭(píng)借持续创新研(yán)发,声智科技获得了(le)吴文俊人工智能科学技术奖、北京市科(kē)技进步二等奖等多个奖项。
突破技术难点
“声智科技是从研发远场语音(yīn)交互技术起步的,你刚才看到的(de)那几个智能机器人搭载了声智科技研发的(de)智能语音交互技(jì)术。”声智(zhì)科技创始(shǐ)人(rén)陈孝良说,随着物联网技术的普及,语(yǔ)音成(chéng)为人(rén)机交互的新(xīn)入口,支持远场语音交互(hù)的产品市场潜(qián)力很大(dà)。
“远场语音(yīn)识别技术面临诸多研发难(nán)点,比如环境噪声、人声、房(fáng)间混(hún)响的干扰等。若采用常规(guī)语音处理方法,会导致信号失真和资源消(xiāo)耗大,使得语音识别技术准确率(lǜ)低,应用困难。”陈(chén)孝良说。
凭借(jiè)深厚(hòu)技术积(jī)累和持(chí)续(xù)研发,声智科技先(xiān)后攻克(kè)了多项远(yuǎn)场语音交(jiāo)互关(guān)键技术(shù),包括回声抵消技术、噪声消除技术、声源定(dìng)位技(jì)术、语音识别技术等。如(rú)今,这些技术已应用于一些消费级电(diàn)子产(chǎn)品中,声智科技也成为国内不少(shǎo)知名(míng)企业的(de)合(hé)作伙伴。
“我(wǒ)们意识到,伴随(suí)着人工智能的(de)快速发展(zhǎn),人机交互、协同过程(chéng)中的多数问题(tí),都不能靠单一技(jì)术解决(jué),需要将语(yǔ)音、图像识别、大(dà)数据等技术结合起来。只有推进多模态、多技能的(de)融合(hé),才能实(shí)现更多场景的应用。”声智科技(jì)副总裁李(lǐ)良(liáng)斌说。
他介绍,声(shēng)智科技的做(zuò)法是(shì),用“多模态(tài)”确保(bǎo)机(jī)器具有“声、光、电、热、力、磁”多种(zhǒng)感知技(jì)术;用“远场”解(jiě)决机器(qì)在(zài)远距离场(chǎng)域中对多模态信号的分析(xī);用“多技能”赋(fù)予智能(néng)系统多(duō)种能力,通(tōng)过多技(jì)能相互协同(tóng),完成复杂任务。
基于这种技术理念,声智科技研发推(tuī)出核心技(jì)术产品(pǐn)——壹元人工(gōng)智能开(kāi)发框架(jià)。基于这个框架,声智科技融合(hé)了(le)远场声光、多(duō)模(mó)态(tài)识别等(děng)多项技术,围绕(rào)智慧社区、智(zhì)慧交(jiāo)通(tōng)、智慧办公、智慧(huì)医(yī)院等应用场景,提供AI产品及解(jiě)决方案。
截至目前,声(shēng)智科技已经参与了(le)50余(yú)项国(guó)家行业标(biāo)准的制(zhì)定,拥有国(guó)内专利2000余项(xiàng)。在2020年(nián)前,声智科技总(zǒng)融资金额超(chāo)过3亿元。陈孝(xiào)良说,这些融资全(quán)部投入(rù)到(dào)核心技(jì)术的持续研发上(shàng)。
助(zhù)力智(zhì)慧防疫
新冠肺炎疫情暴发以来,声智科(kē)技自主研发(fā)的技术产品,用于多(duō)地的防疫服务中(zhōng)。
记者刚走进中关村前沿技术创新中心的一楼大(dà)厅,就听到清脆的声音:“您(nín)现在的(de)体温是(shì)36.5摄(shè)氏度,没有发热症状(zhuàng)”。声音来自一台测温机器人,在机器人显示屏上(shàng),除了实时(shí)显示(shì)被检测者的红外热成像信息和温度值,还能查(chá)看(kàn)全国疫(yì)情数据(jù),测温精度(dù)在正负0.2摄氏度。
声智科技首席知识(shí)官常乐(lè)介绍(shào),这个测温机器人可在几(jǐ)秒(miǎo)钟内完成1米至6米范围内多个目标的高精度测(cè)温,支持实时AI语音合(hé)成播报,自动上传预警信息。目前,该机器人已在北(běi)京(jīng)、广州(zhōu)、青岛、成都(dōu)等地落地使用(yòng)。
“小(xiǎo)易小易,上楼”“小易小易,去10楼(lóu)”,在北京海(hǎi)淀医院的电梯里(lǐ),只需(xū)要一句简单的指令,就(jiù)能实现乘梯上(shàng)下楼,全程免按键(jiàn),实现零接触。
“声智科技(jì)研发的智慧语(yǔ)音电梯,融合语音与图像等(děng)交互(hù)技术,不依赖手(shǒu)机、IC卡等设备,无论(lùn)使用者是在电梯外,还(hái)是在电(diàn)梯轿厢内,都可以通过可视化人机交互方式搭乘电梯。”常(cháng)乐介绍,这方便(biàn)了老人、儿童(tóng)等(děng)用户的日常生(shēng)活,在疫情防控期间还(hái)有效降低了(le)接触传播(bō)感(gǎn)染风险。
目前,声智科技已推出第二(èr)代AI智能电梯(tī)系统,增加(jiā)手势(shì)识别功能,残障人士也可以实现免接触控制电梯。2021年,为解决电动(dòng)自行车入户充电的监管难题(tí),减(jiǎn)少电(diàn)池充(chōng)电(diàn)爆炸起(qǐ)火等隐患,企业又(yòu)迭代推出了第三代AI智能电梯。
“未来(lái),我们希望AI技术能满足复(fù)杂场(chǎng)景的灵活、大范(fàn)围应用。”李良斌(bīn)表示,声(shēng)智科(kē)技将继续加强(qiáng)核心技术研发,让更多(duō)AI产品落(luò)地,使万物互(hù)联更智能。