推广 热搜: page  音视频  使用  个数  选择  搜索引擎  父亲  百度  企业  可以 

AITO问界小艺智慧助手告别唤醒词

   日期:2024-12-31     作者:czdytfhm4    caijiyuan   评论:0    移动:http://ww.kub2b.com/mobile/news/17333.html
核心提示:#AITO问界迎来重磅升级#随着人工智能技术的快速发展,智能语音助手成为我们日常生活中的得力助手。无论是手机、智能音箱还是车载

#AITO问界迎来重磅升级#

随着人工智能技术的快速发展,智能语音助手成为我们日常生活中的得力助手。无论是手机、智能音箱还是车载系统,智能语音助手正在以其智能化、便捷性和人性化的特点,深刻改变着我们的生活方式。

一个常见的科幻大片场景:主角只要动动嘴,所有设备就可以立即按照指令行动,这无疑也是语音交互技术发展的最终形态。近日,AITO问界推送新版OTA升级,其中,最引人注目的功能“小艺免唤醒”上线,可以说是让用户离梦想又近了一步。

用户不需要再说唤醒词“小艺小艺”,便可直接下达指令,小艺“听得到、听得懂、秒执行”。这甚至比前段时间苹果的“嘿Siri”唤醒词更改为“Siri”还要先进,华为又一次实现了遥遥领先。

小艺免唤醒,让车主告别“召唤”时代

小艺免唤醒功能的研发初衷是为了解决车主在用车时一直叫“名字”的痛点。

试想一下,假如每次对话前都需要说一个昵称对方才能接收到:

我亲爱的妈妈,把你做的那些零食递给我;

我亲爱的妈妈,我也想要一点沙拉;

我亲爱的妈妈,把它放在这里;

我亲爱的妈妈,不,在桌子上;

我亲爱的妈妈……

是不是感觉很荒诞?

正如小艺智慧助手的产品经理所说:“日常生活中,人和人进行交流的时候,不会每说一句话都叫一次对方的名字。这会让车主觉得很尴尬,且体验感差。而去掉‘唤醒词’之后,人机交流体验会自然得多。”

在华为技术深度赋能下,小艺智慧助手依托华为自研的端云协同架构,在最新的Harmony 3中实现了小艺免唤醒功能。

在“1对1”的情境下,该功能提供了免唤醒指令、Oneshot唤醒和唤醒词(唤醒后)+指令的多种形式支持。而面对“1对多”场景时,小艺免唤醒功能也提供了多种形式的指令,包括指令+唤醒词、指令+唤醒词+指令,以及简化唤醒词(前后中)+指令的形式。语音交互的便捷性得到了显著提升,用户的使用体验也得到了再次升级。

创新华为,专攻难题

毫无疑问,小艺免唤醒能为用户带来革新性的交互体验,那为什么此前市面上的语音助手都普遍需要唤醒词呢?华为又是怎样再次实现“遥遥领先”的呢?

此前,市面上的语音助手,之所以需要唤醒词,是因为车主在与语音助手进行对话前,语音助手都处于休眠状态,需要先被唤醒才能进入工作状态,进而再启动一系列模块进行语音识别、意图判断、对话管理等,而这些模块占用的CPU/内存很高,长时间处于启动状态必然会影响车机反应效率,所以需要唤醒词来触发。

而且语音助手想要实现免唤醒功能,则需要各系统模块时刻“待命”,这对车机系统资源占有诉求非常严苛,不仅如此,语音助手还需要具备精确判断指令的能力,避免被误唤醒,这也是实现免唤醒功能的核心技术壁垒。可以说,实现免唤醒功能看似只是简单得删掉一个词,但背后的技术突破过程却备尝艰辛。

唯其艰难,更显勇毅。华为始终专注于技术研发与创新,努力为用户提供最为极致的出行体验。就小艺的免唤醒功能而言,华为研发团队同样选择了“死磕”。

(1) 死磕资源占用率,攻克时延问题

为了将小艺免唤醒的资源占用率降下来,华为研发团队可谓绞尽脑汁,在经过多日不眠不休的研讨后,终于被他们找到了打开“新世界”的钥匙——将小艺免唤醒功能放到NPU上推理,不仅不占用CPU资源,同时,还能充分借助华为软硬件优势,让平均CPU资源占用率接近可忽略的程度。

在找到正确的路径后,团队迅速加快了研发速度,耗费了长达两个月的时间,克服了各种困难,最终实现了资源占用率的显著下降,这一成果令整个团队欣喜不已。

然而,当所有人都沉浸在这种进步的喜悦中时,车机的实测结果却揭示了一个全新的难题。由于NPU在加载模型过程中施加了大量初始化小动作,导致启动时的时间延长,从而使得语音识别在工作时出现了“慢半拍”的情况。

华为人从不会被困难击败,只会更加鼓足干劲。面对新的难题,华为研发团队把启动时每个环节的耗时一点一点掰开揉碎进行分析,制定了一系列优化措施,打通了内存通路加速、预加载技术、离线编译等关键技术方案,又花费了两个月的时间,将起初高达1秒的加载延时,控制在200毫秒级以下,实现了整整4倍的性能提升,让小艺智慧助手“听得到”的反应速率比黄牛抢票还要快,让用户体验更自然、流畅。

(2) 死磕泛化,误唤醒率远低于标准

听到指令后,不能太迟钝,但也不能太灵敏,不能一有风吹草动就被干扰、做出动作,需要听清主人说的很多句话里到底哪句话才是指令。而免唤醒必将带着误唤醒,这也是业界不敢将免唤醒功能上车的重要原因。因为目前行业主要应用Key关键词检索技术,由于部分关键词检索技术较弱,容易造成识别率低等问题。

此路不通,那便再另辟蹊径,走出一条新路。华为大胆创新,让小艺免唤醒采用“端侧ASR+端侧NUL”的语义理解方案。一方面,支持一定程度的泛化,另一方面,又会对口语化进行一定限制,避免误闯,完美解决了AI语音识别率与误唤醒间的“杠杆”平衡难题。

不仅如此,为了将误唤醒率控制在更低,后期华为研发团队还会对小艺进行上百小时“播放语料”测试,并且,每次更新车机版本,都需要重新测试。也正是这份执着,让小艺免唤醒在维持超高唤醒率的同时,实现误唤醒率远低于行业。

做智慧助手,真正造益用户

随着新能源汽车快速迭代的发展,座舱的科技感和现代感更加凸显,而智慧助手与用车体验之间的紧密联系也变得更加深刻。凭借华为在ICT领域所积累的领先技术和前瞻性理解,小艺免唤醒功能使得小艺智慧助手与用户之间的互动更加贴近于“人-人”自然交流,从而真正改变了人车交互体验,成为超越传统车机的“灵魂”。

本文地址:http://ww.kub2b.com/news/17333.html     企库往 http://ww.kub2b.com/ ,  查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

 
 
更多>同类最新文章
0相关评论

文章列表
相关文章
最新动态
推荐图文
最新文章
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号