如今快节奏的生活方式,刺激了人们对输入法语音输入的需求,上班赶地铁、手在忙做别的事、急着发文件等场景,手打键盘可能满足不了人们的需要,并且拖慢效率,而语音输入却可以解放双手,高效解决人们的沟通需求。
据赛诺市场研究《2020年中国第三方手机输入法春季报》显示,语音输入对环境要求高、方言及口音识别率低、需要联网语音转化是影响语音输入用户最不满意的三大因素。用户对输入法的要求也是输入法企业创新的源动力,基于此讯飞输入法的9.1版本,搭载全新A.I.语音引擎,致力于解决用户的三大痛点问题。
“语音输入对环境要求高”是用户首要不满意的因素,占比87%。毕竟,生活中总会有一些非常安静或者噪声环绕的场所,例如安静的图书馆、会议室或者电影院中,不方便大声说话;而在人声嘈杂的街上或者地铁等场景中,语音输入时可能因为噪音的干扰而出现“识别不准”、“反应迟钝”等问题。从实际调查也可以看出来,这与用户的生活息息相关,确实为用户最为关心也是最为头疼的问题。
讯飞输入法关注到这一点,提升语音候选词、噪声环境、轻声说话及专有名词的识别效果,向用户所想,解决用户需求。其中一个场景是用户可以不用切换语音识别模式,在安静场合用低分贝音量说话,不打扰别人的同时也不会影响自己的语音识别率。
其实,环境噪音的干扰也一直是困扰语音识别率的难题,只有在不改变录音设备终端、对软件层面进行优化才能有所改善。科大讯飞很早就通过A.I.赋能,将噪音抗变换性工作加入语音引擎之内。在语音识别过程时,讯飞输入法会将实时语音录音先通过环境嗅探区分出噪音环境的分类(车内外噪音、会场音响噪音、地铁噪音等),自动采用不同的算法去除带噪语音中的噪音部分,再通过混合训练技术弥补去噪后语音所产生的同真实安静语音的语谱差异,从而达到提高信噪比的效果,最终提升噪音环境下的识别能力。
除语音输入对环境要求高这个首要因素之外,71%的用户不满意口音及方言识别率低和67%的用户不满意联网语音转换,这两个因素在讯飞输入法产品中也得到了有效解决。
以人为本的讯飞输入法已经从简单的打字工具升级到一个融汇多种A.I.能力的输入集合体,通过技术实力满足用户需求。业界认为,这样的好产品才能走得更快更远。