微软今天宣布,其会话语音识别系统的误率达到了5.1%,是目前为止最低的。
微软今天宣布,其会话语音识别系统的误率达到了5.1%,是目前为止最低的。
这一数据超过了微软人工智能和研究团队去年5.9%的误差率,并将其准确性与专业的人类转录者相提并论,后者拥有类似于听几次文本的能力。
两项研究都记录了总机语料库的录音,这是自上世纪90年代初以来,研究人员用来测试语音识别系统的约2,400个电话交谈的集合。
这项新研究是由微软人工智能和研究团队的一组研究人员完成的,目标是达到与一组人类转录者一样的准确度,他们能够听他们几次转录的内容,了解他们的谈话内容,并与其他转录员一起工作。
总的来说,最新研究的研究人员通过改进微软语音识别系统的神经网络声学和语言模型,将错误率降低了约12%。
值得注意的是,他们还让自己的语音识别器使用整个对话,让它根据上下文调整文本,预测接下来可能出现的单词或短语,就像人类在与他人交谈时所做的那样。
微软的语音识别系统用于Cortana、演示文稿翻译和微软认知服务等服务。