申请试用

手机号
姓名
验证码
我们收到您的消息后,会立刻与您取得联系。

语音转文字ASR增强识别引擎

基于领域知识图谱模型,解决南北方不同人群发音不准确,形成强大的纠错能力,为机器人大脑NLP处理层输入更准确的文字。在特定的领域下能区分用户到底是说“带宽”还是“贷款”,也能理解用户发的音“灰机”其实是“飞机”。

技术概要

应用业内最领先语音识别算法,包括LSTM、BLSTM、Deep CNN、LFMMI、CTC 等算法;可以将语音中内容、说话、语种等信息识别出来,相当于给机器人装上了人工耳朵

技术特性

智能纠错

针对南北方差异发音不标诸如Chi、ci、shi、shi 不分的发音者提供纠错引擎。语音识别准确率由70%提升到90%

噪音环境识别

能够识别来自嘈杂环境的音频信息,不需要客户进行降噪处理

快速识别

对60秒之内的实时短音频流进行识别,可应用于运营活动等场景

录音识别

对录音文件进行识别,可用于字幕生成、录音资料转写等场景