Toggle navigation
首页
核心技术
产品中心
硅语智能交互平台
协呼智能交互平台
硅语数字人平台
硅语智能客服平台
硅基智能语音合成
硅基智能语音识别
硅基智能声音克隆
VPPT
克隆人
解决方案
智慧金融
智慧城市
智慧保险
智慧教育
智慧通信
智慧医疗
生态合作
渠道合作
政府生态合作
文档中心
硅基智能语音识别开发文档
硅基智能语音合成开发文档
硅基智能声音克隆开发文档
关于硅基
公司介绍
新闻中心
硅基大事件
免费试用
Toggle navigation
首页
核心技术
产品中心
+
-
硅语智能交互平台
协呼智能交互平台
硅语数字人平台
硅语智能客服平台
硅基智能语音合成
硅基智能语音识别
硅基智能声音克隆
VPPT
克隆人
解决方案
+
-
智慧金融
智慧城市
智慧保险
智慧教育
智慧通信
智慧医疗
生态合作
+
-
渠道合作
政府生态合作
文档中心
+
-
硅基智能语音识别开发文档
硅基智能语音合成开发文档
硅基智能声音克隆开发文档
关于硅基
+
-
公司介绍
新闻中心
硅基大事件
硅基智能语音识别
硅基智能语音识别(ASR, Automatic Speech Recognition)针对日益丰富多样的市场需求,基于深度神经网络(DNN)技术,提供强大、稳定、易用的核心语音动力引擎为企业提供极具性价比的语音识别服务。功能包括录音文件识别、实时语音识别、一句话识别,适用于智能问答、智能质检、会议录音转写、语音输入等多个应用场景,并支持离线部署方式
立即咨询
开发文档
硅基智能语音识别
硅基智能语音识别(ASR, Automatic Speech Recognition)针对日益丰富多样的市场需求,基于深度神经网络(DNN)技术,提供强大、稳定、易用的核心语音动力引擎为企业提供极具性价比的语音识别服务。功能包括录音文件识别、实时语音识别、一句话识别,适用于智能问答、智能质检、会议录音转写、语音输入等多个应用场景,并支持离线部署方式
立即咨询
开发文档
功能介绍
录音文件识别
支持长时长录音文件识别,离线版本不限制时长,取决于终端设备的内存大小。适用于长语音、实时性要求不高的场景,如智能质检等。
语言支持
暂只支持中文普通话
音频格式
支持wav、pcm等音频格式
音频编码
支持8k、16k的单声道音频流,支持16bit的数据采样精度
音频数据长度
音频流中每个数据包的音频分片为20-200ms(建议为20的倍数)
实时语音识别
对实时音频流进行识别,达到“说完即出文字”的效果。适用于实时性要求较高的场景,如语音输入、电话机器人等。
语言支持
暂只支持中文普通话
音频格式
支持wav、pcm等音频格式
音频编码
支持8k、16k的单声道音频流,支持16bit的数据采样精度
音频数据长度
音频流中每个数据包的音频分片为20-200ms(建议为20的倍数)
一句话识别
对一句话短音频文件进行识别,离线版本支持超过1分钟时长的识别。
语言支持
暂只支持中文普通话
音频格式
支持wav、pcm等音频格式
音频编码
支持8k、16k的单声道音频流,支持16bit的数据采样精度
音频数据长度
音频流中每个数据包的音频分片为20-200ms(建议为20的倍数)
录音文件识别
支持长时长录音文件识别,离线版本不限制时长,取决于终端设备的内存大小。适用于长语音、实时性要求不高的场景,如智能质检等。
语言支持
暂只支持中文普通话
音频格式
支持wav、pcm等音频格式
音频编码
支持8k、16k的单声道音频流,支持16bit的数据采样精度
音频数据长度
音频流中每个数据包的音频分片为20-200ms(建议为20的倍数)
实时语音识别
对实时音频流进行识别,达到“说完即出文字”的效果。适用于实时性要求较高的场景,如语音输入、电话机器人等。
语言支持
暂只支持中文普通话
音频格式
支持wav、pcm等音频格式
音频编码
支持8k、16k的单声道音频流,支持16bit的数据采样精度
音频数据长度
音频流中每个数据包的音频分片为20-200ms(建议为20的倍数)
一句话识别
对一句话短音频文件进行识别,离线版本支持超过1分钟时长的识别。
语言支持
暂只支持中文普通话
音频格式
支持wav、pcm等音频格式
音频编码
支持8k、16k的单声道音频流,支持16bit的数据采样精度
音频数据长度
音频流中每个数据包的音频分片为20-200ms(建议为20的倍数)
产品特色
价格合理
自主研发,离线部署基于终端设备或服务器路数计费,对接灵活,价格优惠,商务可协商。
识别准确
识别准确率高,采用国际领先的语音语言一体化建模方法,融合硅基自研的深度自然语言处理技术,基于大量自建的行业录音数据进行训练,大幅提高识别准确率。
中文标点符号智能标注
基于大规模数据集训练,根据语音的内容理解和停顿,智能在文字段中添加合理的标点符号(包括,。!?),使文本的可读性更强
多领域智能语义解析
支持数十个行业细分领域的语义理解,如:金融,保险,政务等,在不同场景下更准确地理解用户意图。
离线部署
本地私有化部署,低延迟,保证企业数据安全,私密性强。
价格合理
自主研发,离线部署基于终端设备或服务器路数计费,对接灵活,价格优惠,商务可协商。
识别准确
识别准确率高,采用国际领先的语音语言一体化建模方法,融合硅基自研的深度自然语言处理技术,基于大量自建的行业录音数据进行训练,大幅提高识别准确率。
中文标点符号智能标注
基于大规模数据集训练,根据语音的内容理解和停顿,智能在文字段中添加合理的标点符号(包括,。!?),使文本的可读性更强
多领域智能语义解析
支持数十个行业细分领域的语义理解,如:金融,保险,政务等,在不同场景下更准确地理解用户意图。
离线部署
本地私有化部署,低延迟,保证企业数据安全,私密性强。
应用场景
智能客服
实时语音识别,实现对业务问题的智能语音理解、智能回答,覆盖业务咨询、业务办理、营销获客等多个业务场景,实际为客服中心降本增效。
智能质检
通过对呼叫中心的录音文件识别得到文本,再通过质检规则对文本进行分析,识别不符合规范的服务通话记录。完成人工难以完成的超大规模电话录音质检工作,提升呼叫中心人员的服务质量和服务效率。
会议转写
通过对会议录音文件识别生成文本,智能标点断句,高效辅助业务人员撰写会议纪要,节省大量录音回听时间,提高业务人员的工作效率。
相关产品推荐
硅基智能语音合成-TTS
硅基智能语音合成采用先进的端到端神经网络技术,脱离自回归网络结构,声学模型和声码器采用并行化合成技术,可以将文本快速转换成流畅自然的语音。
硅基声音克隆
硅基声音克隆技术,提供10-20分钟目标说话者语音,可以复刻目标说话者的音色及其说话方式,大大缩小对语料的依赖,采用手机、麦克风多种录音手段,方便用户采集录音
售前专家免费服务
根据您填写的需求,将有售前专家为您提供免费服务!
联系专家
专注全球性AI技术研发和商业交互落地
中国 南京市雨花台区花神大道66号万博科技园C栋4楼
中国 上海市浦东新区花园石桥路66号东亚银行金融大厦1901室
友情链接:
郑州求职
条码打印机生产厂家
液压试验机
LED显示屏
衬胶管道
连锁店管理系统
天津发电机出租
水压爆破试验机
螺杆式空压机
智能会议平板
Python培训
智能公交站牌
3d手板
洛阳在职研究生培训
智慧教室
电话机器人
电销机器人
苏ICP备17053679号
Copyright @ 2017-2021 南京硅基智能科技有限公司. All Rights Reserved.
专注全球性AI技术研发和商业交互落地
中国 南京市雨花台区花神大道66号万博科技园C栋4楼
中国 上海市浦东新区花园石桥路66号东亚银行金融大厦1901室
友情链接:
郑州求职
条码打印机生产厂家
液压试验机
LED显示屏
衬胶管道
连锁店管理系统
天津发电机出租
水压爆破试验机
螺杆式空压机
智能会议平板
Python培训
智能公交站牌
3d手板
洛阳在职研究生培训
智慧教室
电话机器人
电销机器人
苏ICP备17053679号
Copyright @ 2017-2021 南京硅基智能科技有限公司. All Rights Reserved.
提示
正在提交
电话咨询
免费试用
招商加盟
线路合作
咨询电话
18013354753
<收起
扫码咨询
线路合作
提交后,我们将在6个工作小时内与您联系
免费试用
免费试用
电话咨询
一对一咨询