语音转写_语音识别技术_录音文件识别-讯飞开放平台

产品优势

准确率高,高效稳定
行业先进的语音识别技术,通用语音识别率98%(注:安徽电子产品监督检验所检测,报告编号151209010027)
自定义个性热词、质检关键词
无需算法开发,直接上传热词列表即可完成热词配置;质检关键词支持配置默认词库和上传自定义词库,满足您的多样化需求
格式转化,标点预测
对数字、日期、时间等返回格式化文本,根据对话语境,智能断句并匹配标点
方言语种,高效识别
支持除中英文外的多方言语种识别,适应复杂的语言环境

产品价格

新用户礼包
个人开发者和企业开发者免费使用
时长
最高50小时
有效期
一年
方言/语种
中英文
套餐一
按时长套餐计费
时长
20小时
有效期
一年
方言/语种
中英文
套餐二
按时长套餐计费
时长
200小时
有效期
一年
方言/语种
中英文
套餐三
按时长套餐计费,赠送3个方言/语种
时长
1000小时
有效期
一年
方言/语种
额外赠送3个
套餐四
按时长套餐计费, 赠送5个方言/语种
时长
3000小时
有效期
一年
方言/语种
额外赠送5个
套餐五
按时长套餐计费, 赠送5个方言/语种
时长
1万小时
有效期
一年
方言/语种
额外赠送5个
商务定制
有特殊环境或功能需求的客户
私有化部署
个性化功能
专属并发
定制方言/语种
大量采购
商务优惠

温馨提示:

1、 默认支持中文、英文、中英混合识别;购买套餐三可领取3个方言/语种,购买套餐四、五可领取5个方言/语种,购买套餐六可领取8个方言/语种; 购买套餐后,可在控制台领取所需方言/语种;购买多个套餐的情况下,赠送的方言/语种数量不叠加;

2、 后台计量系统将根据使用情况,以秒为单位向上取整,进行使用量扣除;

方言语种

方言
语种
民族语言
语种价格购买
广东话
5000元20000元
立即购买
河南话
5000元20000元
立即购买
西南官话(云贵川渝)
5000元20000元
立即购买
语种价格购买
广东话
5000元20000元
立即购买
河南话
5000元20000元
立即购买
西南官话(云贵川渝)
5000元20000元
立即购买
语种价格购买
广东话
5000元20000元
立即购买
河南话
5000元20000元
立即购买
西南官话(云贵川渝)
5000元20000元
立即购买
类型

温馨提示:

1、  默认支持中文、英文、中英混合识别;中文包含普通话、天津话、河北话、东北话、甘肃话、山东话、太原话;

2、  广东话、河南话、西南官话需购买使用,其中西南官话包含云南话、贵州话、重庆话、四川话;

3、 非实时语音转写结合统一建模的星火多语种语音识别大模型,推出英语、日语、韩语、俄语、法语、西班牙语、阿拉伯语、德语、葡萄牙语、越南语、泰语、意大利语、印地语转写语种识别。极大提升了语音转写准确度,真实还原语音内容,标点等同步预测,带来更流畅的体验。后续将持续扩增转写语种的支持。快来点击提交工单进行体验吧!

4、  购买时长套餐,可在控制台领取方言/语种;藏语和维语不参与套餐赠送。

技术规格

输入
接口输入规格
形式:
已录制音频
声道:
单声道&多声道
支持格式:
wav,flac,opus,m4a,mp3
采样率:
8KHz,16KHz
采样精度:
8bits,16bits
输出
接口输出规格
形式:
JSON格式字符串
编码:
UTF-8
结果:
分词形式&完整句子形式,词&句置信息度词&句时间戳,词属性,多候选词,文法格式智能转换,多发音人分离

注:

1、文法格式智能转换包括电话号码、车牌、日期、时间以及量词的规整,如“五点三十”引擎会识别规整为“5:30”。

2、词属性包括:普通词;语气犹豫词,如“嗯”、“啊”、“呃”或者无意义的重复词等;标点符号,如“,”等。

3、语音转写的识别文字结果为异步获取,最长5小时之内获取。

4、语音转写引擎是适用于5小时以内的长音频识别,若您有大量1分钟以内的短音频需要识别,为了提高识别效率,建议使用语音听写服务。

5、使用本服务前请参阅实践指南,以获得更高的转写准确率。

开发者资源

WebAPI
可直接调用的WebAPI接口,具备流式传输能力,具备轻量、跨平台的特点

常见问题

1、 “语音转写 ”与 “语音听写 ”的区别是?

产品名称 支持的音频时长  使用场景
语音听写 一分钟以内 人机对话,如输入法、语音搜索
语音转写 五小时以内 更自然地贴近日常的对话、演讲

 

2、 “已录制音频转写”和“实时音频流转写”的区别是?

已录制音频(recorded audio)转写:将预先录制完毕的完整音频文件传输至云端,转写服务处理完成后将输出此音频对应的完整文字结果。该流程为异步&非实时;

实时音频流(real-time streaming)转写:在采集音频的同时,连续上传音频流至云端,转写服务将实时返回文字结果,实现文字和声音的同步展现。

实时语音转写已上线,欢迎使用。

 

3、语音转写支持什么语言?

答:默认支持中文、英文、中英混合识别;中文包括普通话、天津话、河北话、东北话、甘肃话、山东话、太原话;其他方言/语种需购买套餐或语种授权。目前可支持:

l  方言:广东话、河南话、西南官话(云南话、贵州话、重庆话、四川话)

l  语种:中文、英文、日语、韩语、法语、俄语、越南语、西班牙语、阿拉伯语、德语、意大利语

l  民族语言:藏语、维语

 

4、目前语音转写支持的音频格式为:

已录制音频(5小时内),wav,flac,opus,m4a,mp3,单声道&多声道;采样率:8KHz,16KHz

 

5、语音转写支不支持并发?

答:支持,要保证同一个appid每秒请求接口次数最大值在20次以下。

专属技术支持
搜索
咨询
建议
体验
中心
售前在线咨询
加入官方社群
意见反馈
体验中心
热门AI技术,扫码体验