语音转写_语音识别技术_录音文件识别-讯飞开放平台

星火API星火API正式开放商用，最高1000万tokens免费领！有奖调研诚邀您参与用户调研，填写问卷即有机会获取定制精品礼包，期待您的意见！

产品优势

准确率高，高效稳定

行业先进的语音识别技术，通用语音识别率98%（注：安徽电子产品监督检验所检测，报告编号151209010027）

自定义个性热词、质检关键词

无需算法开发，直接上传热词列表即可完成热词配置；质检关键词支持配置默认词库和上传自定义词库，满足您的多样化需求

格式转化，标点预测

对数字、日期、时间等返回格式化文本，根据对话语境，智能断句并匹配标点

方言语种，高效识别

支持除中英文外的多方言语种识别，适应复杂的语言环境

产品价格

新用户礼包

个人开发者和企业开发者免费使用

时长

最高50小时

有效期

一年

方言/语种

中英文

套餐一

按时长套餐计费

时长

20小时

有效期

一年

方言/语种

中英文

套餐二

按时长套餐计费

时长

200小时

有效期

一年

方言/语种

中英文

套餐三

按时长套餐计费，赠送3个方言/语种

时长

1000小时

有效期

一年

方言/语种

额外赠送3个

套餐四

按时长套餐计费, 赠送5个方言/语种

时长

3000小时

有效期

一年

方言/语种

额外赠送5个

套餐五

按时长套餐计费, 赠送5个方言/语种

时长

1万小时

有效期

一年

方言/语种

额外赠送5个

商务定制

有特殊环境或功能需求的客户

私有化部署

个性化功能

专属并发

定制方言/语种

大量采购

商务优惠

温馨提示：

1、默认支持中文、英文、中英混合识别；购买套餐三可领取3个方言/语种，购买套餐四、五可领取5个方言/语种，购买套餐六可领取8个方言/语种；购买套餐后，可在控制台领取所需方言/语种；购买多个套餐的情况下，赠送的方言/语种数量不叠加；

2、后台计量系统将根据使用情况，以秒为单位向上取整，进行使用量扣除；

方言语种

方言

语种

民族语言

语种	价格	购买

广东话	5000元20000元	立即购买
河南话	5000元20000元	立即购买
西南官话（云贵川渝）	5000元20000元	立即购买

语种	价格	购买

广东话	5000元20000元	立即购买
河南话	5000元20000元	立即购买
西南官话（云贵川渝）	5000元20000元	立即购买

语种	价格	购买

广东话	5000元20000元	立即购买
河南话	5000元20000元	立即购买
西南官话（云贵川渝）	5000元20000元	立即购买

类型

温馨提示：

1、默认支持中文、英文、中英混合识别；中文包含普通话、天津话、河北话、东北话、甘肃话、山东话、太原话；

2、广东话、河南话、西南官话需购买使用，其中西南官话包含云南话、贵州话、重庆话、四川话；

3、非实时语音转写结合统一建模的星火多语种语音识别大模型，推出英语、日语、韩语、俄语、法语、西班牙语、阿拉伯语、德语、葡萄牙语、越南语、泰语、意大利语、印地语转写语种识别。极大提升了语音转写准确度，真实还原语音内容，标点等同步预测，带来更流畅的体验。后续将持续扩增转写语种的支持。快来点击提交工单进行体验吧！

4、购买时长套餐，可在控制台领取方言/语种；藏语和维语不参与套餐赠送。

应用场景

电话销售&客服

将坐席大量录音文件转成文字，帮助电话质检和信息同步，也为数据挖掘提供原料基础

会议&访谈记录

将会议和访谈的音频转换成文字存稿，让后期的信息检索和整理更方便快捷

字幕生成

将视频中的音频进行语音识别并标记时间戳，生成对应字幕，提升配置字幕效率

语音质检

可以从转写出的文字结果中搜索匹配相关词类，对黄暴/涉政内容进行高效鉴别

课堂录音分析

批量识别课堂录音文件，返回文本内容，快速分析教学内容，提升教学质量

技术规格

输入

接口输入规格

形式：

已录制音频

声道：

单声道&多声道

支持格式：

wav,flac,opus,m4a,mp3

采样率：

8KHz,16KHz

采样精度：

8bits,16bits

输出

接口输出规格

形式：

JSON格式字符串

编码：

UTF-8

结果：

分词形式&完整句子形式，词&句置信息度词&句时间戳，词属性，多候选词，文法格式智能转换，多发音人分离

注：

1、文法格式智能转换包括电话号码、车牌、日期、时间以及量词的规整，如“五点三十”引擎会识别规整为“5:30”。

2、词属性包括：普通词；语气犹豫词，如“嗯”、“啊”、“呃”或者无意义的重复词等；标点符号，如“，”等。

3、语音转写的识别文字结果为异步获取，最长5小时之内获取。

4、语音转写引擎是适用于5小时以内的长音频识别，若您有大量1分钟以内的短音频需要识别，为了提高识别效率，建议使用语音听写服务。

5、使用本服务前请参阅实践指南，以获得更高的转写准确率。

开发者资源

WebAPI

可直接调用的WebAPI接口，具备流式传输能力，具备轻量、跨平台的特点

视频教程

常见问题

1、 “语音转写 ”与 “语音听写 ”的区别是？

产品名称	支持的音频时长	使用场景
语音听写	一分钟以内	人机对话，如输入法、语音搜索
语音转写	五小时以内	更自然地贴近日常的对话、演讲