产品优势






产品价格
实时语音转写方言语种
温馨提示:
1、 默认支持中文(普通话、天津话、河北话、东北话、甘肃话、山东话、太原话)、英文、中英混合识别;
2、 西南官话包含云南话、贵州话、重庆话、四川话;
3、 购买时长套餐,可在控制台领取方言/语种;藏语和维语不参与套餐赠送。
技术规格
注:
1、文法格式智能转换包括电话号码、车牌、日期、时间以及量词的规整,如“五点三十”引擎会识别规整为“5:30”。
2、词属性包括:普通词;语气犹豫词,如“嗯”、“啊”、“呃”或者无意义的重复词等;标点符号,如“,”等。
开发者资源

常见问题
1、“已录制音频转写”和“实时音频流转写”的区别是?
已录制音频(recorded audio)转写:将预先录制完毕的完整音频文件传输至云端,转写服务处理完成后将输出此音频对应的完整文字结果。该流程为异步&非实时;
实时音频流(real-time streaming)转写:在采集音频的同时,连续上传音频流至云端,转写服务将实时返回文字结果,实现文字和声音的同步展现。
2、实时语音转写支持什么语言?
答:默认支持中文(包括普通话、天津话、河北话、东北话、甘肃话、山东话、太原话)、英文、中英混合识别;其他方言/语种需购买套餐或语种授权。目前可支持:
l 方言:广东话、河南话、西南官话(云南话、贵州话、重庆话、四川话)
l 语种:英语、日语、韩语、法语、俄语、越南语、西班牙语
l 民族语言:藏语、维语
3、购买翻译套餐后,支持哪些语种相互翻译?
开通翻译功能后,可实现中文与日语、韩语、俄语、韩语、法语、西班牙语、越南语之间的互译,同时支持中文普通话与粤语方言互译
4、实时语音转写支持的音频时长有什么限制?
实时语音转写可以实时识别持续的音频流,结果是实时返回,音频流长度理论上不做限制,典型的应用场景是要求展示实时字幕的会议或直播。
5、实时语音转写的分片时长40ms是什么意思?
可以理解为上传的间隔为40ms,建议音频流每40ms向服务器发送1280字节,发送过快可能导致引擎出错,音频发送间隔超时时间为15s,超时服务端报错并主动断开连接。