离线语音听写

应用场景

社交聊天
使用社交应用聊天时,将用户的语音信息(≤20秒),转成文字信息
语音输入法
使用输入法输入时,将语音信息转成文字信息,提升用户阅读体验
游戏娱乐
将游戏娱乐中的音频文件转成文字消息,大大提升用户体验
人机交互
人机交互时,将双方的语音信息转成文字信息,提升交互体验D

客户案例

讯飞输入法
京东
猎豹浏览器
有道翻译官
新浪微博
携程

开发者资源

疑问解答

  • 1.

    离线语音听写都支持哪些语言?

  • 目前仅支持中文普通话。

  •  2.

    “音频参数”?

  •  
  • 音频参数 数值
    音频长度(Input Length) ≤20s
    采样率(Sampling Rate) 支持16KHz
    采样精度(Bit Depth) 16bits
    声道(Channel) 单声道
    语音起点(begin of the speech) 小于参数vad_bos
    音频终点(end of the speech) 小于参数vad_eos
  •  3.

    “标点符号支持”?

  •  
  • 语言 支持标点
    中文(普通话) 。,?!
  •  4.

    支持哪些平台?

  • Android

  •  5.

    支持的返回结果有几种?

  • 支持JSON、PLAIN等格式,方便解析。

  •  6.

    语音听写与语音转写的区别?

  • 不超过20秒。如果需大于20秒的,请移步到语音转写服务。

  •  7.

    SDK形式是否支持多路并发?

  • 不支持。SDK调用形式只支持单路,WebAPI支持多路并发。

专属技术支持
搜索
咨询
建议
体验
中心
售前在线咨询
加入官方社群
意见反馈
体验中心
热门AI技术,扫码体验