# SparkChain 语音听写 Linux SDK集成文档
# 1. 语音听写简介
语音听写流式接口,用于1分钟内的即时语音转文字技术,支持实时返回识别结果,达到一边上传音频一边获得识别文本的效果。
高阶功能-动态修正现在免费开放!多个小语种已上线!
动态修正:可到这里 动态修正效果 (opens new window) 在线体验
- 未开启动态修正:实时返回识别结果,每次返回的结果都是对之前结果的追加;
- 开启动态修正:实时返回识别结果,每次返回的结果有可能是对之前结果的追加,也有可能是要替换之前某次返回的结果(即修正);
- 开启动态修正,相较于未开启,返回结果的颗粒度更小,视觉冲击效果更佳;
- 使用动态修正功能需到控制台-流式听写-高级功能处点击开通,并设置相应参数方可使用,参数设置方法详见 业务参数说明 (opens new window) ;
- 动态修正功能仅 中文 支持;
- 未开启与开启返回的结果格式不同,详见 动态修正返回结果 (opens new window) ;
小语种
- 支持的语种请到语音听写 (opens new window)页面或控制台查看;
- 使用少数民族语言和小语种时,URL和中英文URL不同,详见 接口要求 (opens new window) ;
- 小语种参数设置方法详见 业务参数说明 (opens new window) ;
该语音能力是通过Websocket API的方式给开发者提供一个通用的接口。Websocket API具备流式传输能力,适用于需要流式数据传输的AI服务场景,比如边说话边识别。相较于SDK,API具有轻量、跨语言的特点;相较于HTTP API,Websocket API协议有原生支持跨域的优势。
原WebAPI普通版本接口(http[s]: //api.xfyun.cn/v1/service/v1/iat) 不再对外开放,已经使用WebAPI普通版本的用户仍可使用,同时也欢迎体验新版流式接口并尽快完成迁移~
# 2. 兼容性说明
类别 | 兼容范围 |
---|---|
系统 | 支持x86,x86_64,arm和arm64架构,支持交叉编译,适配常见芯片型号。 |
开发环境 | 建议使用 VS Studio 进行开发 |
# 3. SDK集成包目录结构
将SDK zip包解压缩,得到如下文件:
├── Demo SparkChain的使用DEMO,DEMO中已经集成了SDK,您可以参考DEMO,集成SDK。集成前,请先测通DEMO,了解调用原理。
├── ReleaseNotes.txt SDK版本日志
├── SDK SparkChain SDK
│ └── libSparkChain.so (opens new window)
└── SparkChain 在线识别 Linux SDK集成文档.pdf SparkChain集成指南
# 4. SDK工程配置
# 4.1 导入SDK库
将SDK/libs文件夹、头文件文件夹include存放到项目中,并在环境变量里添加库路径;
#include "../../include/sparkchain.h"
#include "../../include/sc_asr.h"
# 4.2 配置权限
如果需要存储日志,SDK日志路径需要读写权限,缺少读写权限,日志将无法正常存储。
# 5. 接口流程调用图
# 6. SDK 初始化
在使用SparkChain 在线识别功能前,需要首先开通在线识别功能授权并获取已开通授权的应用信息(appId、apiKey、apiSecret)。SDK全局只需要初始化一次。 初始化时,开发者需要构建一个SparkChainConfig实例config,把相关的appid信息以及日志设置等传入config中,然后再通过SparkChain::init(config)方法把config实例设置到SDK中。SparkChainConfig 结构如下:
class SPARKCHAIN_API SparkChainConfig {
public:
static SparkChainConfig* builder();
virtual ~SparkChainConfig();
//配置appid
virtual SparkChainConfig* appID(const char* appid) = 0;
//配置apiKey
virtual SparkChainConfig* apiKey(const char* apiKey) = 0;
//配置apiSecret
virtual SparkChainConfig* apiSecret(const char* apiSecret) = 0;
//配置用户自定义标识
virtual SparkChainConfig* uid(const char* uid) = 0;
//配置SDK工作路径
virtual SparkChainConfig* workDir(const char* workDir) = 0;
//配置日志等级
virtual SparkChainConfig* logLevel(int logLevel ) = 0;
//配置日志存储路径
virtual SparkChainConfig* logPath(const char* logPath) = 0;
};
初始化参数说明:
接口名称 | 含义 | 参数类型 | 限制 | 是否必填 |
---|---|---|---|---|
appID | 创建应用后,生成的应用ID | const char* | 与平台生成的appID完全一致 | 是 |
apiKey | 创建应用后,生成的唯一应用标识 | const char* | 与平台生成的apiKey完全一致 | 是 |
apiSecret | 创建应用后,生成的唯一应用秘钥 | const char* | 与平台生成的apiSecret完全一致 | 是 |
logLevel | 日志等级 | int | 枚举,0:VERBOSE,1:DEBUG,2:INFO,3:WARN,4:ERROR,5:FATAL,100:OFF | 否 |
logPath | 日志存储路径,设置则会把日志存在该路径下,不设置则会把日志打印在终端上 | const char* | 设置的路径需要有读写权限 | 否 |
uid | 用户自定义标识 | const char* | 否 |
初始化返回值:0:初始化成功,非0:初始化失败,请根据具体返回值参考错误码章节查询原因。
具体示例如下:
SparkChainConfig* config = SparkChainConfig::builder();
config->appID("$appId")
->apiKey("$apiKey")
->apiSecret("$apiSecret");//从平台获取的授权appid,apikey,apisecrety
int ret = SparkChain::init(config);
# 7. 语音听写初始化
在使用语音听写功能前,需先通过其构造方法ASR()方法构建其实例,然后用该实例调用相应的方法去设置听写参数。
语音听写构造方法如下:
class SPARKCHAIN_API ASR {
public:
ASR();
ASR(string language, string domain, string accent);
~ASR();
}
构造方法参数说明:
参数名 | 类型 | 说明 |
---|---|---|
language | string | 语种。详情参见下一章功能参数配置 |
domain | string | 应用领域。详情参见下一章功能参数配置 |
accent | string | 方言。详情参见下一章功能参数配置 |
具体示例如下:
ASR asr(language,"iat","mandarin");
//无参初始化方法
//ASR asr;//使用无参的构造方法,需要在功能参数里配置language,domain和accent三元组才能使用。
# 8. 功能参数配置
SDK支持用户根据自身需求,通过构建的ASR实例访问相关方法配置识别参数。具体方法说明如下:
方法名 | 形参名 | 形参类型 | 必传 | 描述 | 示例 |
---|---|---|---|---|---|
language | language | string | 是 | 语种 zh_cn:中文(支持简单的英文识别) en_us:英文 其他小语种:可到控制台-语音听写(流式版)-方言/语种处添加试用或购买,添加后会显示该小语种参数值,若未授权无法使用会报错11200。 另外,小语种接口URL与中英文不同,详见接口要求 (opens new window)。 | "zh_cn" |
domain | domain | string | 是 | 应用领域 iat:日常用语 xfime-mianqie:方言免切(支持23种方言+中文普通话混合识别) medical:医疗 gov-seat-assistant:政务坐席助手 seat-assistant:金融坐席助手 gov-ansys:政务语音分析 gov-nav:政务语音导航 fin-nav:金融语音导航 fin-ansys:金融语音分析 注:除日常用语领域外其他领域若未授权无法使用,可到控制台-语音听写(流式版)-高级功能处添加试用或购买;方言免切需在方言/语种处添加使用或购买;若未授权无法使用会报错11200。 坐席助手、语音导航、语音分析相关垂直领域仅适用于8k采样率的音频数据,另外三者的区别详见下方。 方言免切23种方言:四川话、河南话、东北话、粤语、闽南话、山东话、贵州话、云南话、客家话、天津话、河北话、太原话、上海话、合肥话、南京话、皖北话、台湾话、甘肃话、陕西话、宁夏话、长沙话、南昌话、武汉话。 | "iat" |
accent | accent | string | 是 | 方言,当前仅在language为中文时,支持方言选择。 mandarin:中文普通话、其他语种 其他方言:可到控制台-语音听写(流式版)-方言/语种处添加试用或购买,添加后会显示该方言参数值;方言若未授权无法使用会报错11200。 | "mandarin" |
vadEos | vadEos | int | 否 | 用于设置后端点检测的静默时间,单位是毫秒。 即静默多长时间后引擎认为音频结束。 默认2000(小语种除外,小语种不设置该参数默认为未开启VAD)。 | 3000 |
dwa | dwa | string | 否 | (仅中文普通话支持)动态修正 wpgs:开启流式结果返回功能 注:该扩展功能若未授权无法使用,可到控制台-语音听写(流式版)-高级功能处免费开通;若未授权状态下设置该参数并不会报错,但不会生效。 | "wpgs" |
pd | pd | string | 否 | (仅中文支持)领域个性化参数 game:游戏 health:健康 shopping:购物 trip:旅行 注:该扩展功能若未授权无法使用,可到控制台-语音听写(流式版)-高级功能处添加试用或购买;若未授权状态下设置该参数并不会报错,但不会生效。 | "game" |
ptt | ptt | bool | 否 | (仅中文支持)是否开启标点符号添加 true:开启(默认值) false:关闭 | true |
rlang | rlang | string | 否 | (仅中文支持)字体 zh-cn :简体中文(默认值) zh-hk :繁体香港 注:该繁体功能若未授权无法使用,可到控制台-语音听写(流式版)-高级功能处免费开通;若未授权状态下设置为繁体并不会报错,但不会生效。 | "zh-cn" |
vinfo | vinfo | bool | 否 | 返回子句结果对应的起始和结束的端点帧偏移值。端点帧偏移值表示从音频开头起已过去的帧长度。 false:关闭(默认值) true:开启 开启后返回的结果中会增加data.result.vad字段,详见下方返回结果。 注:若开通并使用了动态修正功能,则该功能无法使用。 | false |
numnum | enable | bool | 否 | (中文普通话和日语支持)将返回结果的数字格式规则为阿拉伯数字格式,默认开启 false:关闭 true:开启 | true |
speexSize | speexSize | int | 否 | speex音频帧长,仅在speex音频时使用 1 当speex编码为标准开源speex编码时必须指定 2 当speex编码为讯飞定制speex编码时不要设置 注:标准开源speex以及讯飞定制SPEEX编码工具请参考这里 speex编码 (opens new window) 。 | 70 |
nbest | nbest | int | 否 | 取值范围[1,5],通过设置此参数,获取在发音相似时的句子多侯选结果。 设置多候选会影响性能,响应时间延迟200ms左右。 注:该扩展功能若未授权无法使用,可到控制台-语音听写(流式版)-高级功能处免费开通;若未授权状态下设置该参数并不会报错,但不会生效。 | 3 |
wbest | wbest | int | 否 | 取值范围[1,5],通过设置此参数,获取在发音相似时的词语多侯选结果。 设置多候选会影响性能,响应时间延迟200ms左右。 注:该扩展功能若未授权无法使用,可到控制台-语音听写(流式版)-高级功能处免费开通;若未授权状态下设置该参数并不会报错,但不会生效。 | 5 |
具体配置示例如下:
asr.language("zh_cn");//语种,zh_cn:中文,en_us:英文。其他语种参见集成文档
asr.domain("iat");//应用领域,iat:日常用语。其他领域参见集成文档
...
asr.accent("mandarin");//方言,mandarin:普通话。方言仅当language为中文时才会生效。
asr.vinfo(true);//返回子句结果对应的起始和结束的端点帧偏移值。
# 9. 注册结果监听回调
语音听写运行结果通过AsrCallbacks异步返回,接口定义如下:
class SPARKCHAIN_API ASRCallbacks {
public:
virtual void onResult(ASRResult * result, void * usrTag) = 0;
virtual void onError(ASRError * error,void * usrTag) = 0;
};
AsrCallbacks数据结构说明:
onResult为语音听写结果回调方法,参数说明如下:
参数 类型 说明 result ASRResult * 语音听写结果实例 usrTag void * 用户自定义标识 ASRResult 结构说明:
方法 返回值类型 说明 bestMatchText() string 识别结果返回接口,开发者可通过此方法快速获取识别结果。 status() int 识别结果返回进度,0:开始,1:中间,2:结束 sid() string 本次交互的sid vads() vector<Vad *> vad结果结构体,里面包含本次交互的vad信息。只有在功能参数里打开了vinfo才会返回 transcriptions() vector<Transcription *> 识别结果结构体,里面包含具体识别结果信息,一般无特殊需求,识别结果从getBestMatchText方法获取。 Vad结构体说明:
方法 返回值类型 说明 begin() int 起始的端点帧偏移值,单位:帧(1帧=10ms) end() int 结束的端点帧偏移值,单位:帧(1帧=10ms) Transcription结构体说明:
方法 返回值类型 说明 index() int 起始的端点帧偏移值,单位:帧(1帧=10ms)
注:以下两种情况下bg=0,无参考意义: 1)返回结果为标点符号或者为空; 2)本次返回结果过长。segments() vector<Segment *> 中文分词结构体 Segment结构体说明:
方法 返回值类型 说明 text() string 字词 score() int 得分,当前未实现,保留字段 onError为语音识别错误回调,参数说明如下:
参数 类型 说明 error ASRError * 错误信息结果实例 usrTag void * 用户自定义标识 ASRError 结构说明:
方法 返回值类型 说明 code() int 错误码 errMsg() string 错误信息 sid() string 交互的Sid
具体示例如下:
class ASRCallbacksImpl : public ASRCallbacks {
void onResult(ASRResult * result, void * usrTag) override {
int begin = -1;
int end = -1;
string word = "";
string asrResult = result->bestMatchText();//解析识别结果
int status = result->status();//解析结果返回状态
string sid = result->sid();//解析sid
//以下信息需要开发者根据自身需求,如无必要,可不需要解析执行。
vector<Vad *> vads = result->vads();//解析vad结构体
for (Vad * v : vads) {
begin = v->begin();//解析vad前端点
end = v->end();//解析vad后端点
}
vector<Transcription *> transcriptions = result->transcriptions();//解析具体结果信息
for (auto item : transcriptions) {
vector<Segment *> segs = item->segments();//解析中文分词结构体
for (auto seg : segs) {
word = seg->text();//解析词语
}
}
}
void onError(ASRError * error,void * usrTag) override {
int errCode = error->code();//错误码
string errMsg = error->errMsg();//错误信息
string sid = error->sid();//本次交互的sid
}
};
ASRCallbacksImpl *mASRCallbacks = new ASRCallbacksImpl();
asr.registerCallbacks(mASRCallbacks);//注册监听回调
# 10. 请求调用
# 10.1 开启会话
开发者注册完监听回调后,可通过asr.start()方法开启会话。请求调用接口如下:
class SPARKCHAIN_API ASR {
int start(const AudioAttributes & attributes,void * usrTag = nullptr);
}
start方法结构说明:
参数 类型 说明 attributes const AudioAttributes & 输入数据格式结构体,用于描述输入数据音频格式。默认:16K,16bit,单声道的pcm音频。 usrTag void * 用户自定义标识 AudioAttributes结构说明:
方法名 返回值类型 参数名 参数类型 说明 setSampleRate void sampleRate int 输入音频的采样率,支持8k和16k setEncoding void encoding const string & 输入音频的编码格式
raw:原生音频(支持单声道的pcm)
speex:speex压缩后的音频(8k)
speex-wb:speex压缩后的音频(16k) 请注意压缩前也必须是采样率16k或8k单声道的pcm。 lame:mp3格式(仅中文普通话和英文支持,方言及小语种暂不支持)setChannels void channels int 输入音频的声道
1:单声道(默认)
2:双声道setBitDepth void bitdepth int 位深
8:8bit
16:16bit(默认)setFrameSize void framesize int 帧大小
最小值:0, 最大值:1024
具体示例如下:
SparkChain::AudioAttributes attr;
attr.setSampleRate(16000); //输入音频采样率:16K:16000,8K:8000
attr.setEncoding("raw"); //输入音频的编码格式.raw:pcm原始音频格式
attr.setChannels(1); //输入音频的声道 1:单声道(默认) 2:双声道
asr.start(attr);
# 10.2 送入数据
启动会话后,开发者可通过asr.write()方法送入要识别的音频,然后异步从监听回调中获取识别结果。write方法调用接口如下:
class SPARKCHAIN_API ASR {
int write(const char * data, size_t len);
}
write方法参数说明:
参数 | 类型 | 说明 |
---|---|---|
data | const char * | 识别音频 注意: 1.建议音频流每40ms发送1280字节,发送过快可能导致引擎出错; 2.整个会话时长最多持续60s,或者超过10s未发送数据,服务端会主动断开连接。 3.数据write完毕,客户端需要调用stop方法告诉SDK音频已传入完毕,从而获取最终结果。 |
具体示例如下:
char * data = new char[1280];
...//省略获取音频的过程
asr.write(data,1280);
# 10.3 结束会话
当开发者送完数据后,需要调用asr.stop()方法通知SDK层以及云端数据已传完。之后云端则会下发最终的识别结果,然后结束本轮交互。stop方法调用接口如下:
class SPARKCHAIN_API ASR {
int stop(bool immediate = false);
}
stop方法参数说明:
参数 | 类型 | 说明 |
---|---|---|
immediate | bool | true:调用stop后,SDK不管后续云端结果,立即结束。 false:调用stop后,SDK会等云端发送完最终结果后再结束。 |
具体示例如下:
asr.stop(); //停止
# 11. 逆初始化
当SDK需要完整退出时,需调用逆初始化方法释放资源,示例代码如下:
SparkChain::unInit(); //SDK逆初始化
# 12. SDK API介绍
# 12.1 SparkChainConfig API
返回值类型 | 方法说明 |
---|---|
SparkChainConfig* | virtual SparkChainConfig* appID(const char* appid) = 0 设置用户的appID |
SparkChainConfig* | virtual SparkChainConfig* apiKey(const char* apiKey) = 0 设置用户的apiKey |
SparkChainConfig* | virtual SparkChainConfig* apiSecret(const char* apiSecret) = 0 设置用户的apiSecret |
SparkChainConfig* | virtual SparkChainConfig* uid(const char* uid) = 0 设置用户自定义标识 |
SparkChainConfig* | virtual SparkChainConfig* workDir(const char* workDir) = 0 设置SDK工作路径 |
SparkChainConfig* | virtual SparkChainConfig* logLevel(int logLevel ) = 0 设置日志等级 |
SparkChainConfig* | virtual SparkChainConfig* logPath(const char* logPath) = 0 设置日志保存路径 |
SparkChainConfig* | static SparkChainConfig* builder() 构建SparkChain实例 |
# 12.2 SparkChain API
返回值类型 | 方法说明 |
---|---|
int32_t | SPARKCHAIN_API int32_t init(SparkChainConfig* config) SDK初始化 |
int32_t | SPARKCHAIN_API int32_t unInit() SDK逆初始化 |
# 12.3 ASR API
返回值类型 | 方法说明 |
---|---|
int | int start(const AudioAttributes & attributes,void * usrTag = nullptr) 启动会话 |
int | int write(const char * data, size_t len) 输入数据 |
int | int stop(bool immediate = false) 结束会话 |
void | void language(string language) 设置听写的语种 |
void | void domain(string domain) 设置听写的领域 |
void | void accent(string accent) 设置听写的方言 |
void | void vadEos(int vadEos) 设置后端点检测的静默时间 |
void | void dwa(string dwa) (仅中文普通话支持)动态修正 |
void | void pd(string pd) (仅中文支持)领域个性化参数 |
void | void ptt(bool enable) (仅中文支持)是否开启标点符号添加 |
void | void rlang(string rlang) (仅中文支持)字体 |
void | void vinfo(bool vinfo) 返回子句结果对应的起始和结束的端点帧偏移值。 |
void | void registerCallbacks(ASRCallbacks * cbs) 注册语音听写的结果监听回调 |
void | void numnum(bool enable) (中文普通话和日语支持)将返回结果的数字格式规则为阿拉伯数字格式,默认开启 |
void | void speexSize(int speexSize) speex音频帧长,仅在speex音频时使用 |
void | void nbest(int nbest) 获取在发音相似时的句子多侯选结果 |
void | void wbest(int wbest) 获取在发音相似时的词语多侯选结果 |
# 12.4 ASRResult API
返回值类型 | 方法说明 |
---|---|
string | virtual string bestMatchText() = 0 获取识别结果 |
int | virtual int status() = 0 获取识别结果状态 |
string | virtual string sid() = 0 获取本次交互的sid |
vector<Transcription *> | virtual vector<Transcription *> transcriptions() = 0 获取详细信息的识别结果 |
vector<Vad *> | virtual vector<Vad *> vads() = 0 获取vad结果 |
# 12.5 ASRError API
返回值类型 | 方法说明 |
---|---|
int | virtual int code() = 0 获取错误码 |
string | virtual string errMsg() = 0 获取错误信息 |
string | virtual string sid() = 0 获取交互sid |
# 12.6 ASR AudioAttributes API
返回值类型 | 方法说明 |
---|---|
void | void setSampleRate(int sampleRate) 设置输入音频的采样率 |
void | void setEncoding(const string & encoding) 设置输入音频的编码格式 |
void | void setChannels(int channels) 设置输入音频的声道 |
void | void setBitDepth(int bitdepth) 设置位深 |
void | void setFrameSize(int framesize) 设置帧大小 |
# 13. 错误码
错误码包含SDK错误码和云端错误码。
# 13.1 SDK错误码
错误码 | 含义 | 自查指南 |
---|---|---|
0 | 操作成功 | |
18000 | 本地license文件不存在 | 检查工作目录下是否存在license文件,或者该目录是否有读写权限 |
18001 | 授权文件内容非法 | 授权文件存在问题,请联系技术支持询问 |
18002 | 授权文件解析失败 | 授权文件可能存在损坏,请联系技术支持询问 |
18003 | payload内容缺失 | 授权文件存在问题,请联系技术支持询问 |
18004 | signature内容缺失 | 授权文件存在问题,请联系技术支持询问 |
18005 | 授权已过期 | 授权时间过期,请检查系统时间是否是当前时间,并联系技术支持询问 |
18006 | 授权时间错误,比正常时间慢30分钟以上 | 请检查系统时间是否正确 |
18007 | 授权应用不匹配(apiKey、apiSecret) | apiKey、apiSecret 配置有误,请核对项目中配置的 apiKey、apiSecret 。 |
18008 | 授权文件激活过期 | 授权文件已超过15天未激活,需要联系相关人员重新生成离线授权文件 |
18009 | 授权app信息指针为空 | |
18010 | 离线授权激活文件指定平台与设备平台不匹配 | 授权文件里预置的平台架构与实际运行的设备的平台架构不一致 |
18011 | 离线授权激活文件指定架构与设备cpu架构不匹配 | 授权文件里预置的cpu架构与实际运行的设备的cpu架构不一致 |
18012 | 离线授权激活文件中包含License个数异常 | 离线授权文件异常,请联系相关人员重新生成离线授权文件 |
18013 | 离线授权激活文件中未找到当前设备 | 当前运行的设备的设备指纹不在离线授权文件中,请检查该设备的设备指纹是否在提供的指纹池中 |
18014 | 离线授权激活文件中设备指纹安全等级非法 | 请联系技术支持调整该appid的设备指纹等级 |
18015 | 硬件授权验证失败 | 硬件授权验证失败,请联系相关人员处理 |
18016 | 离线授权激活文件内容非法 | 离线授权文件被修改,请联系相关人员重新生成离线授权文件 |
18017 | 离线授权激活文件中协议头非法 | 离线授权文件被修改,请联系相关人员重新生成离线授权文件 |
18018 | 离线授权激活文件中指纹组成项个数为0 | 离线授权文件生成异常,请联系相关人员重新生成离线授权文件 |
18019 | 资源已过期 | 资源的时间校验已过期,请联系相关人员增加授权时间 |
18100 | 资源鉴权失败 | 资源鉴权失败,请联系相关人员处理 |
18101 | 资源格式解析失败 | 资源格式解析失败,请联系相关人员处理 |
18102 | 资源(与引擎)不匹配 | 资源(与引擎)不匹配,请检查资源是否用错,如果未用错,请联系相关人员处理 |
18103 | 资源参数不存在(指针为NULL) | 资源参数不存在,请检查资源是否正确 |
18104 | 资源路径打开失败 | 资源路径打开失败,请检查工作目录下是否存在该资源,或者该资源是否存在读写权限 |
18105 | 资源加载失败,workDir内未找到对应资源 | 请检查workDir中是否存在此资源,或者resDir是否设置正确,或者app是否有改路径的读写权限 |
18106 | 资源卸载失败, 卸载的资源未加载过 | 资源卸载失败, 卸载的资源未加载过 |
18200 | 引擎鉴权失败 | 引擎鉴权失败,引擎存在问题。请联系技术支持询问 |
18201 | 引擎动态加载失败 | 引擎动态加载失败,请联系技术支持询问 |
18202 | 引擎未初始化 | 引擎在使用前,需要调用engineInit初始化 |
18203 | 引擎不支持该接口调用 | 引擎不支持该接口调用,请查询对应的能力文档,使用正确的方法调用 |
18204 | 引擎craete函数指针为空 | 引擎存在问题,请联系技术支持询问 |
18300 | SDK不可用 | SDK存在异常,请联系技术支持询问 |
18301 | SDK未初始化 | 在使用大模型前请先初始化 SDK,如果有调用 uninit 方法,再次使用大模型交互时需要重新初始化。 |
18302 | SDK初始化失败 | 请根据init接口回调中返回的错误码参考此文档做对应检查 |
18303 | SDK 已经初始化 | 重复初始化导致,使用能力时,SDK 只需要初始化一次,请检查 SDK 初始化逻辑是否存在多次初始化。 |
18304 | 不合法参数 | 请参考demo及集成文档仔细检查所传参数是否正确。 |
18305 | SDK会话handle为空 | 请检查代码逻辑,handle是否被释放 |
18306 | SDK会话未找到 | SDK会话未找到 |
18307 | SDK会话重复终止 | SDK会话重复终止,请检查代码逻辑 |
18308 | 超时错误 | 请求超时 |
18309 | SDK正在初始化中 | SDK正在初始化中,请检查代码逻辑 |
18310 | SDK会话重复开启 | SDK会话重复开启,请检查代码逻辑 |
18311 | sdk同一能力并发路数超出最大限制 | sdk同一能力并发路数超出最大限制 |
18312 | 此实例已处在运行态,禁止单实例并发运行 | SDK同一能力单实例不支持并发 |
18400 | 工作目录无写权限 | 在设置 workDir 时,请确保该工作路径有读写权限。若无法设置读写权限,请修改为有读写权限的工作路径。 |
18401 | 设备指纹获取失败,设备未知 | 采集不到设备指纹 |
18402 | 文件打开失败 | 请检查 日志中所打印的文件是否存在,以及对应路径下是否有读权限。 |
18403 | 内存分配失败 | 请联系技术支持询问 |
18404 | 设备指纹比较失败 | 请联系技术支持询问 |
18500 | 未找到该参数 key | 请参照demo或集成文档仔细检查参数名拼写 |
18501 | 参数范围溢出,不满足约束条件 | 请根据文档检查调用 SDK 方法时所传参数范围,需要确保所传参数符合协议约束要求 |
18502 | SDK 初始化参数为空 | 请根据 SDK 集成文档检查 SDK 初始化代码,确保必填参数有值且合法 |
18503 | SDK 初始化参数中 appId 为空 | appId 为空值,请在 SDK 初始化时传入正确的 appId 值 |
18504 | SDK 初始化参数中 apiKey为空 | apiKey为空值,请在 SDK 初始化时传入正确的 apiKey值 |
18505 | SDK 初始化参数中 apiSecret 为空 | apiSecret 为空值,请在 SDK 初始化时传入正确的 apapiSecret 值 |
18506 | ability参数为空 | 请检查代码逻辑,参数是否未传入 |
18507 | input参数为空 | 请检查代码逻辑,参数是否未传入 |
18508 | 输入数据参数Key不存在 | 请检查代码逻辑,参数key是否不符合该引擎 |
18509 | 必填参数缺失 | 请参考demo或者文档检查是否漏传必填参数 |
18510 | output参数缺失 | 引擎输出参数异常,请联系技术支持询问 |
18520 | 不支持的编解码类型 | 请检查送入的数据是否符合要求 |
18521 | 编解码handle指针为空 | 请检查代码逻辑,handle是否被释放 |
18522 | 编解码模块条件编译未打开 | 请联系技术支持询问 |
18523 | 编码错误 | 请联系技术支持询问 |
18524 | 解码错误 | 请联系技术支持询问 |
18600 | 协议中时间戳字段缺失 | 协议文件异常,请联系技术支持询问 |
18601 | 协议中未找到该能力ID | 调用的能力不在该SDK中,请检查SDK是否使用错误,或者调用能力id是否写错 |
18602 | 协议中未找到该资源ID | appid没有该资源的使用权限 |
18603 | 协议中未找到该引擎ID | 协议存在问题,请联系技术支持询问 |
18604 | 协议中引擎个数为0 | 协议存在问题,请联系技术支持询问 |
18605 | 协议未被初始化解析 | 协议存在问题,请联系技术支持询问 |
18606 | 协议能力接口类型不匹配 | 协议存在问题,请联系技术支持询问 |
18607 | 预置协议解析失败 | 协议存在问题,请联系技术支持询问 |
18700 | 通用网络错误 | 请检查网络连接是否正常 |
18701 | 网络不通 | 请检查网络连接是否正常 |
18702 | 网关检查不过 | 检查设备时间是否正确; 请检查 SDK 初始化时所传 apiKey、apiScrect 是否正确; |
18703 | 云端响应格式不对 | 请检查网络是否可以正常访问外网 |
18704 | 应用未注册 | appid存在问题,请检查 appid 是否正确 |
18705 | 应用 ApiKey & ApiSecret 校验失败 | 请检查 apiKey、apiSecret 是否正确 |
18706 | 引擎不支持的平台架构 | 请检查运行的设备平台引擎是否支持 |
18707 | 授权已过期 | 请检查授权期限 |
18708 | 无可用授权 | 没有授权或者授权已满 |
18709 | 未找到该app绑定的能力 | 请检查该appid是否申请该能力 |
18710 | 未找到该app绑定的能力资源 | 该appid没有该资源的使用权限,请联系技术支持询问 |
18711 | JSON操作失败 | 请联系技术支持询问 |
18712 | 网络请求 404 错误 | 请检查网络是否通畅 |
18713 | 设备指纹安全等级不匹配 | 设备指纹安全等级不符合要求 |
18714 | 应用信息有误 | 服务端无法查询到api_key,请检查api_key和api_secret信息是否填写正确 |
18715 | 未找到该SDK ID | SDK异常,请联系技术支持询问 |
18716 | 未找到该组合能力集合 | 请检查使用的能力是否是该appid所申请的能力 |
18717 | SDK授权不足 | 授权数量已满 |
18718 | 无效授权应用签名 | 应用签名异常,请联系技术支持询问 |
18719 | 应用签名不唯一 | 应用签名异常,请联系技术支持询问 |
18720 | 能力schema不可用 | 请联系技术支持询问 |
18721 | 竞争授权: 未找到能力集模板 | 请联系技术支持询问 |
18722 | 竞争授权: 能力不在模板能力集模板中 | 请联系技术支持询问 |
18801 | 连接建立出错 | 请检查网络是否通畅 |
18802 | 结果等待超时 | 请检查网络是否通畅 |
18803 | 连接状态异常 | 请检查网络是否通畅 |
18902 | 并发超过路数限制 | 不支持并发 |
18903 | 大模型规划步骤为空 | 请检查请求数据的意图是否明确 |
18904 | 插件未找到 | 请检查是否使用了未存在的插件 |
18906 | 与大模型交互次数超限制 | |
18907 | 运行超限制时长 | |
18908 | 大模型返回结果格式异常 | 可能是因为大模型结果太多,导致30秒内没有返回完,从而引起SDK内部认为超时,建议使用异步调用。 |
18951 | 同一流式大模型会话,禁止并发交互请求 | |
18952 | 输入数据为空或异常 | |
19001 | 设备级授权: 设备被禁用 | |
19002 | 设备级授权: 协议解析失败 | |
19003 | 设备级授权: 本地缓存获取失败 | |
19004 | 设备级授权: 无网络 | |
19005 | 设备级授权: 授权未找到 | |
19006 | 设备级授权: 设备授权获取失败 | |
19007 | 设备级授权: 当前设备处于黑名单 | |
19008 | 设备级授权: 当前设备不在白名单 | |
19010 | 设备级授权: 鉴权参数非法 | |
20011 | 设备级授权: 不匹配的appid |
# 13.2 部分云端错误码
备注:如出现下述列表中没有的错误码,可到 这里 (opens new window) 查询。
错误码 | 错误描述 | 说明 | 处理方式 |
---|---|---|---|
10005 | licc fail | appid授权失败 | 确认appid是否正确,是否开通了听写服务 |
10006 | Get audio rate fail | 获取某个参数失败 | 检查报错信息中的参数是否正确上传 |
10007 | get invalid rate | 参数值不合法 | 检查报错信息中的参数值是否在取值范围内 |
10010 | AIGES_ERROR_NO_LICENSE | 引擎授权不足 | 请到控制台提交工单联系技术人员 |
10014 | AIGES_ERROR_TIME_OUT | 会话超时 | |
10019 | service read buffer timeout, session timeout | session超时 | 检查是否数据发送完毕但未关闭连接 |
10043 | Syscall AudioCodingDecode error | 音频解码失败 | 检查aue参数,如果为speex,请确保音频是speex音频并分段压缩且与帧大小一致 |
10101 | engine inavtive | 引擎会话已结束 | 检查是否引擎已结束会话但客户端还在发送数据,比如音频数据虽然发送完毕但并未关闭websocket连接,还在发送空的音频等 |
10114 | session timeout | 会话超时 | 检查整个会话是否已经超过了60s |
10139 | invalid param | 参数错误 | 引擎编解码错误 |
10313 | appid cannot be empty | appid不能为空 | 检查common参数是否正确上传,或common中的app_id参数是否正确上传或是否为空 |
10317 | invalid version | 版本非法 | 联系技术人员 |
11200 | auth no license | 没有权限 | 检查是否使用了未授权的功能,或者总的调用次数已超越上限 |
11201 | auth no enough license | 日流控超限 | 可联系商务提高每日调用次数 |
10160 | parse request json error | 请求数据格式非法 | 检查请求数据是否是合法的json |
10161 | parse base64 string error | base64解码失败 | 检查发送的数据是否使用了base64编码 |
10163 | param validate error:/common 'app_id' param is required | 缺少必传参数,或者参数不合法 | 检查报错信息中的参数是否正确上传 |
10165 | invalid handle | 无效的句柄 | 检查下传入第一帧音频时,是否上传了status=0 |
10200 | read data timeout | 读取数据超时 | 检查是否累计10s未发送数据并且未关闭连接 |