# SparkChain 语音听写 Linux SDK集成文档

# 1. 语音听写简介

语音听写流式接口，用于1分钟内的即时语音转文字技术，支持实时返回识别结果，达到一边上传音频一边获得识别文本的效果。

高阶功能-动态修正现在免费开放！多个小语种已上线！

未开启动态修正：实时返回识别结果，每次返回的结果都是对之前结果的追加；
开启动态修正：实时返回识别结果，每次返回的结果有可能是对之前结果的追加，也有可能是要替换之前某次返回的结果（即修正）；
开启动态修正，相较于未开启，返回结果的颗粒度更小，视觉冲击效果更佳；
使用动态修正功能需到控制台-流式听写-高级功能处点击开通，并设置相应参数方可使用，参数设置方法详见业务参数说明 (opens new window) ；
动态修正功能仅中文支持；
未开启与开启返回的结果格式不同，详见动态修正返回结果 (opens new window) ；

小语种

支持的语种请到语音听写 (opens new window)页面或控制台查看；
使用少数民族语言和小语种时，URL和中英文URL不同，详见接口要求 (opens new window) ；
小语种参数设置方法详见业务参数说明 (opens new window) ；

该语音能力是通过Websocket API的方式给开发者提供一个通用的接口。Websocket API具备流式传输能力，适用于需要流式数据传输的AI服务场景，比如边说话边识别。相较于SDK，API具有轻量、跨语言的特点；相较于HTTP API，Websocket API协议有原生支持跨域的优势。

原WebAPI普通版本接口(http[s]: //api.xfyun.cn/v1/service/v1/iat) 不再对外开放，已经使用WebAPI普通版本的用户仍可使用，同时也欢迎体验新版流式接口并尽快完成迁移~

# 2. 兼容性说明

类别	兼容范围
系统	支持x86，x86_64，arm和arm64架构，支持交叉编译，适配常见芯片型号。
开发环境	建议使用 VS Studio 进行开发

# 3. SDK集成包目录结构

将SDK zip包解压缩，得到如下文件：

├── Demo SparkChain的使用DEMO，DEMO中已经集成了SDK，您可以参考DEMO，集成SDK。集成前，请先测通DEMO，了解调用原理。

├── ReleaseNotes.txt SDK版本日志

├── SDK SparkChain SDK

│ └── libSparkChain.so (opens new window)

└── SparkChain 在线识别 Linux SDK集成文档.pdf SparkChain集成指南

# 4. SDK工程配置

# 4.1 导入SDK库

将SDK/libs文件夹、头文件文件夹include存放到项目中，并在环境变量里添加库路径；

#include "../../include/sparkchain.h"
#include "../../include/sc_asr.h"

# 4.2 配置权限

如果需要存储日志，SDK日志路径需要读写权限，缺少读写权限，日志将无法正常存储。

# 5. 接口流程调用图

# 6. SDK 初始化

在使用SparkChain 在线识别功能前，需要首先开通在线识别功能授权并获取已开通授权的应用信息（appId、apiKey、apiSecret）。SDK全局只需要初始化一次。 初始化时，开发者需要构建一个SparkChainConfig实例config，把相关的appid信息以及日志设置等传入config中，然后再通过SparkChain::init(config)方法把config实例设置到SDK中。SparkChainConfig 结构如下：

class SPARKCHAIN_API SparkChainConfig { 
    public:    
    	static SparkChainConfig* builder();    
    	virtual ~SparkChainConfig();    
    	//配置appid    
    	virtual SparkChainConfig* appID(const char* appid)         = 0;    
    	//配置apiKey    
    	virtual SparkChainConfig* apiKey(const char* apiKey)       = 0;    
    	//配置apiSecret    
    	virtual SparkChainConfig* apiSecret(const char* apiSecret) = 0;    
    	//配置用户自定义标识    
    	virtual SparkChainConfig* uid(const char* uid)             = 0;    
    	//配置SDK工作路径    
    	virtual SparkChainConfig* workDir(const char* workDir)     = 0;    
    	//配置日志等级    
    	virtual SparkChainConfig* logLevel(int logLevel )          = 0;    
    	//配置日志存储路径    
    	virtual SparkChainConfig* logPath(const char* logPath)     = 0; 
};

初始化参数说明：

接口名称	含义	参数类型	限制	是否必填
appID	创建应用后，生成的应用ID	const char*	与平台生成的appID完全一致	是
apiKey	创建应用后，生成的唯一应用标识	const char*	与平台生成的apiKey完全一致	是
apiSecret	创建应用后，生成的唯一应用秘钥	const char*	与平台生成的apiSecret完全一致	是
logLevel	日志等级	int	枚举，0：VERBOSE，1：DEBUG，2：INFO，3：WARN，4：ERROR，5：FATAL，100：OFF	否
logPath	日志存储路径，设置则会把日志存在该路径下，不设置则会把日志打印在终端上	const char*	设置的路径需要有读写权限	否
uid	用户自定义标识	const char*		否

初始化返回值：0：初始化成功，非0：初始化失败，请根据具体返回值参考错误码章节查询原因。

具体示例如下：

SparkChainConfig* config = SparkChainConfig::builder(); 
config->appID("$appId")      
    ->apiKey("$apiKey")      
    ->apiSecret("$apiSecret");//从平台获取的授权appid，apikey,apisecrety 
int ret = SparkChain::init(config);

# 7. 语音听写初始化

在使用语音听写功能前，需先通过其构造方法ASR()方法构建其实例，然后用该实例调用相应的方法去设置听写参数。

语音听写构造方法如下：

class SPARKCHAIN_API ASR {
public:
    ASR();
    ASR(string language, string domain, string accent);
    ~ASR();
}

构造方法参数说明：

参数名	类型	说明
language	string	语种。详情参见下一章功能参数配置
domain	string	应用领域。详情参见下一章功能参数配置
accent	string	方言。详情参见下一章功能参数配置

具体示例如下：

ASR asr(language,"iat","mandarin");
//无参初始化方法
//ASR asr;//使用无参的构造方法，需要在功能参数里配置language,domain和accent三元组才能使用。

# 8. 功能参数配置

SDK支持用户根据自身需求，通过构建的ASR实例访问相关方法配置识别参数。具体方法说明如下：

方法名	形参名	形参类型	必传	描述	示例
language	language	string	是	语种 zh_cn：中文（支持简单的英文识别） en_us：英文其他小语种：可到控制台-语音听写（流式版）-方言/语种处添加试用或购买，添加后会显示该小语种参数值，若未授权无法使用会报错11200。另外，小语种接口URL与中英文不同，详见接口要求 (opens new window)。	"zh_cn"
domain	domain	string	是	应用领域 iat：日常用语 xfime-mianqie：方言免切（支持23种方言+中文普通话混合识别） medical：医疗 gov-seat-assistant：政务坐席助手 seat-assistant：金融坐席助手 gov-ansys：政务语音分析 gov-nav：政务语音导航 fin-nav：金融语音导航 fin-ansys：金融语音分析注：除日常用语领域外其他领域若未授权无法使用，可到控制台-语音听写（流式版）-高级功能处添加试用或购买；方言免切需在方言/语种处添加使用或购买；若未授权无法使用会报错11200。坐席助手、语音导航、语音分析相关垂直领域仅适用于8k采样率的音频数据，另外三者的区别详见下方。方言免切23种方言：四川话、河南话、东北话、粤语、闽南话、山东话、贵州话、云南话、客家话、天津话、河北话、太原话、上海话、合肥话、南京话、皖北话、台湾话、甘肃话、陕西话、宁夏话、长沙话、南昌话、武汉话。	"iat"
accent	accent	string	是	方言，当前仅在language为中文时，支持方言选择。 mandarin：中文普通话、其他语种其他方言：可到控制台-语音听写（流式版）-方言/语种处添加试用或购买，添加后会显示该方言参数值；方言若未授权无法使用会报错11200。	"mandarin"
vadEos	vadEos	int	否	用于设置后端点检测的静默时间，单位是毫秒。即静默多长时间后引擎认为音频结束。默认2000（小语种除外，小语种不设置该参数默认为未开启VAD）。	3000
dwa	dwa	string	否	（仅中文普通话支持）动态修正 wpgs：开启流式结果返回功能注：该扩展功能若未授权无法使用，可到控制台-语音听写（流式版）-高级功能处免费开通；若未授权状态下设置该参数并不会报错，但不会生效。	"wpgs"
pd	pd	string	否	（仅中文支持）领域个性化参数 game：游戏 health：健康 shopping：购物 trip：旅行注：该扩展功能若未授权无法使用，可到控制台-语音听写（流式版）-高级功能处添加试用或购买；若未授权状态下设置该参数并不会报错，但不会生效。	"game"
ptt	ptt	bool	否	（仅中文支持）是否开启标点符号添加 true：开启（默认值） false：关闭	true
rlang	rlang	string	否	（仅中文支持）字体 zh-cn :简体中文（默认值） zh-hk :繁体香港注：该繁体功能若未授权无法使用，可到控制台-语音听写（流式版）-高级功能处免费开通；若未授权状态下设置为繁体并不会报错，但不会生效。	"zh-cn"
vinfo	vinfo	bool	否	返回子句结果对应的起始和结束的端点帧偏移值。端点帧偏移值表示从音频开头起已过去的帧长度。 false：关闭（默认值） true：开启开启后返回的结果中会增加data.result.vad字段，详见下方返回结果。注：若开通并使用了动态修正功能，则该功能无法使用。	false
numnum	enable	bool	否	（中文普通话和日语支持）将返回结果的数字格式规则为阿拉伯数字格式，默认开启 false：关闭 true：开启	true
speexSize	speexSize	int	否	speex音频帧长，仅在speex音频时使用 1 当speex编码为标准开源speex编码时必须指定 2 当speex编码为讯飞定制speex编码时不要设置注：标准开源speex以及讯飞定制SPEEX编码工具请参考这里 speex编码 (opens new window) 。	70
nbest	nbest	int	否	取值范围[1,5]，通过设置此参数，获取在发音相似时的句子多侯选结果。设置多候选会影响性能，响应时间延迟200ms左右。注：该扩展功能若未授权无法使用，可到控制台-语音听写（流式版）-高级功能处免费开通；若未授权状态下设置该参数并不会报错，但不会生效。	3
wbest	wbest	int	否	取值范围[1,5]，通过设置此参数，获取在发音相似时的词语多侯选结果。设置多候选会影响性能，响应时间延迟200ms左右。注：该扩展功能若未授权无法使用，可到控制台-语音听写（流式版）-高级功能处免费开通；若未授权状态下设置该参数并不会报错，但不会生效。	5

具体配置示例如下：

asr.language("zh_cn");//语种，zh_cn:中文，en_us:英文。其他语种参见集成文档
asr.domain("iat");//应用领域,iat:日常用语。其他领域参见集成文档
...
asr.accent("mandarin");//方言，mandarin:普通话。方言仅当language为中文时才会生效。
asr.vinfo(true);//返回子句结果对应的起始和结束的端点帧偏移值。

# 9. 注册结果监听回调

语音听写运行结果通过AsrCallbacks异步返回，接口定义如下：

class SPARKCHAIN_API ASRCallbacks {
public:
    virtual void onResult(ASRResult * result, void * usrTag) = 0;
    virtual void onError(ASRError * error,void * usrTag) = 0;
};

AsrCallbacks数据结构说明：

onResult为语音听写结果回调方法，参数说明如下：

参数类型说明

result ASRResult * 语音听写结果实例

usrTag void * 用户自定义标识

参数	类型	说明
result	ASRResult *	语音听写结果实例
usrTag	void *	用户自定义标识

ASRResult 结构说明：

方法	返回值类型	说明
bestMatchText()	string	识别结果返回接口，开发者可通过此方法快速获取识别结果。
status()	int	识别结果返回进度，0：开始，1：中间，2：结束
sid()	string	本次交互的sid
vads()	vector<Vad *>	vad结果结构体，里面包含本次交互的vad信息。只有在功能参数里打开了vinfo才会返回
transcriptions()	vector<Transcription *>	识别结果结构体，里面包含具体识别结果信息，一般无特殊需求，识别结果从getBestMatchText方法获取。

Vad结构体说明：

方法返回值类型说明

begin() int 起始的端点帧偏移值，单位：帧（1帧=10ms）

end() int 结束的端点帧偏移值，单位：帧（1帧=10ms）

方法	返回值类型	说明
begin()	int	起始的端点帧偏移值，单位：帧（1帧=10ms）
end()	int	结束的端点帧偏移值，单位：帧（1帧=10ms）

Transcription结构体说明：

方法	返回值类型	说明
index()	int	起始的端点帧偏移值，单位：帧（1帧=10ms）注：以下两种情况下bg=0，无参考意义： 1)返回结果为标点符号或者为空； 2)本次返回结果过长。
segments()	vector<Segment *>	中文分词结构体

Segment结构体说明：

方法返回值类型说明

text() string 字词

score() int 得分，当前未实现，保留字段
onError为语音识别错误回调，参数说明如下：

参数类型说明

error ASRError * 错误信息结果实例

usrTag void * 用户自定义标识
ASRError 结构说明：

方法返回值类型说明

code() int 错误码

errMsg() string 错误信息

sid() string 交互的Sid

方法	返回值类型	说明
text()	string	字词
score()	int	得分，当前未实现，保留字段

参数	类型	说明
error	ASRError *	错误信息结果实例
usrTag	void *	用户自定义标识

方法	返回值类型	说明
code()	int	错误码
errMsg()	string	错误信息
sid()	string	交互的Sid

具体示例如下：

class ASRCallbacksImpl : public ASRCallbacks {
    void onResult(ASRResult * result, void * usrTag) override {
        int begin = -1;
        int end = -1;
        string word = "";
        string asrResult = result->bestMatchText();//解析识别结果
        int status       = result->status();//解析结果返回状态
        string sid       = result->sid();//解析sid

        //以下信息需要开发者根据自身需求，如无必要，可不需要解析执行。
        vector<Vad *> vads = result->vads();//解析vad结构体
        for (Vad * v : vads) {
            begin = v->begin();//解析vad前端点
            end   = v->end();//解析vad后端点         
        }
        vector<Transcription *> transcriptions = result->transcriptions();//解析具体结果信息
        for (auto item : transcriptions) {
            vector<Segment *> segs = item->segments();//解析中文分词结构体
            for (auto seg : segs) {
                word = seg->text();//解析词语
            }
        }
    }
    void onError(ASRError * error,void * usrTag) override {
        int errCode   = error->code();//错误码
        string errMsg = error->errMsg();//错误信息
        string sid    = error->sid();//本次交互的sid
    }
};
ASRCallbacksImpl *mASRCallbacks = new ASRCallbacksImpl();
asr.registerCallbacks(mASRCallbacks);//注册监听回调

# 10. 请求调用

# 10.1 开启会话

开发者注册完监听回调后，可通过asr.start()方法开启会话。请求调用接口如下：

class SPARKCHAIN_API ASR {
    int start(const AudioAttributes & attributes,void * usrTag = nullptr);
}

start方法结构说明：

参数	类型	说明
attributes	const AudioAttributes &	输入数据格式结构体，用于描述输入数据音频格式。默认:16K,16bit,单声道的pcm音频。
usrTag	void *	用户自定义标识

AudioAttributes结构说明：

方法名	返回值类型	参数名	参数类型	说明
setSampleRate	void	sampleRate	int	输入音频的采样率，支持8k和16k
setEncoding	void	encoding	const string &	输入音频的编码格式 raw：原生音频（支持单声道的pcm） speex：speex压缩后的音频（8k） speex-wb：speex压缩后的音频（16k）请注意压缩前也必须是采样率16k或8k单声道的pcm。 lame：mp3格式（仅中文普通话和英文支持，方言及小语种暂不支持）
setChannels	void	channels	int	输入音频的声道 1:单声道(默认) 2:双声道
setBitDepth	void	bitdepth	int	位深 8:8bit 16:16bit(默认)
setFrameSize	void	framesize	int	帧大小最小值:0, 最大值:1024

具体示例如下：

SparkChain::AudioAttributes attr;
attr.setSampleRate(16000);  //输入音频采样率:16K:16000,8K:8000
attr.setEncoding("raw");    //输入音频的编码格式.raw:pcm原始音频格式
attr.setChannels(1);        //输入音频的声道 1:单声道(默认) 2:双声道
asr.start(attr);

# 10.2 送入数据

启动会话后，开发者可通过asr.write()方法送入要识别的音频，然后异步从监听回调中获取识别结果。write方法调用接口如下：

class SPARKCHAIN_API ASR {
    int write(const char * data, size_t len);
}

write方法参数说明：

参数	类型	说明
data	const char *	识别音频注意： 1.建议音频流每40ms发送1280字节，发送过快可能导致引擎出错； 2.整个会话时长最多持续60s，或者超过10s未发送数据，服务端会主动断开连接。 3.数据write完毕，客户端需要调用stop方法告诉SDK音频已传入完毕，从而获取最终结果。

具体示例如下：

char * data = new char[1280];
...//省略获取音频的过程 
asr.write(data,1280);

# 10.3 结束会话

当开发者送完数据后，需要调用asr.stop()方法通知SDK层以及云端数据已传完。之后云端则会下发最终的识别结果，然后结束本轮交互。stop方法调用接口如下：

class SPARKCHAIN_API ASR {
    int stop(bool immediate = false);
}

stop方法参数说明：

参数	类型	说明
immediate	bool	true：调用stop后，SDK不管后续云端结果，立即结束。 false：调用stop后，SDK会等云端发送完最终结果后再结束。

具体示例如下：

asr.stop();      //停止

# 11. 逆初始化

当SDK需要完整退出时，需调用逆初始化方法释放资源，示例代码如下：

SparkChain::unInit(); //SDK逆初始化

# 12. SDK API介绍

# 12.1 SparkChainConfig API

返回值类型	方法说明
SparkChainConfig*	virtual SparkChainConfig* appID(const char* appid) = 0 设置用户的appID
SparkChainConfig*	virtual SparkChainConfig* apiKey(const char* apiKey) = 0 设置用户的apiKey
SparkChainConfig*	virtual SparkChainConfig* apiSecret(const char* apiSecret) = 0 设置用户的apiSecret
SparkChainConfig*	virtual SparkChainConfig* uid(const char* uid) = 0 设置用户自定义标识
SparkChainConfig*	virtual SparkChainConfig* workDir(const char* workDir) = 0 设置SDK工作路径
SparkChainConfig*	virtual SparkChainConfig* logLevel(int logLevel ) = 0 设置日志等级
SparkChainConfig*	virtual SparkChainConfig* logPath(const char* logPath) = 0 设置日志保存路径
SparkChainConfig*	static SparkChainConfig* builder() 构建SparkChain实例

# 12.2 SparkChain API

返回值类型	方法说明
int32_t	SPARKCHAIN_API int32_t init(SparkChainConfig* config) SDK初始化
int32_t	SPARKCHAIN_API int32_t unInit() SDK逆初始化

# 12.3 ASR API

返回值类型	方法说明
int	int start(const AudioAttributes & attributes,void * usrTag = nullptr) 启动会话
int	int write(const char * data, size_t len) 输入数据
int	int stop(bool immediate = false) 结束会话
void	void language(string language) 设置听写的语种
void	void domain(string domain) 设置听写的领域
void	void accent(string accent) 设置听写的方言
void	void vadEos(int vadEos) 设置后端点检测的静默时间
void	void dwa(string dwa) （仅中文普通话支持）动态修正
void	void pd(string pd) （仅中文支持）领域个性化参数
void	void ptt(bool enable) （仅中文支持）是否开启标点符号添加
void	void rlang(string rlang) （仅中文支持）字体
void	void vinfo(bool vinfo) 返回子句结果对应的起始和结束的端点帧偏移值。
void	void registerCallbacks(ASRCallbacks * cbs) 注册语音听写的结果监听回调
void	void numnum(bool enable) （中文普通话和日语支持）将返回结果的数字格式规则为阿拉伯数字格式，默认开启
void	void speexSize(int speexSize) speex音频帧长，仅在speex音频时使用
void	void nbest(int nbest) 获取在发音相似时的句子多侯选结果
void	void wbest(int wbest) 获取在发音相似时的词语多侯选结果

# 12.4 ASRResult API

返回值类型	方法说明
string	virtual string bestMatchText() = 0 获取识别结果
int	virtual int status() = 0 获取识别结果状态
string	virtual string sid() = 0 获取本次交互的sid
vector<Transcription *>	virtual vector<Transcription *> transcriptions() = 0 获取详细信息的识别结果
vector<Vad *>	virtual vector<Vad *> vads() = 0 获取vad结果

# 12.5 ASRError API

返回值类型	方法说明
int	virtual int code() = 0 获取错误码
string	virtual string errMsg() = 0 获取错误信息
string	virtual string sid() = 0 获取交互sid

# 12.6 ASR AudioAttributes API

返回值类型	方法说明
void	void setSampleRate(int sampleRate) 设置输入音频的采样率
void	void setEncoding(const string & encoding) 设置输入音频的编码格式
void	void setChannels(int channels) 设置输入音频的声道
void	void setBitDepth(int bitdepth) 设置位深
void	void setFrameSize(int framesize) 设置帧大小

# 13. 错误码

错误码包含SDK错误码和云端错误码。

# 13.1 SDK错误码

错误码	含义	自查指南
0	操作成功
18000	本地license文件不存在	检查工作目录下是否存在license文件，或者该目录是否有读写权限
18001	授权文件内容非法	授权文件存在问题，请联系技术支持询问
18002	授权文件解析失败	授权文件可能存在损坏，请联系技术支持询问
18003	payload内容缺失	授权文件存在问题，请联系技术支持询问
18004	signature内容缺失	授权文件存在问题，请联系技术支持询问
18005	授权已过期	授权时间过期，请检查系统时间是否是当前时间，并联系技术支持询问
18006	授权时间错误，比正常时间慢30分钟以上	请检查系统时间是否正确
18007	授权应用不匹配（apiKey、apiSecret）	apiKey、apiSecret 配置有误，请核对项目中配置的 apiKey、apiSecret 。
18008	授权文件激活过期	授权文件已超过15天未激活，需要联系相关人员重新生成离线授权文件
18009	授权app信息指针为空
18010	离线授权激活文件指定平台与设备平台不匹配	授权文件里预置的平台架构与实际运行的设备的平台架构不一致
18011	离线授权激活文件指定架构与设备cpu架构不匹配	授权文件里预置的cpu架构与实际运行的设备的cpu架构不一致
18012	离线授权激活文件中包含License个数异常	离线授权文件异常，请联系相关人员重新生成离线授权文件
18013	离线授权激活文件中未找到当前设备	当前运行的设备的设备指纹不在离线授权文件中，请检查该设备的设备指纹是否在提供的指纹池中
18014	离线授权激活文件中设备指纹安全等级非法	请联系技术支持调整该appid的设备指纹等级
18015	硬件授权验证失败	硬件授权验证失败，请联系相关人员处理
18016	离线授权激活文件内容非法	离线授权文件被修改，请联系相关人员重新生成离线授权文件
18017	离线授权激活文件中协议头非法	离线授权文件被修改，请联系相关人员重新生成离线授权文件
18018	离线授权激活文件中指纹组成项个数为0	离线授权文件生成异常，请联系相关人员重新生成离线授权文件
18019	资源已过期	资源的时间校验已过期，请联系相关人员增加授权时间
18100	资源鉴权失败	资源鉴权失败，请联系相关人员处理
18101	资源格式解析失败	资源格式解析失败，请联系相关人员处理
18102	资源(与引擎)不匹配	资源(与引擎)不匹配，请检查资源是否用错，如果未用错，请联系相关人员处理
18103	资源参数不存在（指针为NULL）	资源参数不存在，请检查资源是否正确
18104	资源路径打开失败	资源路径打开失败，请检查工作目录下是否存在该资源，或者该资源是否存在读写权限
18105	资源加载失败，workDir内未找到对应资源	请检查workDir中是否存在此资源，或者resDir是否设置正确，或者app是否有改路径的读写权限
18106	资源卸载失败, 卸载的资源未加载过	资源卸载失败, 卸载的资源未加载过
18200	引擎鉴权失败	引擎鉴权失败，引擎存在问题。请联系技术支持询问
18201	引擎动态加载失败	引擎动态加载失败，请联系技术支持询问
18202	引擎未初始化	引擎在使用前，需要调用engineInit初始化
18203	引擎不支持该接口调用	引擎不支持该接口调用，请查询对应的能力文档，使用正确的方法调用
18204	引擎craete函数指针为空	引擎存在问题，请联系技术支持询问
18300	SDK不可用	SDK存在异常，请联系技术支持询问
18301	SDK未初始化	在使用大模型前请先初始化 SDK，如果有调用 uninit 方法，再次使用大模型交互时需要重新初始化。
18302	SDK初始化失败	请根据init接口回调中返回的错误码参考此文档做对应检查
18303	SDK 已经初始化	重复初始化导致，使用能力时，SDK 只需要初始化一次，请检查 SDK 初始化逻辑是否存在多次初始化。
18304	不合法参数	请参考demo及集成文档仔细检查所传参数是否正确。
18305	SDK会话handle为空	请检查代码逻辑，handle是否被释放
18306	SDK会话未找到	SDK会话未找到
18307	SDK会话重复终止	SDK会话重复终止，请检查代码逻辑
18308	超时错误	请求超时
18309	SDK正在初始化中	SDK正在初始化中，请检查代码逻辑
18310	SDK会话重复开启	SDK会话重复开启，请检查代码逻辑
18311	sdk同一能力并发路数超出最大限制	sdk同一能力并发路数超出最大限制
18312	此实例已处在运行态，禁止单实例并发运行	SDK同一能力单实例不支持并发
18400	工作目录无写权限	在设置 workDir 时，请确保该工作路径有读写权限。若无法设置读写权限，请修改为有读写权限的工作路径。
18401	设备指纹获取失败，设备未知	采集不到设备指纹
18402	文件打开失败	请检查日志中所打印的文件是否存在，以及对应路径下是否有读权限。
18403	内存分配失败	请联系技术支持询问
18404	设备指纹比较失败	请联系技术支持询问
18500	未找到该参数 key	请参照demo或集成文档仔细检查参数名拼写
18501	参数范围溢出，不满足约束条件	请根据文档检查调用 SDK 方法时所传参数范围，需要确保所传参数符合协议约束要求
18502	SDK 初始化参数为空	请根据 SDK 集成文档检查 SDK 初始化代码，确保必填参数有值且合法
18503	SDK 初始化参数中 appId 为空	appId 为空值，请在 SDK 初始化时传入正确的 appId 值
18504	SDK 初始化参数中 apiKey为空	apiKey为空值，请在 SDK 初始化时传入正确的 apiKey值
18505	SDK 初始化参数中 apiSecret 为空	apiSecret 为空值，请在 SDK 初始化时传入正确的 apapiSecret 值
18506	ability参数为空	请检查代码逻辑，参数是否未传入
18507	input参数为空	请检查代码逻辑，参数是否未传入
18508	输入数据参数Key不存在	请检查代码逻辑，参数key是否不符合该引擎
18509	必填参数缺失	请参考demo或者文档检查是否漏传必填参数
18510	output参数缺失	引擎输出参数异常，请联系技术支持询问
18520	不支持的编解码类型	请检查送入的数据是否符合要求
18521	编解码handle指针为空	请检查代码逻辑，handle是否被释放
18522	编解码模块条件编译未打开	请联系技术支持询问
18523	编码错误	请联系技术支持询问
18524	解码错误	请联系技术支持询问
18600	协议中时间戳字段缺失	协议文件异常，请联系技术支持询问
18601	协议中未找到该能力ID	调用的能力不在该SDK中，请检查SDK是否使用错误，或者调用能力id是否写错
18602	协议中未找到该资源ID	appid没有该资源的使用权限
18603	协议中未找到该引擎ID	协议存在问题，请联系技术支持询问
18604	协议中引擎个数为0	协议存在问题，请联系技术支持询问
18605	协议未被初始化解析	协议存在问题，请联系技术支持询问
18606	协议能力接口类型不匹配	协议存在问题，请联系技术支持询问
18607	预置协议解析失败	协议存在问题，请联系技术支持询问
18700	通用网络错误	请检查网络连接是否正常
18701	网络不通	请检查网络连接是否正常
18702	网关检查不过	检查设备时间是否正确；请检查 SDK 初始化时所传 apiKey、apiScrect 是否正确;
18703	云端响应格式不对	请检查网络是否可以正常访问外网
18704	应用未注册	appid存在问题，请检查 appid 是否正确
18705	应用 ApiKey & ApiSecret 校验失败	请检查 apiKey、apiSecret 是否正确
18706	引擎不支持的平台架构	请检查运行的设备平台引擎是否支持
18707	授权已过期	请检查授权期限
18708	无可用授权	没有授权或者授权已满
18709	未找到该app绑定的能力	请检查该appid是否申请该能力
18710	未找到该app绑定的能力资源	该appid没有该资源的使用权限，请联系技术支持询问
18711	JSON操作失败	请联系技术支持询问
18712	网络请求 404 错误	请检查网络是否通畅
18713	设备指纹安全等级不匹配	设备指纹安全等级不符合要求
18714	应用信息有误	服务端无法查询到api_key，请检查api_key和api_secret信息是否填写正确
18715	未找到该SDK ID	SDK异常，请联系技术支持询问
18716	未找到该组合能力集合	请检查使用的能力是否是该appid所申请的能力
18717	SDK授权不足	授权数量已满
18718	无效授权应用签名	应用签名异常，请联系技术支持询问
18719	应用签名不唯一	应用签名异常，请联系技术支持询问
18720	能力schema不可用	请联系技术支持询问
18721	竞争授权: 未找到能力集模板	请联系技术支持询问
18722	竞争授权: 能力不在模板能力集模板中	请联系技术支持询问
18801	连接建立出错	请检查网络是否通畅
18802	结果等待超时	请检查网络是否通畅
18803	连接状态异常	请检查网络是否通畅
18902	并发超过路数限制	不支持并发
18903	大模型规划步骤为空	请检查请求数据的意图是否明确
18904	插件未找到	请检查是否使用了未存在的插件
18906	与大模型交互次数超限制
18907	运行超限制时长
18908	大模型返回结果格式异常	可能是因为大模型结果太多，导致30秒内没有返回完，从而引起SDK内部认为超时，建议使用异步调用。
18951	同一流式大模型会话，禁止并发交互请求
18952	输入数据为空或异常
19001	设备级授权: 设备被禁用
19002	设备级授权: 协议解析失败
19003	设备级授权: 本地缓存获取失败
19004	设备级授权: 无网络
19005	设备级授权: 授权未找到
19006	设备级授权: 设备授权获取失败
19007	设备级授权: 当前设备处于黑名单
19008	设备级授权: 当前设备不在白名单
19010	设备级授权: 鉴权参数非法
20011	设备级授权: 不匹配的appid

# 13.2 部分云端错误码

备注：如出现下述列表中没有的错误码，可到这里 (opens new window) 查询。

错误码	错误描述	说明	处理方式
10005	licc fail	appid授权失败	确认appid是否正确，是否开通了听写服务
10006	Get audio rate fail	获取某个参数失败	检查报错信息中的参数是否正确上传
10007	get invalid rate	参数值不合法	检查报错信息中的参数值是否在取值范围内
10010	AIGES_ERROR_NO_LICENSE	引擎授权不足	请到控制台提交工单联系技术人员
10014	AIGES_ERROR_TIME_OUT	会话超时
10019	service read buffer timeout, session timeout	session超时	检查是否数据发送完毕但未关闭连接
10043	Syscall AudioCodingDecode error	音频解码失败	检查aue参数，如果为speex，请确保音频是speex音频并分段压缩且与帧大小一致
10101	engine inavtive	引擎会话已结束	检查是否引擎已结束会话但客户端还在发送数据，比如音频数据虽然发送完毕但并未关闭websocket连接，还在发送空的音频等
10114	session timeout	会话超时	检查整个会话是否已经超过了60s
10139	invalid param	参数错误	引擎编解码错误
10313	appid cannot be empty	appid不能为空	检查common参数是否正确上传，或common中的app_id参数是否正确上传或是否为空
10317	invalid version	版本非法	联系技术人员
11200	auth no license	没有权限	检查是否使用了未授权的功能，或者总的调用次数已超越上限
11201	auth no enough license	日流控超限	可联系商务提高每日调用次数
10160	parse request json error	请求数据格式非法	检查请求数据是否是合法的json
10161	parse base64 string error	base64解码失败	检查发送的数据是否使用了base64编码
10163	param validate error:/common 'app_id' param is required	缺少必传参数，或者参数不合法	检查报错信息中的参数是否正确上传
10165	invalid handle	无效的句柄	检查下传入第一帧音频时，是否上传了status=0
10200	read data timeout	读取数据超时	检查是否累计10s未发送数据并且未关闭连接

在这篇文章中：