# 图片文档还原 API 文档

# 接口说明

内容 说明
传输方式 ws[s](为提高安全性,强烈推荐wss)
请求地址 ws(s): //ws-api.xf-yun.com/v1/private/ma008db16
注:服务器IP不固定,为保证您的接口稳定,请勿通过指定IP的方式调用接口,使用域名方式调用
请求行 GET /v1/private/ma008db16 HTTP/1.1
接口鉴权 签名机制,详情请参照下方鉴权说明
字符编码 UTF-8
响应格式 统一采用JSON格式
开发语言 任意,只要可以向讯飞云服务发起HTTP请求的均可
适用范围 任意操作系统,但因不支持跨域不适用于浏览器
图片格式 jpg/jpeg/png/bmp
图片大小 base64编码后大小不超过10M

# 鉴权说明

在调用业务接口时,请求方需要对请求进行签名,服务端通过签名来校验请求的合法性。 通过在请求地址后面加上鉴权相关参数的方式,参数具体如下: 示例url:

ws://ws-api.xf-yun.com/v1/private/ma008db16?host=ws-api.xf-yun.com&date=Thu%2C+24+Mar+2022+03%3A47%3A02+GMT&authorization=YXBpX2tleT0iMWRhYTM5NGJkZDRkYjhkNTVkNTJkMzg3MmY4NGFlZGEiLCBhbGdvcml0aG09ImhtYWMtc2hhMjU2IiwgaGVhZGVycz0iaG9zdCBkYXRlIHJlcXVlc3QtbGluZSIsIHNpZ25hdHVyZT0iSlBRRnhHWE83TmpMSkoxZnd5dS9FSHF0L2tnZmUxb0tJNktQMkRoMmE3TT0i

鉴权参数:

参数 类型 必须 说明 示例
host string 请求主机 api.xf-yun.com
date string 当前时间戳,RFC1123格式("EEE, dd MMM yyyy HH:mm:ss z") Thu, 24 Mar 2022 03:47:02 GMT
authorization string 使用base64编码的签名相关信息(签名基于hamc-sha256计算) 参考下方详细生成规则

• date参数生成规则:

date必须是UTC+0或GMT时区,RFC1123格式(Thu, 24 Mar 2022 03:47:02 GMT)。
服务端会对date进行时钟偏移检查,最大允许300秒的偏差,超出偏差的请求都将被拒绝。

• authorization参数生成格式:

1)获取接口密钥APIKey 和 APISecret。
在讯飞开放平台控制台,创建一个应用后打开图片文档还原页面可以获取,均为32位字符串。
2)参数authorization base64编码前(authorization_origin)的格式如下。

api_key="$api_key",algorithm="hmac-sha256",headers="host date request-line",signature="$signature"

其中 api_key 是在控制台获取的APIKey,algorithm 是加密算法(仅支持hmac-sha256),headers 是参与签名的参数(见下方注释)。
signature 是使用加密算法对参与签名的参数签名后并使用base64编码的字符串,详见下方。

注: headers是参与签名的参数,请注意是固定的参数名("host date request-line"),而非这些参数的值。

3)signature的原始字段(signature_origin)规则如下。

signature原始字段由 host,date,request-line三个参数按照格式拼接成,
拼接的格式为(\n为换行符,’:’后面有一个空格):

host: $host\ndate: $date\n$request-line

假设

请求url =  wss://ws-api.xf-yun.com/v1/private/ma008db16
date = "Thu, 24 Mar 2022 03:51:59 GMT"

那么 signature原始字段(signature_origin)则为:

host: ws-api.xf-yun.com
date: Thu, 24 Mar 2022 03:51:59 GMT
GET /v1/private/ma008db16 HTTP/1.1

4)使用hmac-sha256算法结合apiSecret对signature_origin签名,获得签名后的摘要signature_sha。

signature_sha=hmac-sha256(signature_origin,$apiSecret)

其中 apiSecret 是在控制台获取的APISecret

5)使用base64编码对signature_sha进行编码获得最终的signature。

signature=base64(signature_sha)

假设

APISecret = "apisecretXXXXXXXXXXXXXXXXXXXXXXX"	
date = "Thu, 24 Mar 2022 03:51:59 GMT"

则signature为

signature="NcfeJm5UkdVDGr+VAUqrqW+wMGlNyAfGXrM5sPmeXSA="

6)根据以上信息拼接authorization base64编码前(authorization_origin)的字符串,示例如下。

api_key="apikeyXXXXXXXXXXXXXXXXXXXXXXXXXX", algorithm="hmac-sha256", headers="host date request-line", signature="NcfeJm5UkdVDGr+VAUqrqW+wMGlNyAfGXrM5sPmeXSA="

注: headers是参与签名的参数,请注意是固定的参数名("host date request-line"),而非这些参数的值。

7)最后再对authorization_origin进行base64编码获得最终的authorization参数。

authorization = base64(authorization_origin)
示例结果为:
authorization=YXBpX2tleT0iYXBpa2V5WFhYWFhYWFhYWFhYWFhYWFhYWFhYWFhYWFgiLCBhbGdvcml0aG09ImhtYWMtc2hhMjU2IiwgaGVhZGVycz0iaG9zdCBkYXRlIHJlcXVlc3QtbGluZSIsIHNpZ25hdHVyZT0iTmNmZUptNVVrZFZER3IrVkFVcXJxVyt3TUdsTnlBZkdYck01c1BtZVhTQT0i

# 鉴权结果

如果鉴权失败,则根据不同错误类型返回不同HTTP Code状态码,同时携带错误描述信息,详细错误说明如下:

HTTP Code 说明 错误描述信息 解决方法
401 缺少authorization参数 {"message":"Unauthorized"} 检查是否有authorization参数,详情见authorization参数详细生成规则
401 签名参数解析失败 {“message”:”HMAC signature cannot be verified”} 检查签名的各个参数是否有缺失是否正确,特别确认下复制的api_key是否正确
401 签名校验失败 {“message”:”HMAC signature does not match”} 签名验证失败,可能原因有很多。
1. 检查api_key,api_secret 是否正确 。
2.检查计算签名的参数host,date,request-line是否按照协议要求拼接 。
3. 检查signature签名的base64长度是否正常(正常44个字节) 。
403 时钟偏移校验失败 {“message”:”HMAC signature cannot be verified, a valid date or x-date header is required for HMAC Authentication”} 检查服务器时间是否标准,相差5分钟以上会报此错误

时钟偏移校验失败示例:

HTTP/1.1 403 Forbidden
Date: Mon, 30 Nov 2020 02:34:33 GMT
Content-Length: 116
Content-Type: text/plain; charset=utf-8
{
    "message": "HMAC signature does not match, a valid date or x-date header is required for HMAC Authentication"
}

# 请求参数

在调用业务接口时,都需要在 Http Request Body 中配置以下参数,请求数据均为json字符串。
请求参数示例:

{
    "header": {
        "app_id": "your_app_id",
        "status": 2,
    },
    "parameter": {
        "s15282f39": {
            "category": "ch_en_public_cloud",
            "result": {
                "encoding": "utf8",
                "compress": "raw",
                "format": "plain"
            }
        },
        "s5eac762f": {
            "result_type": "0",
            "result": {
                "encoding": "utf8",
                "compress": "raw",
                "format": "plain"
            }
        }
    },
    "payload": {
        "test": {
            "encoding": "jpg",
            "image": "iVBORw0KGgoAAAANSUhE......",
            "status": 3
        }
    }
}

请求参数说明:

参数名 类型 必传 描述
header Object 用于上传平台参数
header.app_id string 在平台申请的appid信息
header.status int 请求状态,可选值为:
0:开始
1:继续
2:结束
parameter Object 用于上传服务特性参数
parameter.s15282f39 Object 用于上传功能参数
parameter.s15282f39.category string ch_en_public_cloud:中英文识别
parameter.s15282f39.result Object 用于上传响应数据参数
parameter.s15282f39.result.encoding string 文本编码,可选值:utf8(默认)、 gb2312
parameter.s15282f39.result.compress string 文本压缩格式,可选值:raw(默认)、 gzip
parameter.s15282f39.result.format string 文本格式,可选值:plain(默认)、json、 xml
parameter.s5eac762f Object 用于上传功能参数
parameter.s5eac762f.result_type string 结果文件获,可选值:
0:excel
1:doc
2:ppt
parameter.s5eac762f.result Object 用于上传响应数据参数
parameter.s5eac762f.result.encoding string 文本编码,可选值:utf8(默认)、 gb2312
parameter.s5eac762f.result.compress string 文本压缩格式,可选值:raw(默认)、 gzip
parameter.s5eac762f.result.format string 文本格式,可选值:plain(默认)、json、xml
payload Object 用于上传请求数据
payload.test Object 输入数据,用于上传相关数据
payload.test.encoding string 图像编码,可选值:
jpg:jpg格式(默认)
jpeg:jpeg格式
png:png格式
bmp:bmp格式
payload.test.image string 图像base64编码后数据,最小尺寸:0B,最大尺寸:10485760B
payload.test.status int 数据状态,可选值:3 (一次性传完)

# 返回结果

如出现错误码,可到 这里 (opens new window) 查询。
返回参数示例:

{
	"header": {
		"code": 0,
		"message": "success",
		"sid": "aso00109045@hu17fb99c78420207882",
		"status": 1
	},
	"payload": {
		"result": {
			"format": "plain",
			"encoding": "utf8",
			"text": "UEsDBBQAAAAIA......",
			"compress": "raw"
		}
	}
}

返回参数说明:

参数名 类型 描述
header Object 协议头部,用于描述平台特性的参数
header.code int 返回码,0表示成功,其它表示异常
header.message string 错误描述
header.sid string 本次会话的id
header.status int 接口响应状态
payload Object 响应数据块
payload.result Object 输出数据
payload.result.compress string 文本压缩格式
payload.result.encoding string 文本编码
payload.result.format string 文本格式
payload.result.text string 文本数据,需要base64解码后写入文件

# 常见问题

# 图片文档还原的主要功能是什么?

答:可以识别文档、合同等形式的图片,生成保留内容格式的docx、pptx或xlsx文档。

# 图片文档还原支持什么语言?

答:目前支持中英文内容的识别。

# 图片文档还原对图片有什么要求吗?

答:图片格式支持jpg格式、jpeg格式、png格式、bmp格式,且需保证图像文件大小base64编码后不超过10MB。

# 图片文档还原支持什么应用平台?

答:目前支持WebAPI应用平台。

在线
咨询
建议
反馈
体验
中心