10_api_intro_imagerecognition_pdf2format

36 阅读1分钟

PDF 解析格式化输出 API 数据接口

支持输出 TEXT HTML XML TAG,多种格式输出,超精准识别率。

gugudata_api_cover

1. 产品功能

  • 通用的识别接口, 支持标准 PDF 文件解析;
  • 多种格式输出,支持 TEXT HTML XML TAG;
  • HTML 包含完美排版格式;
  • 基于机器学习不断提高的识别率;
  • 1M 文件毫秒级识别性能;
  • 数据持续更新与维护;
  • 全接口支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3);
  • 全面兼容 Apple ATS;
  • 全国多节点 CDN 部署;
  • 接口极速响应,多台服务器构建 API 接口负载均衡;
  • 接口调用状态与状态监控

2. API 文档

接口详情: www.gugudata.com/api/details…

接口地址: api.gugudata.com/imagerecogn…

返回格式: application/json; charset=utf-8

请求方式: POST

请求协议: HTTPS

请求示例: api.gugudata.com/imagerecogn…

数据预览: www.gugudata.com/preview/pdf…

接口测试: api.gugudata.com/imagerecogn…

3. 请求参数

参数名参数类型是否必须默认值备注
appkeystringYOUR_APPKEY付费后获取的 APPKEY
typestringYOUR_VALUE定义输出格式,可选 text|html|xml|tag
pdffilefileYOUR_VALUE文件格式参数,待转换的 PDF 文件

4. 返回参数

参数名参数类型备注
DataStatus.StatusCodeint接口返回状态码
DataStatus.StatusDescriptionstring接口返回状态说明
DataStatus.ResponseDateTimestring接口数据返回时间
DataStatus.DataTotalCountint此条件下的总数据量,一般用于分页计算
Data.Datastring接口解析 PDF 返回数据,格式由 type 参数决定