20_api_intro_news_fetchcontentimages

59 阅读2分钟

获取任意链接正文图片

智能分析链接正文中的图片集合,解析任意链接,支持图片大小筛选。

gugudata_api_cover

1. 产品功能

  • 根据提供的文章链接智能分析出文章正文中包含的图片列表;
  • 支持传递图片大小以及图片分辨率条件对返回图片列表进行筛选;
  • 接口可同时返回原始 HTML 内容,供您二次解析使用;
  • 图片解析与标签处理基于机器学习;
  • 全接口支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3);
  • 全面兼容 Apple ATS;
  • 全国多节点 CDN 部署;
  • 接口极速响应,多台服务器构建 API 接口负载均衡;

2. API 文档

API 详情地址: www.gugudata.com/api/details…

接口请求地址: api.gugudata.com/news/fetchc…

返回格式: application/json; charset=utf-8

请求方式: POST

请求协议: HTTPS

请求示例: api.gugudata.com/news/fetchc…

接口预览: www.gugudata.com/preview/fet…

接口测试: api.gugudata.com/news/fetchc…

3. 请求参数

参数名参数类型是否必须默认值备注
appkeystringYOUR_APPKEY付费后获取的 APPKEY
urlstringYOUR_VALUE需要抓取正文的文章链接
limittypestringYOUR_VALUE对图片大小进行筛选条件类型,参数值为 size 或 ratio。size:按照图片大小 (KB) 进行筛选,ratio:按照图片分辨率 [宽,高] 进行筛选
limitvaluefloat / [int,int]YOUR_VALUE对图片大小进行筛选条件值,如果类型为 size,参数值格式为 float 类型的图片最小限制值(单位为 KB),如果类型为 ratio,参数值格式为 int 数组 [宽,高],分别限制最小宽与高(单位为像素)
imagewithtagboolfalse是否返回获取到的图片原始 img HTML 标签
htmlsourcecontentboolfalse是否返回文章页面原始 HTML 内容,供您二次解析或分析正文图片列表失败时使用,需要注意接口的性能问题

4. 返回参数

参数名参数类型备注
DataStatus.StatusCodeint接口返回状态码
DataStatus.StatusDescriptionstring接口返回状态说明
DataStatus.ResponseDateTimestring接口数据返回时间
DataStatus.DataTotalCountint符合条件的图片集合数量
Data.Urlstring文章 Url
Data.ImagesUrlstring[]文章正文中符合筛选条件的图片 Url 集合
Data.ImagesTagstring[]当传递 imagewithtag 参数值为 true 时,返回获取到的图片原始 img HTML 标签
Data.HTMLSourceContentstring文章的原始 HTML 内容(HTML 标签为 Unicode 编码)