淘宝上千万商品、品类齐全,会用精美的图片来展示商品。那么我们如何通过关键词来搜索淘宝上的商品获取链接,并将其图片分类保存下来呢?下面就用手工或代码封装接口的模式拿到数据。采集后商品信息完整,自动包含商品标题、价格、优惠价格、销量、商品 ID、商品链接、商品图片、描述图、详情描述店铺所在地、卖家信息等页面上有的信息均可以采集!
- 手动方式如下: 例如我们打开淘宝手机端或者 PC 端,搜索关键词 " 新款连衣裙",点击搜索,进入这个商品列表页面,我们就以推荐的这个关键词为例,点击进入商品列表详情页面。
2.点击鼠标右键可以查看源代码或者按照 F12 键拿到的商品列表页面的数据参数,包括标题,图片,商品价格,商品优惠券,优惠信息,库存数量,商品详情页面数据等参数。
3.3.封装taobao.item_search - 关键词搜索商品列表接口代码:
3.1请求方式:HTTP POST GET ;请求链接:c0b.cc/R4rbK2
3.2.请求参数:
请求参数:q=女装&start_price=0&end_price=0&page=1&cat=0&discount_only=&sort=&page_size=&seller_info=&nick=&ppath=&imgid=&filter=
参数说明:q:搜索关键字
cat:分类ID
start_price:开始价格
end_price:结束价格
sort:排序[bid,_bid,bid2,_bid2,_sale,_credit]
(bid:总价,bid2:商品价格,sale:销量,credit信用,加_前缀为从大到小排序)
page:页数
3.3请求代码示例,支持高并发请求(CURL、PHP 、PHPsdk 、Java 、C# 、Python...)
# coding:utf-8
"""
Compatible for python2.x and python3.x
requirement: pip install requests
"""
from __future__ import print_function
import requests
# 请求示例 url 默认请求参数已经做URL编码
url = "https://api-vx.Taobaoapi2014.cn/taobao/item_search/?key=<您自己的apiKey>&secret=<您自己的apiSecret>&q=女装&start_price=0&end_price=0&page=1&cat=0&discount_only=&sort=&page_size=&seller_info=&nick=&ppath=&imgid=&filter="
headers = {
"Accept-Encoding": "gzip",
"Connection": "close"
}
if __name__ == "__main__":
r = requests.get(url, headers=headers)
json_obj = r.json()
print(json_obj)