Python抓取淘宝商品信息API

605 阅读1分钟

淘宝已经成为许多人购物的首选平台,然而,淘宝官方并没有开放商品信息的 API 接口。那么,如何获取商品信息呢?

一种方法是使用 Python 的 requests 库和开发者工具,模拟浏览器的请求,直接从接口中获取所需的信息。具体步骤如下:

  1. 打开浏览器,进入淘宝商品搜索页面,搜索你想要的商品。接下来,打开开发者工具,切换到 Network 选项卡,并刷新页面。
  2. 在过滤器中输入“mtop.taobao.detail.getdetail”,该接口是用于获取商品详情的。点击进入该接口,查看 Headers 中的 Request URL,将该 URL 复制下来。
  3. 在 Python 中使用 requests 库发送 GET 请求,将复制下来的 URL 作为参数传入,并设置 headers,模拟浏览器发送请求。这样就可以得到接口的响应数据。
  4. 解析 json 数据,即可轻松获取商品信息。

值得注意的是,由于淘宝平台的防爬措施越来越严格,这种方法可能不太稳定。

如需获取帮助请联系我。

import requests
import json

url = 'https://acs.m.taobao.com/h5/mtop.taobao.detail.getdetail/6.0/'
params = {
    'type': 'jsonp',
    'data': '{"itemNumId":"542409646135"}',
    'callback': 'mtopjsonp1',
    'dataType': 'jsonp',
    'timeout': '20000',
    'isSec': '1',
    'jsonpIncPrefix': 'true',
    'version': '6.0'
}
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.1255.149 Safari/537.36'
}

response = requests.get(url, params=params, headers=headers)