【全程踩坑实录】一杯咖啡时间,教你合法薅光淘宝/天猫 10W+ 买家评论!

108 阅读2分钟

0x00 开场白

做竞品分析、情感模型、还是商品舆情?官方不公开的“买家心里话”其实有正门可走。今天把我 2 天踩出的血路浓缩成 1 篇笔记,带你在 30 分钟内完成注册、授权、抓数三连击。

0x01 领取“入场券”

① 打开淘宝开放平台,用手机号或者微信注册。

② 控制台 → 应用管理 → 新建应用 → 类型选“自用”最省事。

③ 审核秒过,拿到 AppKey & AppSecret,先别急着复制,往下看。

0x02 开通“偷窥”权限

能力中心搜索 evaluate,会出现两个兄弟接口:

• taobao.item.comments.get(淘宝系)

• tmall.rate.items.detail(天猫系)

勾上→提交工单。官方提示 13 个工作日,实测凌晨提交上午就过。

0x03 30 行代码起飞

我用的是 Python 3.11,核心逻辑只有三步:拼参数→算签名→发请求。

import requests, time, hashlib, urllib.parse

APP_KEY = '你的Key'
APP_SECRET = '你的Secret'
ITEM_ID = '商品数字ID'

def build_url(item_id, page=1, size=20):
    base = 'https://eco.taobao.com/router/rest'
    payload = {
        'method': 'taobao.item.comments.get',
        'app_key': APP_KEY,
        'v': '2.0',
        'format': 'json',
        'timestamp': time.strftime('%Y-%m-%d %H:%M:%S'),
        'item_id': item_id,
        'page_no': page,
        'page_size': size
    }
    # 字典序 + MD5
    sign = ''.join([k + str(payload[k]) for k in sorted(payload)]) + APP_SECRET
    payload['sign'] = hashlib.md5(sign.encode()).hexdigest().upper()
    return base + '?' + urllib.parse.urlencode(payload)

resp = requests.get(build_url(ITEM_ID), timeout=5).json()
print(resp)

运行效果:一杯手冲咖啡没喝完,500 条评论已经落盘。

0x04 接口彩蛋

• 字段多到离谱:买家等级、匿名标识、追评、晒图原图 URL 统统有。

• 翻页黑科技:page_size 最大 100,循环 1000 次就是 10 万条。

• 实时性:新评论 T+0 可见,凌晨秒杀的差评都逃不掉。

0x05 常见翻车点

  1. 时间戳必须与服务器误差 < 5 分钟,建议直接 time.strftime('%Y-%m-%d %H:%M:%S')
  2. sign 计算漏掉任何参数都会返回 400,复制粘贴党慎入。
  3. 沙箱 Key 别拿去调正式环境,会 100% 报错。

0x06 彩蛋 × 2

把返回结果里的 rate_content 丢给 SnowNLP,情感得分 0.1 秒出图;再配合词云就是一份漂亮的周报 PPT。

结语

如果你也成功跑通,评论区留下“已上车”,一起把买家真话卷成生产力!