小红书评论数据一键获取,item_reviewAPI接口讲解

3 阅读3分钟

小红书评论数据获取可通过官方API接口实现,其中item_review API是核心工具,以下从接口特性、调用流程、数据结构、合规要点四方面系统解析:

1. 接口特性与能力

  • 核心功能:获取指定笔记的评论列表(含子评论回复),支持按时间/热度排序,分页参数控制数据量(默认每页20条,可调整至2000条)。
  • 数据字段:评论内容、评论时间、用户昵称、用户ID、点赞数、回复链等,部分接口支持关联用户画像(如地域、兴趣标签)。
  • 扩展能力:结合笔记详情API可打通“内容-用户-交易”数据链路,支撑舆情监控、用户画像构建、竞品分析等场景。

2. 调用流程与示例

  • 前置条件:注册小红书开放平台账号,完成企业/个人认证,创建应用获取App Key、App Secret及access_token。

  • 请求方式:HTTP GET,需携带签名验证(MD5加密,参数按ASCII升序排序后拼接App Secret)。

  • 示例代码(Python)

    python
    import requests
    import hashlib
    import time
    
    def get_comments(note_id, access_token, page=1, page_size=20):
        url = f"https://api.xiaohongshu.com/v2/notes/{note_id}/comments"
        timestamp = str(int(time.time()))
        sign_str = f"app_key{note_id}{page}{page_size}{timestamp}app_secret"
        sign = hashlib.md5(sign_str.encode('utf-8')).hexdigest()
        params = {
            "access_token": access_token,
            "page": page,
            "limit": page_size,
            "timestamp": timestamp,
            "sign": sign
        }
        response = requests.get(url, params=params)
        return response.json() if response.status_code == 200 else None
    
  • 分页处理:通过cursor参数遍历多页数据,响应中的has_more字段指示是否还有后续数据。

3. 数据结构与解析

  • 响应示例

    json
    {
      "data": {
        "comments": [
          {
            "id": "comment_123",
            "content": "产品体验反馈",
            "create_time": "2025-01-23 10:00:00",
            "user": {
              "nickname": "用户昵称",
              "user_id": "user_456"
            },
            "like_count": 15,
            "replies": [
              {"content": "回复内容", "user": {"nickname": "回复者"}}
            ]
          }
        ],
        "total": 100,
        "page": 1,
        "page_size": 20
      }
    }
    
  • 关键字段total(总评论数)、comments(评论数组)、replies(子评论列表)。

4. 合规与风险控制

  • 权限申请:需明确使用场景(如内容分析、工具开发),审核通过后获得接口调用权限;企业账号权限更广(如批量调用、商业数据获取)。
  • 频率限制:通常每分钟≤100次,超限触发429错误,需采用缓存+重试机制。
  • 隐私保护:禁止爬取用户隐私数据(如手机号、地址),数据使用需符合《个人信息保护法》及小红书数据政策。
  • 反爬策略:官方API为合法途径,非官方爬虫易触发封禁;若使用爬虫,需模拟User-Agent、使用代理IP池、设置请求间隔≥1秒。

5. 替代方案与工具

  • 官方工具:小红书开放平台提供数据推送API,支持表单数据实时回传(如用户提交的姓名、手机号等)。
  • 第三方工具:如实在RPA可自动化登录、评论提取、数据保存流程,适合多笔记大批量采集,内置频率控制与隐私脱敏功能。
  • 浏览器扩展:部分Edge/Chrome扩展支持一键导出评论至CSV,仅限一级评论,需注意合规性。

总结:通过item_review API可高效、合法获取小红书评论数据,需严格遵守平台规则与法律要求,确保数据使用的安全与合规性。如需进一步操作(如代码调试、数据可视化),可结合Python的requests库与pandas库实现。