利用 PHP 爬虫获取京东商品历史价格信息

214 阅读4分钟

在电商数据分析中,获取商品的历史价格信息对于商家、消费者以及市场分析师来说都具有重要意义。京东作为国内知名的电商平台,提供了商品历史价格信息的 API 接口。通过 PHP 爬虫技术,我们可以高效地调用这些接口,获取商品的历史价格数据,并进行进一步的分析和处理。本文将详细介绍如何使用 PHP 实现这一功能,并对 API 返回值进行详细说明。

一、准备工作

1. 注册京东开放平台账号

要使用京东商品历史价格信息 API,首先需要在京东开放平台(open.jd.com/)注册账号,并创建应用… App KeyApp Secret。这些是调用 API 所必需的凭证。

2. 安装必要的 PHP 库

确保你的 PHP 环境中已经安装了以下库:

  • cURL:用于发起 HTTP 请求。
  • json_decode:用于解析 JSON 数据。

如果你使用的是 Composer,可以在 composer.json 文件中添加以下依赖:

{
    "require": {
        "php": "^7.4 || ^8.0"
    }
}

二、代码实现

以下是一个完整的 PHP 示例代码,展示如何调用京东商品历史价格信息 API,并处理返回的数据。

1. 发起 HTTP 请求

使用 cURL 向京东 API 发起请求,并获取返回的 JSON 数据。

<?php
function get_jd_product_history_price($app_key, $app_secret, $sku_id) {
    $timestamp = time();
    $sign = generate_signature($app_key, $app_secret, $timestamp);

    $api_url = "https://api.jd.com/routerjson";
    $params = [
        'method' => 'item_history_price',
        'app_key' => $app_key,
        'timestamp' => $timestamp,
        'v' => '2.0',
        'sign_method' => 'md5',
        'sign' => $sign,
        'param_json' => json_encode(['skuIds' => $sku_id])
    ];

    $query_string = http_build_query($params);
    $url = $api_url . '?' . $query_string;

    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3');
    $response = curl_exec($ch);
    curl_close($ch);

    return $response;
}

function generate_signature($app_key, $app_secret, $timestamp) {
    // 这里需要根据京东 API 文档实现签名生成逻辑
    // 示例:MD5(appKey + timestamp + appSecret)
    return md5($app_key . $timestamp . $app_secret);
}
?>

2. 解析返回的 JSON 数据

解析 API 返回的 JSON 数据,并提取商品的历史价格信息。

<?php
function parse_jd_product_history_price($response) {
    $data = json_decode($response, true);

    if ($data['code'] == '0') {
        $items = $data['jingdong_item_history_price_response']['items'];
        foreach ($items as $item) {
            echo "商品 ID: " . $item['num_iid'] . "\n";
            echo "商品标题: " . $item['title'] . "\n";
            echo "商品详情页 URL: " . $item['detail_url'] . "\n";
            echo "商品图片 URL: " . $item['pic_url'] . "\n";
            echo "历史最低价格: " . $item['lower_price'] . "\n";
            echo "历史最低价格日期: " . $item['lower_date'] . "\n";
            echo "当前价格: " . $item['current_price'] . "\n";

            foreach ($item['item'] as $price_info) {
                echo "日期: " . $price_info['date'] . "\n";
                echo "价格: " . $price_info['price'] . "\n";
                echo "折扣: " . $price_info['discount'] . "\n";
            }
        }
    } else {
        echo "API 请求失败,错误信息: " . $data['errorMessage'] . "\n";
    }
}
?>

3. 主程序

在主程序中调用上述函数,获取并展示商品的历史价格信息。

<?php
$app_key = 'your_app_key'; // 替换为你的 App Key
$app_secret = 'your_app_secret'; // 替换为你的 App Secret
$sku_id = '123456'; // 替换为商品的 SKU ID

$response = get_jd_product_history_price($app_key, $app_secret, $sku_id);
parse_jd_product_history_price($response);
?>

三、API 返回值说明

京东商品历史价格信息 API 的返回值是一个 JSON 对象,其结构如下:

返回值示例

{
    "code": "0",
    "errorMessage": "success",
    "jingdong_item_history_price_response": {
        "items": [
            {
                "num_iid": "1234567890",
                "title": "商品标题",
                "detail_url": "https://item.jd.com/1234567890.html",
                "pic_url": "https://img10.360buyimg.com/n1/s200x200_jfs/t1/123456/1/1234567890.jpg",
                "lower_price": "100.00",
                "lower_date": "2024-10-01",
                "current_price": "120.00",
                "item": [
                    {
                        "date": "2024-10-01",
                        "price": "100.00",
                        "discount": "无"
                    },
                    {
                        "date": "2024-10-02",
                        "price": "110.00",
                        "discount": "无"
                    }
                ]
            }
        ]
    }
}

返回值字段说明

  • code:返回的状态码,表示请求的结果。0 表示成功,其他值表示失败。

  • errorMessage:错误信息,描述了返回状态码对应的错误原因。

  • jingdong_item_history_price_response:商品历史价格信息的响应数据。

    • items:商品列表,包含多个商品的历史价格信息。

      • num_iid:商品的唯一标识 ID。

      • title:商品标题。

      • detail_url:商品详情页的 URL。

      • pic_url:商品图片的 URL。

      • lower_price:商品历史最低价格。

      • lower_date:历史最低价格的日期。

      • current_price:商品当前价格。

      • item:商品在不同时间点的价格信息列表。

        • date:价格记录的日期。
        • price:该日期的价格。
        • discount:折扣信息(如果有)。

四、注意事项

  1. API 使用限制

    • 京东 API 可能对请求频率和数据量有限制。建议在实际使用中合理安排请求间隔,避免被封禁。
  2. 数据隐私

    • 确保遵守京东开放平台的使用条款,不要滥用数据。
  3. 异常处理

    • 在请求过程中可能会遇到网络问题、API 限制或其他错误。建议使用 try-catch 语句捕获异常,并合理处理。
  4. 签名生成

    • 根据京东 API 文档,生成签名是调用 API 的必要步骤。确保正确实现签名生成逻辑。

五、总结

通过上述步骤和代码,你可以使用 PHP 爬虫技术获取京东商品的历史价格信息,并将其保存到本地文件或数据库中。希望这个示例对你有所帮助!