使用php语言抓取网站商品详情代码及解析效果展示

131 阅读1分钟

使用php语言抓取网站商品详情代码及解析效果展示

抓取网站商品详情需要使用爬虫技术,可以使用 PHP 的 CURL 库来发送 HTTP 请求,然后解析 HTML 页面,获取商品详情信息。以下是一个简单的示例代码:

// 定义要抓取的商品 URL  
$url = "https://example.com/product/123";  
  
// 发送 HTTP 请求,获取 HTML 页面内容  
$ch = curl_init();  
curl_setopt($ch, CURLOPT_URL, $url);  
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);  
$html = curl_exec($ch);  
curl_close($ch);  
  
// 解析 HTML 页面,获取商品详情信息  
$doc = new DOMDocument();  
@$doc->loadHTML($html);  
$xpath = new DOMXPath($doc);  
$name = $xpath->query("//h1[@class='product-name']/text()")->item(0)->nodeValue;  
$price = $xpath->query("//span[@class='price']/text()")->item(0)->nodeValue;  
$description = $xpath->query("//div[@class='product-description']/text()")->item(0)->nodeValue;  
  
// 输出商品详情信息  
echo "商品名称:$name\n";  
echo "商品价格:$price\n";  
echo "商品描述:$description\n";  
?>

这个示例代码中,我们首先定义了要抓取的商品 URL,然后使用 CURL 库发送 HTTP 请求,获取 HTML 页面内容。接着,我们使用 DOMDocument 和 DOMXPath 类解析 HTML 页面,获取商品名称、价格和描述信息。最后,我们输出商品详情信息。需要注意的是,这个示例代码中没有考虑一些异常情况,例如网络连接失败、页面内容无法解析等。在实际应用中,需要根据具体情况进行异常处理。

解析效果展示:

图片.png

更多