网上有很多第三方小说网站提供小说下载,而下载的过程无非就是搜索书籍,然后找到下载链接点击下载即可。只是类似这种“良心”的小说网站实在是太少。大多数仅支持在线阅读。而如今,我却要利用这种为数不多的“良心”小说站点提供的书源来作为自己的书源接口。真是....让人唏嘘啊。希望大家还是抱着学习的心态来。本次主要是分享这种二次简易包装接口的方法。从而管中窥豹,举一反三。
tips:本次分享主要以学习交流为主,尊重书籍正版授权。
1.书源网站
这次示范的网站为一个第三方小说站点。通过站内搜索返回的内容知道返回的是html内容。当然,如果是直接返回json数据的话我也就没必要写这篇博文了。不过返回的html也是有操作空间的。
2.解析网页构建接口
先看本地php运行效果吧。单php文件:index.php
主要用到了php的DOMDocument和DOMXPath来解析网页内容,然后构建json数据返回。具体的代码中已做注释。闲话少叙,直接上代码。
<?php
// 创建 cURL 句柄
$ch = curl_init();
// 设置 cURL 选项
curl_setopt($ch, CURLOPT_URL, 'http://www.aixiashu.info/modules/article/search.php'); // 设置要访问的 URL
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 将响应保存为字符串而不直接输出
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); // 跟随重定向
// 设置 POST 参数
$postData = array(
'searchkey' => $_GET['book'], // 第一个参数及其值
'searchtype' => 'articlename' // 第二个参数及其值
);
curl_setopt($ch, CURLOPT_POST, true); // 设置为 POST 请求
curl_setopt($ch, CURLOPT_POSTFIELDS, $postData); // 设置 POST 参数
// 执行 cURL 请求并获取响应
$response = curl_exec($ch);
// 检查是否有错误发生
if (curl_errno($ch)) {
echo 'cURL Error: ' . curl_error($ch);
exit;
}
// 关闭 cURL 句柄
curl_close($ch);
// 输出响应内容
// echo $response;
// 创建一个 DOMDocument 对象
$dom = new DOMDocument();
$html = $response;
// 禁用标准的 libxml 错误,并启用用户错误处理
$libxml_previous_state = libxml_use_internal_errors(true);
// 解析
$dom->loadHTML($html);
// 清空 libxml 错误缓冲
libxml_clear_errors();
// 还原之前设置
libxml_use_internal_errors($libxml_previous_state);
$xpath = new DOMXPath($dom);
$autherElements =$xpath->query('//tr/td[contains(@class, "even")][2]');
$links = $xpath->query('//td[contains(@class, "even")]/a');
// 创建一个数组来存储结果对象
$resultArray = array();
// 遍历查询结果并将 href 属性和文本值组成数组对象
foreach ($links as $index => $anchor) {
$href = $anchor->getAttribute('href');
$bookId = extractBookId($href);
// 获取对应书的作者名
$autherElement = $autherElements->item($index);
$auther = $autherElement ? $autherElement->nodeValue : '';
$resultArray[] = array(
'href' => $href,
'text' => $anchor->nodeValue,
'bookid' => 'http://txt.aixiashu.info/modules/article/txtarticle.php?id='.$bookId,
'auther' => $auther
);
}
// 将数组转换为 JSON 格式
$jsonArray = json_encode($resultArray);
// 输出 JSON 数组
echo $jsonArray;
// 从 href 地址中提取 bookid 的函数
function extractBookId($href) {
$pattern = '/\/(\d+)\/$/';
preg_match($pattern, $href, $matches);
return isset($matches[1]) ? $matches[1] : null;
}
?>
将该php文件放到php站点运行,就相当于提供了一个书源查询下载的接口。怎么样,是不是很简单。这种利用第三方的接口二次“包装”作为自定义使用接口。我只能说,香是真滴香。但是,不道德。所以,只是提供给大家这种写自用接口的思路。不推荐使用哈。