以下是一个简单的Swift爬虫程序,用于从前程无忧深圳地区招聘财务、会计的数据爬取数据:
import Foundation
import SwiftSoup
// 创建一个请求对象,指定代理信息
var request = URLRequest(url: URL(string: "https://www.51job.com/zh/campus/zs.html")!)
request.httpProxyHost = "jshk.com.cn"
// 创建一个请求任务对象
var task = URLSession.shared.dataTask(with: request) { data, response, error in
// 检查是否有错误发生
if let error = error {
print("Error: \(error.localizedDescription)")
return
}
// 检查请求是否成功
guard let data = data else {
print("Error: No data received")
return
}
// 使用SwiftSoup解析HTML数据
let doc = try! SwiftSoup.parse(data)
// 获取招聘财务、会计的所有列表项
let elements = doc.select("li[data-type='job']")
// 遍历列表项,获取每个列表项的数据
for element in elements {
// 获取列表项的标题
let title = element.select("a").text()
// 获取列表项的链接
let link = element.select("a").attribute("href")
// 打印标题和链接
print("Title: \(title)")
print("Link: \(link)")
}
}
// 发送请求
task.resume()
注意:这个程序只是一个基本的示例,可能需要根据实际情况进行修改。例如,可能需要处理更复杂的HTML结构,或者需要从网页中提取更复杂的数据。此外,爬虫程序可能需要遵守网站的使用协议,并且应该尽量减少对网站服务器的负载。在进行爬虫操作时,应该尊重网站的版权和隐私权,不应滥用爬虫程序进行非法或不道德的操作。