Swift爬虫程序

news2026/3/27 4:26:16

以下是一个简单的Swift爬虫程序，用于从前程无忧深圳地区招聘财务、会计的数据爬取数据：

import Foundation
import SwiftSoup

// 创建一个请求对象，指定代理信息
var request = URLRequest(url: URL(string: "https://www.51job.com/zh/campus/zs.html")!)
request.httpProxyHost = "jshk.com.cn"


// 创建一个请求任务对象
var task = URLSession.shared.dataTask(with: request) { data, response, error in

    // 检查是否有错误发生
    if let error = error {
        print("Error: \(error.localizedDescription)")
        return
    }

    // 检查请求是否成功
    guard let data = data else {
        print("Error: No data received")
        return
    }

    // 使用SwiftSoup解析HTML数据
    let doc = try! SwiftSoup.parse(data)

    // 获取招聘财务、会计的所有列表项
    let elements = doc.select("li[data-type='job']")
    
    // 遍历列表项，获取每个列表项的数据
    for element in elements {
        
        // 获取列表项的标题
        let title = element.select("a").text()
        
        // 获取列表项的链接
        let link = element.select("a").attribute("href")
        
        // 打印标题和链接
        print("Title: \(title)")
        print("Link: \(link)")
    }
}

// 发送请求
task.resume()

注意：这个程序只是一个基本的示例，可能需要根据实际情况进行修改。例如，可能需要处理更复杂的HTML结构，或者需要从网页中提取更复杂的数据。此外，爬虫程序可能需要遵守网站的使用协议，并且应该尽量减少对网站服务器的负载。在进行爬虫操作时，应该尊重网站的版权和隐私权，不应滥用爬虫程序进行非法或不道德的操作。在这里插入图片描述