Swift爬虫采集唯品会商品详情

news2024/11/18 0:00:33

我有个朋友之前在唯品会开的店,现在想转战其他平台,想要店铺信息商品信息全部迁移过去,如果想要人工手动操作就有点麻烦了,然后有天找到我 ,让我看看能不能通过技术手段实现商品信息迁移。嫌来无事,写了下面的一段代码并成功运行。

在这里插入图片描述

以下是一个使用 Swift 编写的简单的网络爬虫程序。这个程序使用了 Swift 的内置库 URLSession 来发送请求和接收响应,以及 JSONSerialization 来解析 JSON 数据。

import Foundation

class WebCrawler {
    var response: Data?

    func startCrawling(url: String) {
        let proxy = "duoip:8000"
        let proxy = "jshk.com.cn/mb/reg.asp?kefu=xjy&csdn" 获取免费IP
        let session = URLSession(configuration: .default, proxy: proxy, secureHTTPLinks: false, shouldUseHTTPCookies: false)
        let task = session.dataTask(with: url) { (data, response, error) in
            if let error = error {
                print("Error: \(error.localizedDescription)")
                return
            }
            self.response = data
            if let data = data, let json = try? JSONSerialization.jsonObject(with: data, options: []) as? [String: Any] {
                print(json)
            }
        }
        task.resume()
    }
}

在这个程序中,我们首先定义了一个名为 WebCrawler 的类,它有一个名为 response 的变量用于存储我们从服务器接收到的响应。

然后我们定义了一个名为 startCrawling 的方法,它接收一个名为 url 的参数,表示我们想要爬取的 URL。在方法内部,我们首先创建了一个名为 proxy 的变量,它表示我们的代理服务器的地址(在这个例子中,我们使用的是duoip提供的免费服务器)。

然后我们创建了一个名为 session 的变量,它表示我们的网络会话。在创建这个会话时,我们设置了几个参数,包括使用代理服务器、不使用 HTTP 链接和不使用 HTTP 首部。

接下来,我们创建了一个名为 task 的变量,它表示我们发送请求的任务。在创建这个任务时,我们设置了三个参数:要发送的 URL、一个闭包用于处理响应和错误,以及一个布尔值用于设置是否应该使用 HTTP 首部。

在闭包内部,我们首先检查是否有错误发生,如果有,我们就打印出错误信息并返回。然后我们检查 response 是否为空,如果为空,我们就设置它为我们从服务器接收到的响应。最后,我们检查 data 是否为空,如果为空,我们就返回。如果 data 不为空,我们就尝试使用 JSONSerialization 将它解析为 JSON 对象,并打印出这个 JSON 对象。

最后,我们调用 task.resume() 来启动我们的网络请求。

请注意,这个程序只是一个基本的网络爬虫,它可能无法处理所有的情况。例如,如果服务器返回的响应不是 JSON 格式,或者服务器拒绝了我们的请求,这个程序就无法正确处理。在实际使用中,你可能需要根据你的具体需求来修改和扩展这个程序。同时,使用代理服务器爬取网站可能会被网站认为是恶意行为,因此在使用时需要注意。

上面就是我通过swift爬虫实现的唯品会上的商品数据的集中采集并下载,并且每一条都做了详细的解说,如果有不足之处,欢迎大佬评论区留言讨论。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1314066.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

高速大文件传输对企业的重要性

随着信息技术的迅猛发展,企业在日常运营中越来越频繁地涉足大文件的传输领域。大文件传输是指在企业或个人之间传递容量较大的文件,例如高分辨率图像、视频、数据库备份等。过去,这样的传输可能需要数小时甚至更长时间,但随着业务…

一种用于心音分类的轻量级1D-CNN+DWT网络

这是由National Institute of Technology Rourkela, Central University of Rajasthan发布在2022 ICETCI的论文,利用离散小波变换(DWT)得到的多分辨率域特征对1D-CNN模型进行心音分类训练。 预处理& DWT 由于FHS和各种病理声的频率范围在500hz以下[5]&#xff…

嵌入式人工智能(钱多?好学?前景好?)

概念 嵌入式人工智能(Embedded AI)是指将人工智能(AI)技术集成到各种设备和系统中,使其具备智能化和自主性。与传统的中央化计算模型不同,嵌入式人工智能将AI能力嵌入到设备本身,使其能够在本地…

win10环境下git安装和基础操作

简述 关于git的作用就不多赘述了,配合GitHub,达到方便人们日常项目维护和管理,每一次项目增删改查都可以看的清清楚楚,方便团队协作和个人项目日常维护。 下载git 首先我们自然是要到官网下载git,下载地址为https:/…

win10上使用pyinstaller工具打包python后在win7无法运行(运行报错)

问题现象 win10中使用pyinstaller工具打包python为exe后,在win7上运行报错: 无法启动此程序,因为计算机中丢失api-ms-win-crt-process-l1-1-0.dll。尝试重新安装该程序以解决此问题。或 无法启动此程序,因为计算机中丢失api-ms…

PPT插件-好用的插件-PPT 素材该怎么积累-大珩助手

PPT 素材该怎么积累? 使用大珩助手中的素材库功能,将Word中的,或系统中的文本文件、图片、其他word文档、pdf,所有见到的好素材,一键收纳。 步骤:选中文件,按住鼠标左键拖到素材库界面中&…

C语言——输出魔方阵

目录 一、前言: 二、算法设计: 三、代码实现: 五、效果展示: 一、前言: 魔方矩阵又称幻方,是有相同的行数和列数,并在每行每列、对角线上的和都相等的矩阵。魔方矩阵中的每个元素不能相同。你…

docker小白第四天

docker小白第一天 什么是镜像 1、是一种轻量级、可执行的独立软件包,它包含运行某个软件所需的所有内容,我们把应用程序和配置依赖打包好形成一个可交付的运行环境(包括代码、运行时需要的库、环境变量和配置文件等),这个打包好的运行环境就…

Python爬虫-解决使用requests,Pyppeteer,Selenium遇到网站显示“您的连接不是私密连接”的问题|疑难杂症解决(2)

前言 本文是该专栏的第13篇,后面会持续分享python爬虫案例干货,记得关注。 相信很多同学在处理爬虫项目的时候,会遇到一些网站出现如下图所示的情况: 就是当你不论是使用requests进行协议请求,还是使用自动化框架pyppeteer或者selenium都会出现上图中的情况。这相信会或多…

nodejs微信小程序+python+PHP血液中心管理平台的设计与实现-计算机毕业设计推荐

在二十一世纪的今天,我国献血总量已经不容小觑,在全国人民的不懈努力下,贫血、缺血的病人已经有了足够的血液保障。与此同时,采血工作和血液入库、出库等工作也日愈繁重。为进一步提高采血工作和血液中心的工作效率,开…

3小时快速入门自动化测试 —— Selenium测试工具

自动化测试 自动化测试简单来说就是利用自动化测试工具和自动化测试脚本来完成指定的测试任务,测试启动过程无需人工参与,但自动化测试之前的准备工作需要人工手动配置好。它是一种将重复性、繁琐的测试任务交给计算机自动执行的方法,能够显…

vue中哪些数组的方法可以做到响应式

Vue2 中为什么直接通过数组的索引修改元素是不会触发视图更新 vue2 为什么不直接监听数组 Vue2 对于数组提供了一些变异方法 重写数组方法源码分析 定义拦截器将拦截器挂载到数组上面收集依赖 扩展:理解Vue2如何解决数组和对象的响应式问题 对复杂对象的处理 复杂对…

电脑自动关机怎么设置?

电脑自动关机怎么设置?如果你是一名上班族,工作忙起来很多事情都会忘记做,有时候忙到很晚后紧急下班,就会忘记给电脑关机,电脑如果经常不关机,那么电脑就会超负荷的运转,大家都知道电脑的寿命是…

云端赋能大湾区:华为云照亮数字化转型之路

编辑:阿冒 设计:沐由 在中国的经济版图上,大湾区是极其重要的增长引擎。这块富有活力和创新力的经济区域里,荟聚了大量的高新技术企业,以及一批创新孵化器和科研机构,产业升级和技术创新的氛围格外浓烈。 1…

OpenCV中的格式转换

目录 1. 前言2. 采集到播放数据流的走向3. OpenCV中的格式转换3.1 RGB3.2 YUV3.2.1 YUV420{P}3.2.2 YUV420SP 4 简单应用5. 关联文章 1. 前言 实际音视频开发过程芯片是做了硬件加速的,主要涉及到视频编解码。二次开发过程中需要对SDK做一定的封装使用才行。 写这…

2021年数维杯国际大学生数学建模A题新冠肺炎背景下港口资源优化配置策略求解全过程文档及程序

2021年数维杯国际大学生数学建模 A题 新冠肺炎背景下港口资源优化配置策略 原题再现: 2020年初,新型冠状病毒(COVID-19)在全球迅速蔓延。根据世界卫生组织2021年7月31日的报告,新冠病毒疫情对人类的影响可能比原先预…

nginx反向代理实践指南:访问Tomcat

目录 前言1 实现的效果2 访问流程分析3 安装tomcat并测试4 配置4.1 在Windows系统的hosts文件进行域名和IP对应关系的配置4.2 在NGINX进行请求转发的配置(反向代理配置) 5 最终测试结论 前言 从Windows系统访问Tomcat Web应用程序,设置和配置…

对BIOS进行简单快速的设置更改,就能启用安全引导来安装Windows 11

本文介绍如何在UEFI/BIOS中启用安全引导,以便继续安装Windows 11。 如何启用安全引导 启用安全引导最简单的方法是通过UEFI/BIOS进行。它通常被列为BIOS中的众多选项之一,因此你只需打开它即可启用它。 1、启动,或重新启动你的电脑或笔记本…

深入理解 hash 和 history:网页导航的基础(下)

🤍 前端开发工程师(主业)、技术博主(副业)、已过CET6 🍨 阿珊和她的猫_CSDN个人主页 🕠 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 🍚 蓝桥云课签约作者、已在蓝桥云…

插头是什么

插头 电工电气百科 文章目录 插头前言一、插头是什么二、插头的类别三、插头的作用原理总结前言 插头的设计和结构会根据不同的国家和地区的标准和电源类型而有所不同。所以,在使用插头时,需要注意使用符合当地标准和规定的插头,以确保电气安全以及插入正确的电源插座 一、…