Python - 小玩意 - 请求网络地址获取网页链接

news2026/2/13 19:51:28

from bs4 import BeautifulSoup
from urllib import request
# 要请求的网络地址
url = 'https://blog.csdn.net/qq_43116031/'
# pip --default-timeout=500000 install bs4
# 请求网络地址得到html网页代码
html = request.urlopen(url)

# 整理代码
soup = BeautifulSoup(html, 'html.parser')

# 找出所有的 a 标签， 因为所有的链接都在 a 标签内
data = soup.find_all('a')

# 打开文件对象做持久化操作
file = open('D:/link.txt', mode='w', encoding='utf-8')

# 遍历所有的 a 标签， 获取它们的 href 属性的值和它们的 text
for item in data:
    if item.string is not None and item['href'] != 'javascript:;' and item['href'] != '#':
        print(item.string, item.get('href'))
        file.write(str.__add__(item.string, ' '))
        file.write(str.__add__(item['href'], '\n'))

file.close()

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1026997.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

深度学习论文: ISTDU-Net：Infrared Small-Target Detection U-Net及其PyTorch实现

深度学习论文: ISTDU-Net：Infrared Small-Target Detection U-Net及其PyTorch实现 ISTDU-Net：Infrared Small-Target Detection U-Net PDF: https://doi.org/10.1109/LGRS.2022.3141584 PyTorch代码: https://github.com/shanglianlm0525/CvPytorch PyTo…

GPT，GPT-2，GPT-3，InstructGPT的进化之路

ChatGPT 火遍圈内外，突然之间，好多人开始想要了解 NLP 这个领域，想知道 ChatGPT 到底是个什么？作为在这个行业奋斗5年的从业者，真的很开心让人们知道有一群人在干着这么样的一件事情。这也是我结合各位大佬的文章&…

MTK联发科MT6853和MT6873安卓核心板性能参数对比

联发科MTK6853芯片，又名天玑720，是一款具有先天的节能创新的5G芯片。天玑800（MTK6873）和天玑720二款处理器都是使用于中高端手机中，那么天玑720和天玑800处理器到底哪个更好呢？ 1、处理器性能对比天玑7…

系统架构设计师（第二版）学习笔记----系统分析与设计及测试

【原文链接】系统架构设计师（第二版）学习笔记----软件测试文章目录一、结构化方法1.1 结构化开发方法1.2 结构化分析使用的手段1.3 结构化分析的步骤1.4 数据流图（DFD）的基本元素1.5 数据流图（DFD）方法建…

【LeetCode-中等题】429. N 叉树的层序遍历

文章目录题目方法一：二叉树的层序遍历的扩展题目方法一：二叉树的层序遍历的扩展思路和二叉树的层序遍历一样，这一题的关键在于取出每个节点的孩子 for(int j 0;j<root.children.size();j)//取出所有当前节点的所有孩子节点放到队列…

谷歌版ChatGPT与旗下邮箱、视频、地图等，实现全面集成！

9月20日，谷歌在官网宣布推出Bard Extensions。借助该扩展用户可在谷歌的Gmail、谷歌文档、网盘、Google 地图、视频等产品中使用Bard。 Bard是谷歌基于PaLM 2大模型，打造的一款类ChatGPT产品，可自动生成文本、代码、实时查询信息等。新的集成…

JVM——7.类加载与类加载器

这篇文章我们来学习一下类加载及其相关内容目录 1.概述 2.类加载时机 3.类加载过程 3.1加载 3.2验证 3.2.1文件格式验证 3.2.2.元数据验证 3.2.3字节码验证 3.2.4符号引用验证 3.3准备 3.4解析 3.5初始化 4.类加载器 4.1类与类加载器 4.2双亲委派模型 4.3破坏…

Linux磁盘挂载及扩容操作

Linux磁盘扩容操作全介绍 1. 新增磁盘分区后挂载至新建 /data 目录下 1.1 新增磁盘打开Vmware 右键需要添加磁盘的虚拟机，点击设置，选择磁盘添加即可，这里我新增了一块20G的磁盘在当前虚拟机下； fdisk -l # 列出指定的外围设备…

三维模型3DTile格式轻量化在数据存储的重要性分析

三维模型3DTile格式轻量化在数据存储的重要性分析三维模型3DTile格式轻量化在数据存储中占有重要地位。随着科技的不断发展，尤其是空间信息科技的进步，人们对于三维地理空间数据的需求日益增长。然而，这类数据通常具有大尺度、高精度等特点&…

Kafka 源码分析——Producer

文章目录前言Producer 整体流程Producer 初始化Producer 发送流程执行拦截器逻辑获取集群元数据序列化选择分区消息累加进缓存消息发送 Producer缓冲区Producer 参数调优前言在 Kafka 中, 把产生消息的一方称为 Producer 即生产者，它是 Kafka 的核心组件之一&a…

uniapp 微信小程序之隐私协议开发

uniapp 微信小程序之隐私协议开发官网通知：https://developers.weixin.qq.com/miniprogram/dev/framework/user-privacy/PrivacyAuthorize.html 1、配置 __usePrivacyCheck__: true；位置 manifest.json : "mp-weixin":{"__usePrivacyCh…

Vue基础语法【下】

目录一、事件处理器 1.事件修饰符 .stop .prevent .capture .self .once 2.按键修饰符 .enter .tab .delete .esc .space .up .down .left .right .ctrl、.alt、.shift、.meta 二、表单赋值与取值三、自定义组件 1.组件介绍 2.局部组件 3.全局组件 4.组件通…

idea如何关闭项目文件显示的浏览器图标

这里写自定义目录标题 1.idea经常项目文件右上角弹出图标2.setting中Tools 取消勾选浏览器 1.idea经常项目文件右上角弹出图标 2.setting中Tools 取消勾选浏览器

vue的模板语法（下篇)

目录一.事件处理二.表单的综合案例三.组件通信⭐⭐ 3.1 自定义组件 3.2 组件通信之父传子 3.3组件通信之子传父一.事件处理 Vue通过由点(.)表示的指令后缀来调用修饰符， .stop .prevent .capture .self .once 如下： 阻止单击事件冒泡 <a v-on…

Mybatis学习笔记11 缓存相关

Mybatis学习笔记10 高级映射及延迟加载_biubiubiu0706的博客-CSDN博客缓存:cache 缓存的作用:通过减少IO的方式,来提高程序的执行效率 Mybatis的缓存:将select语句的查询结果放到缓存(内存)当中,下一次还是这条select语句的话,直接从缓存中取,不再查数据库.一方面是减少了I…

基于Android+OpenCV+CNN+Keras的智能手语数字实时翻译——深度学习算法应用(含Python、ipynb工程源码)+数据集（三）

目录前言总体设计系统整体结构图系统流程图运行环境模块实现1. 数据预处理2. 数据增强3. 模型构建4. 模型训练及保存1）模型训练2）模型保存 5. 模型评估相关其它博客工程源代码下载其它资料下载前言本项目依赖于Keras深度学习模型，旨在对…

JavaWeb学习总结（在IntelliJ IDEA中配置使用Tomcat）

1、配置在 Libray 中选 Java 选项（也就是安装Tomcat的路径） 如果运行时端口被占用可以修改端口例如：原8080，可改为8081（也可修改其他） 2、使用Serlvet package com.company;import java…

将近 5 万字讲解 Python Django 框架详细知识点（更新中）

Django 框架基本概述 Django 是一个开源的 Web 应用后端框架，由 Python 编写。它采用了 MVC 的软件设计模式，即模型（Model）、视图（View）和控制器（Controller）。在 Django 框架中&am…

Oracle查询固定时间间隔

获取每一天 SELECT (trunc(to_date(2023-01-01,YYYY-MM-DD), dd) LEVEL -1) as DATA_TIME FROM dual CONNECT BY LEVEL < 3;解释： 这个 SQL 查询语句的目的是生成一个包含三个日期的结果集。查询的结果是从当前日期开始的三个连续日期。让我解释一下查询的各个…

ClickHouse与Elasticsearch比较总结

目录背景分布式架构存储架构写入链路设计 Elasticsearch 再谈Schemaless 查询架构计算引擎数据扫描再谈高并发性能测试日志分析场景 access_log（数据量197921836） trace_log（数据量569816761） 官方Ontime测…

Python - 小玩意 - 请求网络地址获取网页链接

相关文章