常用API(正则表达式、爬取、捕获分组和非捕获分组 )

news2024/10/5 17:27:25

1、正则表达式

练习——先爽一下正则表达式

正则表达式可以校验字符串是否满足一定的规则,并用来校验数据格式的合法性。

需求:假如现在要求校验一个qq号码是否正确。

规则:6位及20位之内,0不能在开头,必须全部是数字。

 1、先使用目前所学知识完成校验需求

2、然后体验一下正则表达式校验 

 2、正则表达式的作用

作用一:  校验字符串是否满足规则

作用二: 在一段文本中查找满足要求的内容

⭐⭐不需要记,可以通过API帮助文档,查找    类  Pattern   

 练习——请使用正则表达式完成如下需求

需求:请编写正则表达式验证用户输入的手机号码是否满足要求。

           请编写正则表达式验证用户输入的邮箱号是否满足要求。

           请编写正则表达式验证用户输入的电话号码是否满足要求。

①手机号码 

②座机电话号码 

③邮箱号码

练习——请使用正则表达式完成如下需求

需求

  • 请编写正则表达式验证用户是否满足要求。

               要求:大小写字母,数字,下划线一共4-16位

  • 请编写正则表达式验证身份证号码是否满足要求。
         1、简单要求:18位,前17位任意数字,最后一位可以是数字可以是大写或小写的x

         2、复杂要求:按照身份证号码的格式严格要求 

⭐⭐正则表达式小结

3、爬取

 ⭐练习1——本地爬虫和网络爬虫

有如下文本,请按照要求爬取数据。

     Java自从从95年问世以来,经历了很多版本,目前企业中用的最多的是Java8Java11,因为这两者是长期支持版本,下一个长期支持版本Java17,相信在未来不久Java17也会逐渐登上历史舞台

要求:找出里面所有的JavaXX 

 分析:

 练习2——有条件的爬取数据

有如下文本,请按照要求爬取数据。

     java自从从95年问世以来,经历了很多版本,目前企业中用的最多的是Java8JAva11,因为这两者是长期支持版本,下一个长期支持版本JAVa17,相信在未来不久JAVA17也会逐渐登上历史舞台

需求1:爬取版本号8,11,17的Java文本,但是只要Java,不显示文本号。

需求2:爬取版本号8,11,17的Java文本。正确爬取结果位:Java8 JAva11 JAVa17 JAVA17

需求3:爬取除了版本号8,11,17的Java文本。

 

3

 练习3——贪婪爬取和非贪婪爬取

有如下文本,请按照要求爬取数据。

     Java自从从95年问世以来,abbbbbbbbbbbaaaaaaaa

经历了很多版本,目前企业中用的最多的是Java8Java11,因为这两者是长期支持版本,下一个长期支持版本Java17,相信在未来不久Java17也会逐渐登上历史舞台

需求1:按照ab+的方式爬取ab,b尽可能多获取

需求2:按照ab+的方式爬取ab,b尽可能少获取

分析: 

 

 

 4、正则表达式在字符串方法中的使用

 

5、捕获分组和非捕获分组 

组号的特点:

分组:分组就是一个小括号 

每组是有组号的,也就是序号

规则1:从1开始,连续不间断。

规则2:左括号为基准最左边的是第一组,其次为第二组,以此类推。

                              \ \组号:表示把第X组的内容再出来用一次

 练习——捕获分组的练习

 捕获分组(默认):可以获取每组中的内容反复使用。

后续还要继续使用本组的数据。

正则内部使用:\\组号

正则外部使用:$组号

练习1

需求:   将字符串:我要学学编编编编程程程程程程

              替换为: 我要学编程 

非捕获分组: 

分组之后不需要再用本组数据,仅仅是把数据括起来,不占组号。

符号含义举例
(? :  正则)获取所有Java(?:8|11|17)
(? =  正则)获取前面部分Java(?=8|11|17)
(? !  正则)获取不是指定内容的前面部分Java(?!8|11|17)

练习2

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1695805.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

超详细的前后端实战项目(Spring系列加上vue3)前端篇+后端篇(三)(一步步实现+源码)

好了,兄弟们,继昨天的项目之后,开始继续敲前端代码,完成前端部分(今天应该能把前端大概完成开启后端部分了) 昨天补充了一下登录界面加上了文章管理界面和用户个人中心界面 完善用户个人中心界面 修改一…

【被小学生教育的一天】

今日文章有感,记博主文章📝,分享与感触。原文如下, 今天让小学生给我上了一课啊,今天去一所学校就实地考察感触特别深啊,就我从里面抽取一小块啊,给大家看一下,这个学校的教学规划&a…

STM32中断编程入门

文章目录 一、 理论部分1.中断系统2.中断执行流程3.NVIC的基本结构4.EXTI介绍5.AFIO复用IO口 二、实验目的:学习stm32中断原理和开发编程方法。使用标准完成以下任务:(一)实验一 开关控制LED的亮灭1.代码部分2.运行结果 &#xff…

SpringBoot+Vue开发记录(七)-- 跨域文件与Restful风格

本篇文章的主要内容是关于项目的跨域配置和给项目添加restful风格接口。 重点是文件粘贴 文章目录 一、 跨域二、Restful风格1. 什么是restful风格?2. 项目文件结构3. 新建文件4. 在Controller中进行修改 一、 跨域 跨域问题暂时也就那样,解决方法就是…

【搜索方法推荐】高效信息检索方法和实用网站推荐

博主未授权任何人或组织机构转载博主任何原创文章,感谢各位对原创的支持! 博主链接 本人就职于国际知名终端厂商,负责modem芯片研发。 在5G早期负责终端数据业务层、核心网相关的开发工作,目前牵头6G算力网络技术标准研究。 博客…

AI视频教程下载:ChatGPT API、HTML、CSS 和 JS开发AI聊天机器人

在课程中,你将开启一段令人兴奋的聊天机器人开发之旅,并装备自己创建智能对话代理所需的技能和知识。 利用 ChatGPT API、HTML、CSS 和 JavaScript 的强大功能,你将学习如何设计和构建吸引用户并提供个性化体验的聊天机器人界面。深入探讨聊天机器人开发的基础知识,了解对话设…

【Docker学习】深入研究命令docker exec

使用docker的过程中,我们会有多重情况需要访问容器。比如希望直接进入MySql容器执行命令,或是希望查看容器环境,进行某些操作或访问。这时就会用到这个命令:docker exec。 命令: docker container exec 描述&#x…

AI网络爬虫-自动获取百度实时热搜榜

工作任务和目标&#xff1a;自动获取百度实时热搜榜的标题和热搜指数 标题&#xff1a;<div class"c-single-text-ellipsis"> 东部战区台岛战巡演练模拟动画 <!--48--></div> <div class"hot-index_1Bl1a"> 4946724 </div> …

OpenAI撤回有争议的决定:终止永久性非贬损协议

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

HTML静态网页成品作业(HTML+CSS+JS)——心理健康教育介绍网页(4个页面)

&#x1f389;不定期分享源码&#xff0c;关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 &#x1f3f7;️本套采用HTMLCSS&#xff0c;使用Javacsript代码使用下拉菜单的实现以及首页图片的轮播&#xff0c…

ESP32烧录AT固件并进行MQTT通讯

首先下载AT固件 发布的固件 - ESP32 - — ESP-AT 用户指南 latest 文档 下载烧录工具 下载指导 - ESP32 - — ESP-AT 用户指南 latest 文档 烧录后注意usb的串口是不能发AT指令的 需要用16和17脚 用AT指令确认OK后连WIFI ATCWMODE1 //设置客户端模式 ATCWLAP …

CV大作业28期-使用TensorFlow快速实现图像风格迁移系统

使用TensorFlow快速实现图像风格迁移系统 资源地址&#xff1a;待更新 视频地址&#xff1a;待更新 随着GPT的横空出世&#xff0c;生成式网络也越来越活&#xff0c;现在的大语言模型除了能回答文字上面的内容&#xff0c;并且在图像和视频创作中也表现除了巨大的潜力&#xf…

Websocket助手

功能介绍 WS助手是WebSocket调试的开发工具&#xff0c;该客户端工具可以帮助开发人员快速连接到测试/生产环境&#xff0c;它可以帮助您监视和分析 Websocket 消息&#xff0c;并在开发过程中解决问题&#xff1b;可以模拟客户端实现与服务器的数据交互&#xff0c;并完成批量…

【DZ模板】克米设计APP手机版本地化+完美使用

模版介绍 【DZ模板】价值288克米设计APP手机版DZ模板 数据本地化完美使用 腾讯官方出品discuz论坛DIY的后台设置&#xff0c;功能齐全&#xff0c;论坛功能不亚于葫芦侠&#xff0c;自定义马甲&#xff0c;自定义认证&#xff0c;自定义广告&#xff0c;完全可以打造出自己想…

面试大杂烩之kafka

面试这个领域最近环境不行&#xff0c;所以卷起来流量挺大 关于K8s 其实看我之前的博客&#xff0c;k8s刚有点苗头的时候我就研究过&#xff0c;然后工作的时候间接接触 也自己玩过 但是用的不多就忘记了&#xff0c;正苦于不知道写什么&#xff0c;水一篇 用来面试应该是够了…

【设计模式】JAVA Design Patterns——Static Content Hosting(静态内容托管模式)

&#x1f50d;目的 将静态内容部署到基于云的存储服务&#xff0c;该服务可以将它们直接交付给客户端。 这可以减少对昂贵计算实例的需求。 &#x1f50d;解释 真实世界例子 全球性的营销网站&#xff08;静态内容&#xff09;需要快速的部署以开始吸引潜在的客户。为了将托管…

Weblogic XML反序列化漏洞 [CVE-2017-10271]

漏洞环境搭建请参考 http://t.csdnimg.cn/i11e2 漏洞原理 Weblogic的wls security组件对外提供webservice服务&#xff0c;wls security组件使用了xmldecoder来解析用户传入的xml数据&#xff0c;如果用户进行xml恶意数据的构造&#xff0c;即可触发反序列化漏洞 漏洞版本 O…

LLMs之PEFT之Llama-2:《LoRA Learns Less and Forgets LessLoRA学得更少但遗忘得也更少》翻译与解读

LLMs之PEFT之Llama-2&#xff1a;《LoRA Learns Less and Forgets LessLoRA学得更少但遗忘得也更少》翻译与解读 导读&#xff1a;该论文比较了LoRA与完全微调在代码与数学两个领域的表现。 背景问题&#xff1a;微调大规模语言模型需要非常大的GPU内存。LoRA这一参数高效微调方…

Leetcode | 5-22 | 每日一题 | 找出输掉零场或一场比赛的玩家

&#x1f525;博客介绍&#xff1a; EvLast &#x1f3a5;系列专栏&#xff1a; 数据结构与算法 , 算法入门 , C项目 , Leetcode_DayCode &#x1f3a5; 当前专栏: Leetcode_DayCode 专题 : 数据结构帮助小白快速入门算法 &#x1f44d;&#x1f44d;&#x1f44d;&#x1…

避免锁表:为Update语句中的Where条件添加索引字段

最近在灰度环境中遇到一个问题&#xff1a;某项业务在创建数据时耗时异常长&#xff0c;但同样的代码在预发环境中并未出现此问题。起初我们以为是调用第三方接口导致的性能问题&#xff0c;但通过日志分析发现第三方接口的响应时间正常。最终&#xff0c;我们发现工单表的数据…