【正则表达式】正则表达式基本语法元素

news2024/11/18 21:43:12

目录

  • 字符类
  • 量词
  • 边界匹配
  • 逻辑和分组
  • 转义和特殊字符
  • 验证正则表达式是否能够成功提取数据


字符类

.:匹配除换行符之外的任何单个字符。
[abc]:匹配方括号内的任何字符。
[^abc]:匹配不在方括号内的任何字符。
[a-z]:匹配任何小写字母。
[A-Z]:匹配任何大写字母。
[0-9]:匹配任何数字。
\d:匹配任何数字,等价于 [0-9]。
\D:匹配任何非数字字符。
\w:匹配任何单词字符(等价于 [a-zA-Z0-9_])。
\W:匹配任何非单词字符。
\s:匹配任何空白字符(如空格、制表符、换行符等)。
\S:匹配任何非空白字符。


量词

*:匹配前面的元素零次或多次
+:匹配前面的元素一次或多次
?:匹配前面的元素零次或一次
{n}:匹配前面的元素恰好 n 次
{n,}:匹配前面的元素至少 n 次
{n,m}:匹配前面的元素至少 n 次,但不超过 m 次


边界匹配

^:匹配输入字符串的开始位置。
$:匹配输入字符串的结束位置。
\b:匹配一个单词边界。
\B:匹配非单词边界。


逻辑和分组

|:匹配 | 两侧的任一模式。
():捕获括号,用于分组和提取子匹配。
(?:...):非捕获括号,只用于分组,不提取子匹配。
(?=...):正向肯定预查,断言自身位置后面能匹配表达式。
(?!...):正向否定预查,断言自身位置后面不能匹配表达式。
(?<=...):反向肯定预查,断言自身位置前面能匹配表达式。
(?<!...):反向否定预查,断言自身位置前面不能匹配表达式。


转义和特殊字符

\:转义字符,用于转义特殊字符或指定特殊序列(如 \n 表示换行符)。


验证正则表达式是否能够成功提取数据

使用https://rubular.com/网站:
在这里插入图片描述

解释这里的正则表达式.+uri:(?<uri>[\w\/]+) got a pv, c_time:(?<c_time>\d+), idc:(?<idc>\w+), errno:(?<errno>\d+)

  1. .+

    • . 匹配任意单个字符(除了换行符)。
    • + 表示前面的元素(即.)可以出现一次或多次。
    • 所以 .+ 匹配任意长度的字符序列(至少一个字符),直到遇到后面的模式为止。
  2. uri:

    • 这部分直接匹配文本中的 “uri:” 字符串。
  3. (?<uri>[\w\/]+)

    • 这是一个命名捕获组,名为 uri
    • [\w\/]+ 匹配一个或多个单词字符(\w,等价于 [a-zA-Z0-9_])或斜杠字符(\/)。
    • 这部分用于捕获 URI 路径,它可能包含字母、数字、下划线和斜杠。
  4. got a pv,

    • 这部分直接匹配文本中的 “got a pv,” 字符串。
  5. c_time:(?<c_time>\d+)

    • c_time: 直接匹配文本中的 “c_time:” 字符串。
    • (?<c_time>\d+) 是一个命名捕获组,名为 c_time
    • \d+ 匹配一个或多个数字字符。
    • 这部分用于捕获 c_time 的值,它应该是一个或多个数字。
  6. idc:(?<idc>\w+)

    • idc: 直接匹配文本中的 “idc:” 字符串。
    • (?<idc>\w+) 是一个命名捕获组,名为 idc
    • \w+ 匹配一个或多个单词字符。
    • 这部分用于捕获 idc 的值,它应该是一个或多个字母、数字或下划线。
  7. errno:(?<errno>\d+)

    • errno: 直接匹配文本中的 “errno:” 字符串。
    • (?<errno>\d+) 是一个命名捕获组,名为 errno
    • \d+ 匹配一个或多个数字字符。
    • 这部分用于捕获 errno 的值,它应该是一个或多个数字。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1621015.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

威纶通软件安装(一步一步,包成功)

软件安装 &#xff08;安装之前建议关闭防火墙&#xff09; 威纶通官网 1&#xff0c;点击服务支持——>下载中心 小编建议下载新版低一个版本。 2&#xff0c;文件夹进行解压 3&#xff0c;安装文件 4&#xff0c;选择文件语言 5&#xff0c;进行向导安装&#xff08;下…

春秋云镜 CVE-2023-51048

靶标介绍&#xff1a; S-CMS v5.0 被发现存在SQLI。 开启靶场 根据题目查找S-CMS v5.0漏洞&#xff0c;百度没有查询到&#xff0c;使用必应搜索S-CMS v5.0 查找到githubCVE-2023-51052的描述 S-CMS v5.0 was discovered to contain a SQL injection... CVE-2023-51052 Git…

JAVA操作Influxdb

1、安装influxdb 本文采用Influxdb2,版本为influxdb:2.7.6。安装方式为docker。 执行安装命令 docker pull influxdb:2.7.6 创建服务 docker run --nameinfluxdb2 -p 8086:8086 -v $PWD:/var/lib/influxdb -d influxdb:2.7.6 其中 $PWD 指定为当前目录。可以根据需求进行更…

【电控笔记5.6】Butterworth滤波器

Butterworth滤波器 需求&#xff1a;在增益交越频率拥有最小的相位滞后 波器经常被使用原因是 Butterworth 滤波器对于给定阶数&#xff0c;拥有最倾斜的衰减率而在伯德图又不会产生凸峰&#xff0c;同时在低频段的相位滞后小&#xff0c;因此本节将为各位介绍 Butterworth 低…

按照以下步骤使用Transformer模型

“Transformer”是一种深度学习模型架构&#xff0c;用于处理序列数据&#xff0c;特别是在自然语言处理&#xff08;NLP&#xff09;领域中表现出色。它由Google Brain团队于2017年提出&#xff0c;并在机器翻译任务中取得了突破性的成果。Transformer的核心思想是完全基于自注…

SpringBoot整合七牛云实现图片的上传管理

唠嗑部分 各位小伙伴大家好&#xff0c;我是全栈小白&#xff0c;今天我们来分享一下SpringBoot如何整合七牛云存储实现图片的上传与存储 首先我们来说说图片存储&#xff0c;在项目中图片几乎是必不可少的&#xff0c;那么大家会选择怎样存储呢&#xff0c;当然有几种方案 …

form-serialize插件,快速收集表单元素的值

form-serialize插件可以快速获得表单元素的值&#xff0c;主要用于当表单很多的情况下&#xff0c;将表单的值一起打包发给服务器。 使用方法&#xff1a; 1.引入插件 2.获取表单的dom 3.使用插件的serialize方法 serialize方法有两个参数&#xff0c;第一个是获取到的表单d…

Docker容器搭建Hadoop集群(hadoop-3.1.3)

Docker容器环境下搭建Hadoop集群&#xff08;完全分布式&#xff09; hadoop版本为hadoop-3.1.3 &#xff08;1&#xff09;安装额外的速度较快的镜像库 yum install -y epel-release &#xff08;2&#xff09;安装同步工具&#xff0c;方便在多台服务器上进行文件的传输 …

java开发之路——用户管理中心_简单初始化

用户管理中心_简单初始化 (一) 初始化项目1. 使用 Ant Design Pro(现成的管理系统) 进行前端初始化2. 后端初始化三种初始化java项目 (二) 遇到的问题【问题1】Ant design pro页面打不开&#xff0c;一直在budiling控制台出现错误error-./src/components/index.ts【问题2】初始…

【期末复习向】智能信息系统前4章梳理

第四章 不确定性推理 [了解即可]4.1 不确定性概述 不确定性推理概念 所谓推理&#xff0c;就是从已知事实出发&#xff0c;运用相关的知识&#xff08;或规则&#xff09;逐步推出结论或者证明某个假设成立或不成立的思维过程。 不确定性方法分类 1.模型方法 a&#xff0…

新技术前沿-2024-大型语言模型LLM的本地化部署

参考快速入门LLM 参考究竟什么是神经网络 1 深度学习 1.1 神经网络和深度学习 神经网络是一种模拟人脑神经元工作方式的机器学习算法,也是深度学习算法的基本构成块。神经网络由多个相互连接的节点(也称为神经元或人工神经元)组成,这些节点被组织成层次结构。通过训练,…

【Linux】谈谈shell外壳是什么?

&#x1f490; &#x1f338; &#x1f337; &#x1f340; &#x1f339; &#x1f33b; &#x1f33a; &#x1f341; &#x1f343; &#x1f342; &#x1f33f; &#x1f344;&#x1f35d; &#x1f35b; &#x1f364; &#x1f4c3;个人主页 &#xff1a;阿然成长日记 …

在pycharm中导入sklearn库失败到成功

运行下列代码&#xff1a; pip install -i https://pypi.tuna.tsinghua.edu.cn/simple scikit-learn 可以发现下载库时&#xff0c;不是直接下载sklearn库&#xff0c;而是下载scikit-learn库 之前下载一直失败&#xff0c;终于找到原因了。果然还是得多尝试&#xff0c;还…

【已解决简单好用】notepad++怎么设置中文

打开Notepad软件。点击软件界面顶部菜单栏中的“Settings”选项。在下拉菜单中选择“Preferences”进行语言设置。在打开的设置窗口中&#xff0c;找到“General”选项。在“General”选项中&#xff0c;找到“Localization”&#xff08;界面语言&#xff09;项。在下拉菜单中…

Spring-IOC之组件扫描

版本 Spring Framework 6.0.9​ 1. 前言 通过自动扫描&#xff0c;Spring 会自动从扫描指定的包及其子包下的所有类&#xff0c;并根据类上的特定注解将该类装配到容器中&#xff0c;而无需在 XML 配置文件或 Java 配置类中逐一声明每一个 Bean。 支持的注解 Spring 支持一系…

IDEA最好用插件推荐

1 背景 俗话说&#xff1a;“工欲善其事必先利其器”&#xff0c;本问介绍几款强大实用的 IDEA 插件&#xff0c;助力大家开发。 希望大家做一个聪明又努力的人&#xff0c;而不只是一个努力的人。 以下插件大都可以通过 IDEA 自带的插件管理中心安装&#xff0c;如果搜不到可以…

如何给word中的拼音加声调?分享3个方法

一&#xff0c;前言 在Word文档中标注拼音声调&#xff0c;是许多人在处理中文文档时经常需要面对的问题。对于不熟悉拼音的人来说&#xff0c;这可能会是一个挑战。但是&#xff0c;通过掌握一些简单的步骤和技巧&#xff0c;我们可以轻松地在Word文档中标注拼音声调。 二&a…

车载以太网DoIP 协议,万字长文详解

&#x1f345; 我是蚂蚁小兵&#xff0c;专注于车载诊断领域&#xff0c;尤其擅长于对CANoe工具的使用&#x1f345; 寻找组织 &#xff0c;答疑解惑&#xff0c;摸鱼聊天&#xff0c;博客源码&#xff0c;点击加入&#x1f449;【相亲相爱一家人】&#x1f345; 玩转CANoe&…

YOLOv8 实现车牌检测,生成可视化检测视频(20240424)

原项目源码地址&#xff1a;GitHub 我的源码地址&#xff1a;Gitee 环境搭建请参考&#xff1a;Win10 搭建 YOLOv8 运行环境&#xff08;20240423&#xff09;-CSDN博客 环境测试请参考&#xff1a;本地运行测试 YOLOv8&#xff08;20240423&#xff09;-CSDN博客 训练数据…

三、CPU基础-缓存

计算机中缓存一般分为两个部分 1.内存 2.CPU Cache 一、CPU Cache分级 CPU Cache 通常分为大小不等的三级缓存&#xff0c;分别是 L1 Cache、L2 Cache 和 L3 Cache。 L1 Cache 和 L2 Cache 都是每个 CPU 核心独有的&#xff08;通常会分为「数据缓存」和「指令缓存」&#…