【SQL】筛选字符串与正则表达式

news2024/11/17 17:51:31

目录

语法

需求

示例

分析

代码


语法

SELECT column1, column2, ...  
FROM table_name  
WHERE condition;

WHERE 子句用于指定过滤条件,以限制从数据库表中检索的数据。当你执行一个查询时,WHERE 子句允许你筛选出满足特定条件的记录。如果记录满足 WHERE 子句中的条件,则这些记录会被包含在查询结果中;如果不满足条件,则这些记录会被排除在外。

  • WHERE 子句是在数据被检索之后但在结果被返回之前应用的。这意味着它不会减少数据库需要处理的数据量,但会限制最终返回给客户端的数据量。
  • 在使用 WHERE 子句时,确保条件正确无误,以避免返回错误的数据或意外的空结果集。
  • 对于大型数据库,合理的 WHERE 子句条件可以显著提高查询性能,因为它允许数据库系统更有效地定位和检索数据。
  • 在某些情况下,WHERE 子句可以与 GROUP BYHAVING 等子句结合使用,以实现更复杂的查询和数据聚合。然而,WHERE 子句在数据分组之前过滤记录,而 HAVING 子句在数据分组之后过滤分组。

SELECT column_name(s)

FROM table_name

WHERE column_name REGEXP pattern;

REGEXP(或其变种,如RLIKE,具体取决于数据库系统)是一个强大的文本搜索模式匹配操作符,它允许你使用正则表达式(Regular Expressions)来搜索数据库中的文本数据。正则表达式是一种特殊的文本字符串,用于描述搜索文本时应该匹配的模式。它们非常灵活,可以匹配复杂的文本模式,包括字符序列、字符选择、重复模式等。

  • 性能:使用REGEXP可能会影响查询性能,特别是在大型数据集上。优化你的正则表达式和索引(如果可能的话)可以帮助减轻这种影响。
  • 数据库支持:并非所有数据库系统都支持REGEXP或类似的功能。例如,SQL Server 使用 LIKE 和一些扩展的通配符功能,但不直接支持正则表达式。然而,SQL Server 2016及更高版本引入了TRANSLATESTRING_SPLIT等函数,以及CLR集成,可以间接实现正则表达式功能。对于复杂的正则表达式匹配,你可能需要求助于数据库外的处理(如应用程序代码)。
  • 语法差异:不同的数据库系统(如MySQL、PostgreSQL、Oracle等)在REGEXP的语法和支持的正则表达式特性上可能存在差异。因此,在将REGEXP查询从一个数据库迁移到另一个数据库时,需要特别注意。

正则表达式

^:表示一个字符串或行的开头

[a-z]:表示一个字符范围,匹配从 a 到 z 的任何字符。

[0-9]:表示一个字符范围,匹配从 0 到 9 的任何字符。

[a-zA-Z]:这个变量匹配从 a 到 z 或 A 到 Z 的任何字符。请注意,你可以在方括号内指定的字符范围的数量没有限制,您可以添加想要匹配的其他字符或范围。

[^a-z]:这个变量匹配不在 a 到 z 范围内的任何字符。请注意,字符 ^ 用来否定字符范围,它在方括号内的含义与它的方括号外表示开始的含义不同。

[a-z]*:表示一个字符范围,匹配从 a 到 z 的任何字符 0 次或多次。

[a-z]+:表示一个字符范围,匹配从 a 到 z 的任何字符 1 次或多次。

.:匹配任意一个字符。

\.:表示句点字符。请注意,反斜杠用于转义句点字符,因为句点字符在正则表达式中具有特殊含义。还要注意,在许多语言中,需要转义反斜杠本身,因此需要使用\\.。

$:表示一个字符串或行的结尾。

需求

表: Users

+---------------+---------+
| Column Name   | Type    |
+---------------+---------+
| user_id       | int     |
| name          | varchar |
| mail          | varchar |
+---------------+---------+
user_id 是该表的主键(具有唯一值的列)。
该表包含了网站已注册用户的信息。有一些电子邮件是无效的。

编写一个解决方案,以查找具有有效电子邮件的用户。

一个有效的电子邮件具有前缀名称和域,其中:

前缀 名称是一个字符串,可以包含字母(大写或小写),数字,下划线 '_' ,点 '.' 和/或破折号 '-' 。前缀名称 必须 以字母开头。

 为 '@leetcode.com' 。

以任何顺序返回结果表。

结果的格式如以下示例所示:

示例

输入:
Users 表:
+---------+-----------+-------------------------+
| user_id | name      | mail                    |
+---------+-----------+-------------------------+
| 1       | Winston   | winston@leetcode.com    |
| 2       | Jonathan  | jonathanisgreat         |
| 3       | Annabelle | bella-@leetcode.com     |
| 4       | Sally     | sally.come@leetcode.com |
| 5       | Marwan    | quarz#2020@leetcode.com |
| 6       | David     | david69@gmail.com       |
| 7       | Shapiro   | .shapo@leetcode.com     |
+---------+-----------+-------------------------+
输出:
+---------+-----------+-------------------------+
| user_id | name      | mail                    |
+---------+-----------+-------------------------+
| 1       | Winston   | winston@leetcode.com    |
| 3       | Annabelle | bella-@leetcode.com     |
| 4       | Sally     | sally.come@leetcode.com |
+---------+-----------+-------------------------+
解释:
用户 2 的电子邮件没有域。 
用户 5 的电子邮件带有不允许的 '#' 符号。
用户 6 的电子邮件没有 leetcode 域。 
用户 7 的电子邮件以点开头。

分析

编写一个解决方案,以查找具有有效电子邮件的用户。

需要查找具有符合要求的电子邮件的用户,输出对应的用户id,用户名和邮箱,

一个有效的电子邮件具有前缀名称和域,其中:

前缀 名称是一个字符串,可以包含字母(大写或小写),数字,下划线 '_' ,点 '.' 和/或破折号 '-' 。前缀名称 必须 以字母开头。

 为 '@leetcode.com' 。

通过where mail regexp +正则表达式检索

^:表示一个字符串或行的开头

$:表示一个字符串或行的结尾

要求,前缀名称 必须 以字母开头,不限制大小写,所以^[a-zA-Z]

可以包含字母(大写或小写),数字,下划线 '_' ,点 '.' 和破折号 '-' ,所以^[a-zA-Z]+[a-zA-Z0-9_.-]*,这里面包含小写字母、大写字母、数字、下划线 '_' 、点 '.' 和破折号 '-'。其中[xxx]*表示一个字符范围,匹配从 a 到 z 的任何字符 0 次或多次。

 为 '@leetcode.com'

后缀或者域为'@leetcode.com',需要写作@leetcode\\.com,然后用$结尾

其中\.:表示句点字符。请注意,反斜杠用于转义句点字符,因为句点字符在正则表达式中具有特殊含义。还要注意,在许多语言中,需要转义反斜杠本身,因此需要使用\\.。

最终就是where mail regexp '^[a-zA-Z][a-zA-Z0-9_.-]*@leetcode\\.com$'

代码

select *
from Users
where mail regexp '^[a-zA-Z][a-zA-Z0-9_.-]*@leetcode\\.com$'

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2168038.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算计的风向标大转!计算机专业的新纪元已至!

亲爱的读者们, 在这个科技日新月异的时代,计算机专业正以前所未有的速度引领着行业的变革。从传统编程到人工智能、大数据、云计算等新兴技术的崛起,计算机专业的学习与发展路径正经历着翻天覆地的变化。今天,让我们一同探索这个…

短信视频评论dy版提取,免COOKIE 手机版本介绍说明

抖音系统手机版功能介绍说明 一:描述 根据需要升级了手机版本,手机版本和软件版本的功能一样。并且手机版本增加了评论地区筛选功能。(后期:1支持自动留痕,自动私信功能。2 支持详细信息和评论提取的tel筛选。3支持A…

15、网络安全合规由来与要素

数据来源:1.网络安全合规由来与要素_哔哩哔哩_bilibili 合规由来 合规(Compliance):指服从、顺从和遵从的行为,强调使公司的经营活动与法律、监管及内部规则保持一致。合规涉及公司适应法律法规及社会规范等规则的经营…

CentOS Stream 9部署Redis

1、安装Redis sudo dnf install redis 2、启动Redis服务 sudo systemctl start redis 3、设置Redis开机自启 sudo systemctl enable redis 4、打开Redis配置文件: sudo vi /etc/redis/redis.conf 在配置文件中找到并修改以下两行,确保密码验证功能已启…

Jenkins本地安装配置与远程访问管理本地服务详细流程

文章目录 前言1. 安装Jenkins2. 局域网访问Jenkins3. 安装 cpolar内网穿透软件4. 配置Jenkins公网访问地址5. 公网远程访问Jenkins6. 固定公网地址 前言 本文主要介绍如何在Linux CentOS 7中安装Jenkins并结合cpolar内网穿透工具实现远程访问管理本地部署的Jenkins服务. Jenk…

1小时极限速通MC局域网联机:PCL2 + Zerotier局域网联机方案

目录 前言 你需要在开始之前做什么? 你需要什么 你需要下载什么 谁,需要做什么? STEP I:创建/加入一个子网 创建一个子网(子网的维护者做) 加入一个子网(其他人做) 现在... …

【在Linux世界中追寻伟大的One Piece】进程间通信

目录 1 -> 进程间通信介绍 1.1 -> 进程间通信目的 1.2 -> 进程间通信发展 1.3 -> 进程间通信分类 1.3.1 -> 管道 1.3.2 -> System V IPC 1.3.3 -> POSIX IPC 2 -> 管道 2.1 -> 什么是管道 2.2 -> 匿名管道 2.3 -> 实例代码 2.4 -…

ubuntu22安装AI环境

安装Ubuntu驱动 查看可安装Ubuntu驱动列表 sudo ubuntu-drivers devices安装指定驱动 选择带有“recommended”标记的驱动程序即可,更高版本的是最新版,可能存在兼容问题。 apt-get install nvidia-driver-535安装cuda 有几种方法可以做到这一点&…

深入解析两大AI模型的架构与功能

在人工智能(AI)领域,自然语言处理(NLP)一直是研究的热点之一。 随着技术的不断进步,我们见证了从简单的聊天机器人到复杂语言模型的演变。 其中,Google的Gemini和OpenAI的ChatGPT作为两大代表…

全志科技发布T536高性能智慧工业芯片,飞凌嵌入式率先推出配套核心板

2024年9月24日下午,全志科技在中国国际工业博览会上成功举办了其最新产品——T536高性能智慧工业芯片的全球首发发布会。这款芯片采用创新的4核Cortex-A55与RISC-V混合架构,主频分别达到1.6GHz和600MHz,并集成了2TOPS算力的NPU,吸…

数据结构与算法实验9 实现无向连通图的最小生成树

文章目录 1.上机名称2.上机要求3.上机环境4.程序清单(写明运行结果及结果分析)4.1 程序清单4.1.1 头文件 Graph.h 内容如下:4.1.2 实现文件 Graph.cpp 内容如下:4.1.3 源文件 main.cpp 内容如下: 4.2 运行结果 5.上机体会 1.上机名称 实现无向…

整数在内存中的存储(c语言)

1.原码 反码 补码(以及他们之间的转换) 当一个数为正数的时候,不存在原码反码补码的差别,也就是一样的; 当一个数为负数的时候,以-1为例子,对这个过程进行讲解。 1000 0000 0000 0000 0000 0…

多路复用IO

一。进程处理多路IO请求 在没有多路复用IO之前,对于多路IO请求,一般只有阻塞与非阻塞IO两种方式 1.1 阻塞IO 需要结合多进程/多线程,每个进程/线程处理一路IO 缺点:客户端越多,需要创建的进程/线程越多&#xff0c…

python 图片加文字 文字自动上下左右居中 自动换行居中对齐

一.实现效果展示 二.代码 # -*- coding: utf-8 -*- # Time : 2024/9/26 17:22 # Author : Cocktail_pyfrom PIL import Image, ImageFont, ImageDrawdef split_string(s, num_parts):length len(s)chunk_size length // num_partsremainder length % num_partsparts […

数智化引领传媒新变革,又一场技术的盛宴!

文 | 智能相对论 作者 | 陈泊丞 2024巴黎奥运会在塞纳河畔为世界呈现了一场精彩绝伦的体坛盛宴。回顾今年的直播,每一个观众或许都可以在屏幕前感受到更胜往届的体育表现力和竞赛节目效果。 在超高清制播技术支持下,不仅制播画质变高清了,…

ASO关键词研究-9个步骤帮您找到应用商店优化的完美关键词

应用商店优化是一种让您的应用展示给更多用户的有效方法。为此,您需要在应用元数据中使用正确的关键字,以帮助 Apple 和 Google 的搜索算法知道何时在搜索结果中显示您的应用。如果您做得正确,他们会向更多人展示您的应用,而更多的…

python全栈学习项目案例(一)atm+购物车

atm购物车 文章目录 atm购物车一、项目需求二、项目构架图三、视图的实现四、登录认证五、转账功能六、购物功能 一、项目需求 二、项目构架图 其中用户功能层中有呈现给用户的视图、各个功能的简单函数(这些简单函数需要调用接口层中函数的具体功能) 接口层存放各个功能的具体…

自动化测试数据管理问题

在自动化测试中,关于数据管理的更好实践确实存在,这些实践可以帮助提高测试的效率和质量。以下是一些推荐的最佳实践:1. 使用Test Data Builder模式:这种模式可以帮助隐藏测试数据准备的细节,在测试代码中只显示地对测…

每日OJ题_牛客_NC1大数加法_高精度加法

目录 牛客_NC1大数加法_高精度加法 题目解析 C代码 Java代码 牛客_NC1大数加法_高精度加法 题目解析 模版类型的算法题,模拟加法列竖式运算的过程即可。 假定算法流程: 设定 i,j 两指针分别指向 s,t 尾部,模拟…

2024网络安全面试指南(非常详细)收藏这一篇就够了

1.1 网络安全行业现状 安全行业起步晚。安全行业整体起来才没几年,多数企业因为资源投入和建设时间原因导致覆盖面和深入度都不够,这其中甚至包括一些国内大厂,并没有想象的那么安全。其安全水位仅能应付一些白帽子级别,针对专业…