sql基础+考点+题

news2025/1/13 3:05:14

查询:select + from

筛选:where

and和or

排序:order by(降序排列需要指定DESC关键字)

join:left join 、right join 和inner join

分组聚合:group by ---搭配count , sum , avg

过滤:having

通配符:like    :“a”%like 、like‘%a%”、like%差不多是这样

增删改查

insert、delete、drop、select

insert into 表名 values (值1,值2……)

delete from表名称 where 列名称 = 值

sql考点

1.首先是sql的执行顺序

from--join--on--where--group by--having--select--distinct--order by--limit

2.去重:distinct

select distinct UID from table

结合count函数:count(distinct uid)--表中有多少个不重复的uid

3.对查询数据进行分类--case when

case when col1 in (‘a’,’b’) then 1
      when col1 in (‘c’,’d’) then 2
      else 0 end as flag

根据给定的条件,如果 col1 的值为 ‘a’ 或 ‘b’,则返回 1;如果 col1 的值为 ‘c’ 或 ‘d’,则返回 2;否则,返回 0,这个标志列被命名为 “flag”。函数只会返回第一个符合条件的值

4.Between操作符

between操作符选取介于两个值之间的数据范围内的值,btween 30 and 60 其实等价于 ≥30 and ≤60

5.各种连接方式的区别

inner join:内连接

lelft join、right join、all join:join那边就一那边为准,另一边的不符合的为空了

cross join :交叉连接 结果是笛卡尔积,第一个表符合查询条件的行数乘以第二个表符合查询条件的行数

6.where和on 的区别

在left join中,无论on的条件是否真,都会返回左边中全部的值

但是where就不一样来,where一般都是用在临时表生成以后(连接函数完成之后),对数据进行筛选

on执行在前,where执行在后

where和having的区别

复习一下执行顺序:.....where--group by--having.....

where子句的作用是对查询结果进行分组前将不符合where条件的行去掉,having则是筛选满足条件的组。

注意:在where进行筛选的时候不能使用字段的别名,having的时候可以。

7.索引的作用

索引(标志符号)主要建立在:①经常搜索的列;②主键所在列;③外键所在列

索引包括聚集索引非聚集索引:区别在于索引记录的顺序与表记录的顺序是否一致

聚集索引:索引记录的顺序与表记录的顺序一致

非聚集索引:索引的顺序与表中数据记录的顺序不一定一致

8.delete和drop的区别?

drop会删除整个表,以后都不能再用

delete知识删除表中的数据,保留表的字段和结构

9.主键和外键是什么?

主键是一张表中能够确定一条记录的唯一标志(数据库中的一条记录中有若干个属性,若其中某一个属性组(注意是组)能唯一标识一条记录,该属性组就可以成为一个主键 ),比如身份证号。
外键用于和另一张表进行关联。例如,A字段是A表的主键,那么出现在B表中的A字段能够作为B表的外键,实现A,B表的连接查询。

10.子查询中in和exist的应用场景?

简单的理解就是主查询和子查询的表是否较大且有索引

主查询表较大且有索引,子查询小就用in

主表小,子查询大且有索引则用exist

11.如何连接多个select的查询结果

union:无重复值,只出现两表共同的值

union all:允许重复值,并且是逐表呈现

intersect:合并两表的相同数据,=交集

minus:

12:排序函数的区别

常用:rank、dense rank、row number

rank:1(100分)、2(99)、2(99)、4(98).....

dense rank :1(100分)、2(99分)、2(99)、3(98)

row number:1、2、3、4、5、6......

13.开窗函数over()

排序函数和非排序函数

排序函数:row number, rank等函数可以给数据排序

非排序函数:sum()over(),sum()over()则是累计求和函数,over()中加入partition by则可进行分区累计求和

重要的开窗函数

count() over(partition by ... order by ...):求分组后的总数。
max  () over(partition by ... order by ...):求分组后的最大值。
min   () over(partition by ... order by ...):求分组后的最小值。
avg   () over(partition by ... order by ...):求分组后的平均值。

lag    () over(partition by ... order by ...):分组取出前n行数据。

lead  () over(partition by ... order by ...):分组取出后n行数据。

14.mysql和hivesql的区别?

1.存储位置hive是在HDFS中,mysql是存储在自己的系统中

2.子查询:在hive中不使用子查询,会报错或很长时间跑不出来,可以用join和left join等函数

3.拆分字符串:在sql语法中,往往使用substring进行字符串的截取,比如substring(被截取字段,从第几位开始截取,截取长度)。在hive中则是使用split进行分割,比如select split('abcdef', 'c') from test 意味着在‘c’处进行分割,得到的结果为 "ab", "def"。

4.数据格式:hive可以自定义,mysql自己定义的

5.数据更新:hive不支持更新,只能读取,不可写入,mysql支持读写操作

6.索引:hive 没有索引

sql经典问题

1.连续问题

取出连续数据

最常规的思路是借助row_number()over()的开窗函数

首先是row——number函数排序子查询,然后就是用日期列-排序列,相减后得到>n的id

取出不连续的数据

lag()over()函数,这个函数可以将列记录向下,然后用data列-向下列,就可以找找到哦啊

新增用户

用row()number()函数获取用户的登陆时间获取每天新增用户的数量,取出排序为1的记录后,对时间维度对用户id进行去重聚合

用户留存统计

row number后,把表自连接,在on的条件中限定date的差值空值在1-3的范围内筛选

用户相邻点击行为

选出商品销量大于100 的商家=找出销量小于100的商家

where id not in (select id from table4 where cnt<100) 

hivesql的写法

select distinct a.id
from table4 a
left join (select distinct id from table4 where cnt<100)b
on a.id=b.id
where b.id is null
删除重复数据
delete table5
where index not in (select min(index)
                   from table5
                   group by product, price
      针对SQL部分,下面会有一个场景的具体SQL写法:

假如你是腾讯视频会员的产品经理:有一个会员表,命名为 txsp_vip,三个字段,date,qq,status(1为会员,0为非会员),按 date 分区,每个分区全量数据。(写出对应 SQL语句)

1.       当日会员总量,当日新增会员数,当日回流会员数,当日到期会员数这四个指标怎么算?(注:历史状态统一选取昨天对比)

2.       提取当月的所有新会员号码包

------当日会员总量

select count(distinct qq) from txsp_vip where date='当日日期' and status=1;

------当日新增会员数

select count(distinct a.qq) from

(select qq from txsp_vip where date='当日日期' and status=1) a

left join

(select qq from txsp_vip where date='昨天日期' and status=1) b

on a.qq=b.qq

where b.qq is null

------当日回流会员数

select count(distinct a.qq) from

(select qq from txsp_vip where date='当日日期' and status=1) a

join

(select qq from txsp_vip where date='昨日日期' and status=1) b

on a.qq=b.qq

------当日到期会员数

select count(distinct a.qq) from

(select qq from txsp_vip where date='当日日期' and status=0) a

join

(select qq from txsq_vip where data='昨天日期' and status=1) b

on a.qq=b.qq

------提取当月的所有新会员号码包。

select count(a.qq) from

(select qq from txsp_vip where date>='当月第一天' and date<='当月最后一天' and status=1) a

left join

(select qq from txsp_vip where data='上月最后一天' and status=1) b

on a.qq=b.qq

where b.qq is null

             )

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1173048.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023年中国自然语言处理行业研究报告

第一章 行业概况 1.1 定义 自然语言处理&#xff08;Natural Language Processing&#xff0c;简称NLP&#xff09;是一门交叉学科&#xff0c;它结合了计算机科学、人工智能和语言学的知识&#xff0c;旨在使计算机能够理解、解释和生成人类语言。NLP的核心是构建能够理解和…

Ubuntu 创建用户

在ubuntu系统中创建用户&#xff0c;是最基本的操作。与centos7相比&#xff0c;有较大不同。 我们通过案例介绍&#xff0c;讨论用户的创建。 我们知道&#xff0c;在linux中&#xff0c;有三类用户&#xff1a;超级管理员 root 具有完全权限&#xff1b;系统用户 bin sys a…

MinIO 分布式文件(对象)存储

简介 MinIO是高性能、可扩展、云原生支持、操作简单、开源的分布式对象存储产品。 在中国&#xff1a;阿里巴巴、腾讯、百度、中国联通、华为、中国移动等等9000多家企业也都在使用MinIO产品 官网地址&#xff1a;http://www.minio.org.cn/ 下载 官网下载(8.4.3版本)&#x…

云计算实战项目之---学之思在线考试系统

简介&#xff1a; 学之思开源考试系统是一款 java vue 的前后端分离的考试系统。主要优点是开发、部署简单快捷、界面设计友好、代码结构清晰。支持web端和微信小程序&#xff0c;能覆盖到pc机和手机等设备。 支持多种部署方式&#xff1a;集成部署、前后端分离部署、docker部…

MySQL Too Many Connections

一、前言 上一篇 《磁盘爆了》 我们讲磁盘撑爆造成Java应用无法启动&#xff0c;今天我们来讲一下MySQL连接被撑爆应用启动后连不上数据库的问题。 二、max_connections配置 我们自己安装的开源MySQL5.6 默认的max_connections(最大连接数)值为151&#xff0c;为什么是151咱…

【MongoDB】索引 - 数组字段的多键索引

数组字段创建索引时&#xff0c;MongoDB会为数组中的每个元素创建索引键&#xff08;多键索引&#xff09;&#xff0c;多键索引支持数组字段的高效查询。 一、准备工作 这里准备一些数据 db.shop.insertMany([{_id: 1, name: "水果店1", fruits: ["apple&qu…

Vue+OpenLayers从入门到实战进阶案例汇总目录,兼容OpenLayers7和OpenLayers8

本篇作为《VueOpenLayers入门教程》和《VueOpenLayers实战进阶案例》所有文章的二合一汇总目录&#xff0c;方便查找。 本专栏源码是由OpenLayers结合Vue框架编写。 本专栏从Vue搭建脚手架到如何引入OpenLayers依赖的每一步详细新手教程&#xff0c;再到通过各种入门案例和综合…

Go语言与Python语言的性能比较

目录 一、背景与意义 二、执行速度 三、内存消耗 四、并发性能 五、编译速度与开发效率 六、综合考虑 七、应用场景 八、未来发展趋势 总结 一、背景与意义 在编程世界中&#xff0c;Go语言和Python语言都占有一席之地。Go语言是由Google开发的&#xff0c;其设计初衷…

GNSS精密解算软件介绍

GAMIT&#xff1a; 美国麻省理工学院&#xff08;MIT&#xff09;和加州大学圣地亚哥分校的海洋研究所&#xff08;SIO&#xff09;开发的GAMIT/GLOBK软件&#xff0c; GAMIT为双差网解&#xff0c;利用双差直接消除卫星及测站的时间误差。 gamit软件介绍-周命端&#xff1a;…

Technology strategy Pattern 学习笔记4 - Creating the Strategy-Corporate Context

Creating the Strategy-Corporate Context 1 •. Stakeholder Alignment 1.1 要成功&#xff0c;要尽可能获得powerful leader的支持 1.2 也需要获得最高执行层的支持 1.3 Determining&#xff08;确定&#xff09; Stakeholders 需要建立360度组织图&#xff0c;确认三类人…

unity中移动方案--物理渲染分层

一、三种基本移动方案 unity中的移动分为Transform和Rigidbody以及CharacterController&#xff0c;其中CharacterController已经考虑了穿墙&#xff0c;贴墙走等情况。 1.使用transform,直接修改位置&#xff0c;无视碰撞 1.transform.position 2.transform.Translate 2.使用…

Paragon NTFS for Mac15.5磁盘存储软件

NTFS For Mac 15是首个支持Mac上读写NTFS外置存储设备解决方案 &#xff0c;解决mac不能读写外置让您更加简单直观的在Mac机上随意对NTFS文件修改、删除等操作。 NTFS for Mac是什么 在选择一款合适自己的NTFS or Mac软件之前&#xff0c;您可以简单地对NTFS or Mac进行一个了…

(免费领源码)PHP#MySQL高校学生信息管理系统28099-计算机毕业设计项目选题推荐

摘 要 随着互联网趋势的到来&#xff0c;各行各业都在考虑利用互联网将自己推广出去&#xff0c;最好方式就是建立自己的互联网系统&#xff0c;并对其进行维护和管理。在现实运用中&#xff0c;应用软件的工作规则和开发步骤&#xff0c;采用php技术建设学生信息管理系统设计。…

【兔子王赠书第6期】Python机器学习实战:基于Scikit-learn与PyTorch的神经网络解决方案

文章目录 前言推荐图书写给读者内容简介本书目录本书特色推荐理由 粉丝福利结语 前言 粉丝福利又双叒叕来喽&#xff0c;小伙伴们快来看看吧&#xff01; 推荐图书 《Python机器学习实战&#xff1a;基于Scikit-learn与PyTorch的神经网络解决方案》 京东直购链接&#xff1…

二维码智慧门牌管理系统升级:一键报错解决三大问题

文章目录 前言一、一键报错功能解决了三大问题二、提高效率和便捷性 前言 随着科技的不断发展&#xff0c;智能化管理已经深入到社会的各个角落&#xff0c;其中二维码智慧门牌管理系统在社区、酒店、写字楼等场所的应用尤为广泛。为了更好地提升管理系统效率和解决实际问题&a…

Linux生成静态库

GCC 什么是GCC GCC 是 GNU 编译器集合&#xff08;GNU Compiler Collection&#xff09;的缩写。它是一个开源的编程语言编译器&#xff0c;支持多种编程语言&#xff0c;包括 C、C、Objective-C、Fortran、Ada 和 Go 等。GCC 最初由理查德斯托曼&#xff08;Richard Stallman…

VEX —— Quaternion|Euler Angle

目录 一&#xff0c;四元数相关概念 四元数 欧拉角 常用四元数相关函数 相互转换 二&#xff0c;案例 案例&#xff1a;沿面中心翻转 案例&#xff1a;路径导弹 一&#xff0c;四元数相关概念 四元数 在vex内四元数为&#xff08;&#xff08;x&#xff0c;y&#xff0…

vmware--主机win11 samba 映射虚拟机ubuntu共享文件夹

参考链接 1.效果如下图 2.教程 2.1 win11开启 smb 忽略… 2.2 vmware–ubuntu 安装 samba sudo apt update sudo apt install samba2.3 vmware–ubuntu 验证 安装成功 ppan:~$ whereis samba samba: /usr/sbin/samba /usr/lib/x86_64-linux-gnu/samba /etc/samba /usr/sh…

《向量数据库指南》——用了解向量数据库Milvus Cloud搭建高效推荐系统

了解向量数据库 ANN 搜索是关系型数据库无法提供的功能。关系型数据库只能用于处理具有预定义结构、可直接比较值的表格型数据。因此,关系数据库索引也是基于这一点来比较数据。但是 Embedding 向量无法通过这种方式直接相互比较。因为我们不知道向量中的每个值代表什么意思,…

【LeetCode:187. 重复的DNA序列 | 滑动窗口 map】

&#x1f680; 算法题 &#x1f680; &#x1f332; 算法刷题专栏 | 面试必备算法 | 面试高频算法 &#x1f340; &#x1f332; 越难的东西,越要努力坚持&#xff0c;因为它具有很高的价值&#xff0c;算法就是这样✨ &#x1f332; 作者简介&#xff1a;硕风和炜&#xff0c;…