SQL函数学习记录

news2024/11/21 0:16:46

聚合函数

函数是编程语言的基础之一,在对数字的运算中,我们用的最多的就是聚合函数,本篇接下来就详细阐述下SQL中聚合函数的运用。

什么是聚合函数(aggregate function)?

聚合函数指的是对一组值执行计算并返回单一的值。

常见聚合函数:

  • 求个数、记录条数的count

select conut(*)/count(1) from 表名;

count_if函数

count_if(boolean expression) //参数值为布尔表达式,返回为interge;

eg:

统计request_uri字段的值是以file-0结尾的日志条数。

SELECT count_if(request_uri like'%file-0') AS count from 表名;

  • 求合计数的sum

select sum(age) from 表名;

  • 求平均数的avg

select avg(age) from 表名;

  • 求最大值、最小值的max(),min()

select max(age) from 表名;

select min(age) from 表名;

附:max函数

max(x) 查询x中的最大值;

max(x,n) 查询x中最大的n个值,返回为数组;

eg:SELECT max(request_time,10) AS "top 10" from 表名;

mysql语法:SELECT max(money,3) AS "top 3" from TableC order by money desc;

利用如下数据库进行演示:

select * from TableC;

(1)分别算出各部门的人数、总业绩、平均业绩;

SELECT bm,count(name) 人数,sum(money) 总业绩,avg(money) 平均业绩 from TableC group by bm;

(2)公司要对各部门业绩最好的员工进行奖励,现在需要统计出每个部门业绩最好的员工信息,并展示业绩是多少;

select a.* from TableC a inner join (select bm,max(money) as money from TableC group by bm) b on a.bm=b.bm and a.money=b.money;

//通过部门和money列联系起来的,inner join 表a 表b on 联系条件

(3)显示总money超过300w的部门业绩明细;

select a.*from TableC a where bm in (select bm from TableC group by bm having sum(money)>300);

补充下与group by 联用的order by ,再提个用法,针对上面的例子,要查全公司里,业绩前三的员工及业绩,代码如下:

select top 3 * from TableC order by money desc;

//desc 降序排列,mysql不支持top命令;

mysql语法:

select * from TableC order by money desc LIMIT 3;

HAVING语句

Having语句是对分组之后的数据进行过滤,因此使用having前通常会使用group by;

select a.*from TableC a where bm in (select bm from TableC group by bm having sum(money)>300);

GROUP BY 语句

结合聚合函数,根据一个或多个列对分析结果进行分组。还支持搭配rollupcubegroupping sets语句扩展分组功能。

  • group by :对分析结果进行分组;

语法:

SELECT 
 key,
  ...
 aggregate function 
 GROUP BY 
 key,...
	 
//参数解释:
	  key:日志字段名称或聚合函数结果列,支持单列或多列;
	  aggregate function:聚合函数。GROUP BY子句常与min、max、avg、sum、count等聚合函数       搭配使用。

示例:统计不同状态码对应的请求次数:

select status count(*) AS PV group by status;

示例:按照每小时的时间粒度计算网站访问PV。其中,__time__字段为日志服务中的保留字段,表示时间列。timedate_trunc('hour', __time__)的别名。date_trunc函数的更多信息,请参见date_trunc函数。

SELECT
  count(*) AS PV,
  date_trunc('hour', __time__) AS time
GROUP BY
  time
ORDER BY
  time
LIMIT
  1000                       

date_trunc函数

date_trunc函数会根据您指定的时间单位截断日期和时间表达式,并按照毫秒、秒、分钟,小时、日、月或年对齐。该函数常用于需要按照时间进行统计分析的场景。

语法:

date_trunc(unit, x)
	
//--unity:时间单位,取值为millisecond、second、minute、hour、day、week、month、quarter、year。请参见unit说明。
//--x:参数值为日期和时间表达式。

date_trunc函数只能按照固定的时间间隔统计(例如每分钟、每小时等)。如果您需要按照灵活的时间维度统计,请使用数学取模方法进行分组,例如统计每5分钟的数据。

SELECTcount(1) AS pv, __time__ - __time__ %300AStimeGROUPBYtime LIMIT 100;

示例:

按照每分钟的时间粒度计算请求时间的平均值,并按照时间进行分组和排序。

SELECT
  date_trunc('minute', __time__) AS time,
  truncate (avg(request_time)) AS avg_time,
  current_date AS date
GROUP BY time
ORDER BY time DESC
LIMIT 100;

SPLIT函数/SPLIT_PART函数

split函数通过指定的分隔符拆分字符串,并返回拆分后的子串集合。

split_part函数通过指定的分隔符拆分字符串,并返回指定位置的内容。

语法:

split (x,delimeter,limit)

split_part(x,delimiter,part)

示例:

select split(runoob_authour,'/',3) from runoon_tbl where runoob_id='19';

SELECT count(*), split_part(runoob_author, '?', 1) from runoon_tbl where runoob_id='19';

split_to_map函数

split_to_map函数用于使用指定的第一个分隔符拆分字符串,然后再使用指定的第二个分隔符进行第二次拆分。

语法:

split_to_map(x, delimiter01, delimiter02)

示例:

使用英文逗号(,)和英文冒号(:)拆分time字段的值,返回结果为MAP类型。

time:upstream_response_time:"80", request_time:"40"

select split_to_map(time,',',':') from xxxx

日期和时间函数

  • current_date函数

语法:current_date //返回当前日期,格式为YYY-MMM-DDD;

示例:

  • current_time函数

语法:current_time //返回当前日期和时区;

  • current_timesamp函数

语法:current_timesamp //返回当前日期、时间和时区;

  • current_timezone函数

语法:current_timezone() //返回当前时区;

  • date函数

语法:date(x) //返回当前日期和时间中的日期部分;

  • localtime函数

语法:localtime //返回本地时间;

  • localtimestamp函数

语法:localtimestamp //返回本地日期和时间;

  • now函数

语法:now() //返回当前日期和时间,同current_timesamp函数

  • day函数=day_of_month函数

语法:day(x) 或 day_of_month(x) //提取日期和时间表达式中的天数,按月计算。

  • day_of_week函数=dow函数,doy函数=day_of_year函数

语法:day_of_week(),dow(),doy(),day_of_year() //提取日期和时间表达式中的天数,按周或年计算。

  • date_add函数

语法:date_add(unit,N,x) //在x上加伤N个时间单位。

sql拆分

SQL 一行转多行的处理方案_sql一行拆分成多行-CSDN博客

--存量域名查询sql
SELECT COUNT(newlist) as newnum,newlist FROM(
SELECT  
-- explode(list) as newlist 
EXPLODE(split(list, ';')) as newlist
FROM    afscdm.dwd_sec_evt_cloudshell_oneagent_white_domain_alert_hi
WHERE  dt>'20220811'and dt<'20220819'
--and hour="12"
LIMIT 9999) group by newlist 
HAVING 
newlist not like "%ping%" AND   newlist not like "%onlinedown%" 
AND   newlist NOT like  "%svchost%"
order by newnum DESC limit 10;

odps/Hive中一行转多行

  • explode()内置函数

接收一个array或map类型的数据作为输入(用split函数生成数组),然后将array或map里面的元素按照每行的形式输出。

  • split()函数

split()通过指定分隔符对字符串进行切片,如果参数num有指定值,则只分割n+1个子字符串。

语法:str.split(str=" ",num=string.count(str))

参数介绍:

    • sep--可选参数,指定分隔符,默认为所有的空字符,包括空格" ",换行\n,制表\t等。
    • count--可选参数,分割次数,默认为空字符在字符串中出现的次数。

使用案例:

str = "this is string example....wow!!!"
print(str.split())
print(str.split("i", 1))
print(str.split("w"))

# 结果为
# ['this', 'is', 'string', 'example....wow!!!']
# ['th', 's is string example....wow!!!']
# ['this is string example....', 'o', '!!!']

@@@@@@@@@@@@@@以#为分隔符,指定第二个参数为2,返回3个参数列表@@@@@@@@@@@@@@@@@@@@@@@@@
	
tst = "Google#Runoob#Taobao#Facebook"
print(tst.split("#", 2))

# 结果为
# ['Google', 'Runoob', 'Taobao#Facebook']

附:

创建表:create table TableC (gh varchar(8),name varchar(8),bm varchar(8),money int(255));

插入表数据:insert into TableC values ('003','何三','销售1部',150);

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1478177.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

手撕LRU缓存——LinkedHashMap简易源码

题目链接&#xff1a;https://leetcode.cn/problems/lru-cache/description/?envTypestudy-plan-v2&envIdtop-100-liked 原理非常简单&#xff0c;一个双端链表配上一个hash表。 首先我们要知道什么是LRU就是最小使用淘汰。怎么淘汰&#xff0c;链表尾部就是最不常用的直接…

92、评估代码生成操作带来的性能提升

本节评估一下,通过代码生成操作之后,对于模型的性能提升。 评估下性能 在相同的环境下,分别运行 4th_no_malloc 和 5th_codegen 下的 compile.sh 脚本进行代码编译,然后运行编译后生成的可执行文件 ./resnet。 可以分别获取到权值预加载前后的性能指标。 注意:不同电脑机…

可视化图文报表

Apache Echarts介绍 Apache Echarts是一款基于Javascript的数据可视化图表库&#xff0c;提供直观&#xff0c;生动&#xff0c;可交互&#xff0c;可个性化定制的数据可视化图表。 官网&#xff1a;Apache ECharts 入门案例&#xff1a; <!DOCTYPE html> <html>…

Git教程-Git的基本使用

Git是一个强大的分布式版本控制系统&#xff0c;它不仅用于跟踪代码的变化&#xff0c;还能够协调多个开发者之间的工作。在软件开发过程中&#xff0c;Git被广泛应用于协作开发、版本管理和代码追踪等方面。以下是一个详细的Git教程&#xff0c;我们将深入探讨Git的基本概念和…

基于大模型思维链(Chain-of-Thought)技术的定制化思维链提示和定向刺激提示的心理咨询场景定向ai智能应用

本篇为个人笔记 记录基于大模型思维链&#xff08;Chain-of-Thought&#xff09;技术的定制化思维链提示和定向刺激提示的心理咨询场景定向ai智能应用 人工智能为个人兴趣领域 业余研究 如有错漏欢迎指出&#xff01;&#xff01;&#xff01; 目录 本篇为个人笔记 记录基…

【算法】最小生成树—Prim算法与Kruskal算法

Prim算法和Kruskal算法都是解决最小生成树问题的经典算法。最小生成树是原图的最小连通子图&#xff0c;它包含原图的全部结点&#xff0c;且保持图连通的所有边代价和最小。一个连通图可能有多个最小生成树。 一、Prim算法 含义 Prim算法&#xff0c;也被称为普里姆算法&…

项目解决方案: 实时视频拼接方案介绍

目 录 1、实时视频拼接概述 2、适用场景 3、系统介绍 3.1拼接形式 3.1.1横向拼接 3.1.2纵向拼接 3.2前端选择 3.2.1前端类型 3.2.2推荐配置 3.3后端选择 3.3.1录像回放 3.3.2客户端展示 4、拼接方案介绍 4.1基于4K摄像机的拼接方案 4.1.1系统架构…

ESP8266智能家居(3)——单片机数据发送到mqtt服务器

1.主要思想 前期已学习如何用ESP8266连接WIFI&#xff0c;并发送数据到服务器。现在只需要在单片机与nodeMCU之间建立起串口通信&#xff0c;这样单片机就可以将传感器测到的数据&#xff1a;光照&#xff0c;温度&#xff0c;湿度等等传递给8266了&#xff0c;然后8266再对数据…

typescript 的常用方式

文章目录 前言一、绑定props 默认值的方式&#xff1a;withDefaults1.vue2 的props设置默认值2.vue3 的props设置默认值(1) 不设置默认值的写法(2) 设置默认值的写法&#xff08;分离模式&#xff09;(3) 设置默认值的写法&#xff08;组合模式&#xff09; 二、定义一个二维数…

Qt|QTreewidget类下函数qt助手详解说明示例(上)

该系列持续更新&#xff0c;喜欢请一键三连&#xff0c;感谢各位大佬。 QT5.14.2 参考官方QT助手 文章目录 QTreeWidget ClasspropertiesPublic Functions默认构造函数默认析构函数添加根节点void addTopLevelItem(QTreeWidgetItem *item)添加多个根节点void addTopLevelItems…

Linux Shell脚本练习(一)

一、 Linux下执行Shell脚本的方式&#xff1a; 1、用shell程序执行脚本&#xff1a; a、根据你的shell脚本的类型&#xff0c;选择shell程序&#xff0c;常用的有sh&#xff0c;bash&#xff0c;tcsh等 b、程序的第一行#!/bin/bash里面指明了shell类型的&#xff0c;比如#!/…

linux查看服务器内核CUP版本相关命令

服务器参考 计算架构&#xff1a;x86-64产品系列&#xff1a;华为云耀云服务器操作系列&#xff1a;CentOS 7 执行uname -a查看服务器内核版本 Linux hecs-82210 3.10.0-1160.92.1.el7.x86_64 #1 SMP Tue Jun 20 11:48:01 UTC 2023 x86_64 x86_64 x86_64 GNU/Linux执行hostn…

Aws Ec2服务器设置密码登录

通过密钥&#xff0c;ssh登录到服务器 切换到root sudo -i开始设置root的新密码 passwd root输入并确认新密码即可 5.修改ssh配置文件 vim /etc/ssh/sshd_config6.重启sshd配置 systemctl restart sshd

关于电脑一天24小时多少度电电脑的一天用电量计算

随着这几年物价的上涨&#xff0c;一些地区的电价越来越高&#xff0c;而我们经常需要使用电脑&#xff0c;那么一台电脑一天24小时用多少度电呢&#xff1f; 如何计算电脑一天的用电量&#xff1f; 让我们跟随小编来了解更多吧。 1、功耗、主机箱功耗 现在的计算机中&#xf…

2000-2022年上市公司绿色专利申请占比/数据

2000-2022年上市公司绿色专利申请占比数据 1、时间&#xff1a;2000-2022年 2、来源&#xff1a;国家知识产权局、WIPO绿色专利清单 3、指标&#xff1a;年份、股票代码、股票简称、行业代码、省份、城市、区县、行政区划代码、城市代码、区县代码、首次上市年份、上市状态、…

广和通发布基于MediaTek T300平台的RedCap模组FM330系列及解决方案

世界移动通信大会MWC 2024期间&#xff0c;广和通发布基于MediaTek T300平台的RedCap模组FM330系列&#xff0c;加速5G-A繁荣发展。FM330系列及其解决方案采用全球先进RedCap方案&#xff0c;满足移动宽带和工业互联对高能效的需求。 广和通FM330系列采用全球首款6nm制程且集成…

什么是回表、索引覆盖、索引下推【重点】

参考链接 【1】https://xiaolincoding.com/mysql/index/index_interview.html#%E6%8C%89%E6%95%B0%E6%8D%AE%E7%BB%93%E6%9E%84%E5%88%86%E7%B1%BB 【2】https://www.toutiao.com/article/7095749260137726476/?wid1709192807222 【3】https://zhuanlan.zhihu.com/p/401198674…

压缩式 交换式 碎片整理 :(使碎片减少或没有)

交换式碎片整理 首先流程 是 p3这个程序在运行&#xff0c;p1p2p4 的话在等待 &#xff0c;然后p3这时要多用3个内存块&#xff0c;这是 p4 通过拷贝&#xff0c;将内存拷贝到磁盘上&#xff0c;对应的数据也是从主存中cp到磁盘此时主存多出3个内存块给p3继续使用 2.压缩式碎片…

请求响应与统一响应结果

1.请求响应 1.安装postman 2.简单的参数 //原始的请求参数的方法RequestMapping("/simoleParam")public String simpleParam(HttpServletRequest request){String name request.getParameter("name");String ageStr request.getParameter("age&quo…

android开发书籍推荐,android面试复习

笼统来说&#xff0c;中年程序员容易被淘汰的原因其实不外乎三点。 1、输出能力已到顶点。这个人奋斗十来年了&#xff0c;依旧碌碌无为&#xff0c;很明显这人的天花板就这样了&#xff0c;说白了&#xff0c;天赋就这样。 2、适应能力越来越差。年纪大&#xff0c;有家庭&…