面试题: LEAD 和 LAG 求每个用户的页面停留时长

news2026/2/8 9:51:30

我们先来看看这两个函数的语法：

LEAD(col,n,default) OVER()

说明：用于统计窗口内向下第n行的值
参数1：为要取值的列名
参数2：为向下第n行，默认值为1，这个值是固定的，不能动态的变化
参数3：为默认值，当向下第n行的值为NULL时，取默认值，如果不指定，则默认值为NULL

LAG(col,n,default) OVER()

说明：用于统计窗口内向上第n行的值，与lead()刚好相反
参数1：为要取值的列名
参数2：为向上第n行，默认值为1，这个值是固定的，不能动态的变化
参数3：为默认值，当向上第n行的值为NULL时，取默认值，如果不指定，则默认值为NULL

实例：求每个用户的页面停留时长

页面停留时长：用户进入A页面，又进入B页面。进入A页面的时间为date1，进入B页面的时间为date2，那么在A页面的停留时间为date2-date1。实际生产场景中，可能会考虑不超过30min等等因素。

1.1、创造数据

CREATE TABLE log_info
( 
 uid string,
 dateline string,
 page string
);
-- 模拟数据 
INSERT INTO log_info VALUES ('1001', '2021-08-10 10:18:31', 'url3'),
('1001', '2021-08-10 10:01:24', 'url1'),
('1001', '2021-08-10 10:05:22', 'url2'),
('1002', '2021-08-10 10:10:31', 'url1'),
('1002', '2021-08-10 10:15:31', 'url2'),
('1002', '2021-08-10 10:18:31', 'url3');

1.2、常规方法: 排序，自关联

1.2.1、排序

SELECT *, 
    ROW_NUMBER() OVER(PARTITION BY uid ORDER BY dateline) rank
FROM log_info

在这里插入图片描述

1.2.2、自关联

SELECT t1.uid,
    t1.dateline start_time,
    t2.dateline end_time,
    t1.page
FROM 
    (SELECT *,
         ROW_NUMBER() OVER(PARTITION BY uid ORDER BY  dateline) rank
    FROM log_info ) t1
LEFT JOIN 
    (SELECT *,
         ROW_NUMBER() OVER(PARTITION BY uid ORDER BY  dateline) rank
    FROM log_info ) t2
ON t1.uid = t2.uid AND t1.rank+1=t2.rank;

用户进入一个页面和跳到另一个页面的时间，通过这两个时间的差值就是我们要计算的用户页面停留时长
在这里插入图片描述

1.3、LEAD

SELECT   uid,
   dateline,
   lead(dateline,1) over(distribute by uid sort by dateline asc) as dateline_end,
   page
 FROM log_info;

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/65809.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

面试题: LEAD 和 LAG 求每个用户的页面停留时长

实例：求每个用户的页面停留时长

1.1、创造数据

1.2、常规方法: 排序，自关联

1.2.1、排序

1.2.2、自关联

1.3、LEAD

相关文章

Redis事务、pub/sub、PipeLine-管道、benchmark性能测试详解

SpringCloud Alibaba学习笔记，记重点！！

深入了解- TCP拥塞状态机 tcp_fastretrans_alert

投资者该如何看待股票接口？

使用gitlab的cicd自动化部署vue项目shell流程踩坑之路

自从面试了一个测试岗00后卷王，老油条感叹真干不过，但是...

当线下门店遇上AI：华为云ModelBox携手佳华科技客流分析实践

linux安装mysql8超详细到每步命令

如何理解死锁?

一种非线性权重的自适应鲸鱼优化算法IMWOA附matlab代码

uni-app简介、条件编译、App端Nvue开发、HTML5+、开发环境搭建、自定义组件、配置平台环境、uniCloud云开发平台

Spring6 正式发布！重磅更新，是否可以拯救 Java

html网页制作期末大作业成品：基于HTML+CSS+JavaScript简洁汽车网站(7页)

「Redis」07 持久化操作（RDB、AOF）

实战 Creator 2.x 项目升级 3.x！避坑要点与基础 API 写法差异总结

发布3天获推荐10w+，视频号内容出现新玩法？

大数据流批一体

VS2022环境下C++ DLL动态链接库的编写和调用

ad2019--LED灯按键类创建元件库

用MybatisPlus代码生成器生成代码