【PostgreSQL】实战篇——使用 PostgreSQL 进行数据分析与报表生成

news2024/10/5 14:15:39

在数据驱动的商业环境中,数据分析和报表生成是企业决策的重要组成部分。PostgreSQL作为一个强大的开源关系数据库管理系统,提供了丰富的功能和灵活的工具,能够高效地处理和分析数据。无论是进行简单的统计分析,还是复杂的数据挖掘,PostgreSQL都能满足需求。

应用背景

在实际应用中,企业常常需要从数据库中提取、分析和可视化数据,以便做出更好的决策。

例如,零售公司可能需要分析销售数据以确定最佳销售策略,而金融机构则可能需要监控交易数据以识别潜在的欺诈行为。通过使用PostgreSQL的分析功能,用户可以快速获取洞察,生成报表,支持决策过程。

PostgreSQL中的数据分析和报表生成

PostgreSQL提供了多种分析函数和工具,以下是一些常用的分析函数及其应用示例。

1. 基本聚合函数

聚合函数用于对一组值进行计算,常用的聚合函数包括SUM()AVG()COUNT()MAX()MIN()等。

示例:计算销售总额和平均销售额

SELECT 
    product_id,
    SUM(sales_amount) AS total_sales,
    AVG(sales_amount) AS average_sales
FROM 
    sales
GROUP BY 
    product_id
ORDER BY 
    total_sales DESC;

解释:

  • SUM(sales_amount)计算每种产品的总销售额。

  • AVG(sales_amount)计算每种产品的平均销售额。

  • GROUP BY product_id将结果按产品ID分组。

  • ORDER BY total_sales DESC将结果按总销售额降序排列。

2. 窗口函数

窗口函数允许我们在不改变结果集的情况下进行复杂的分析,比如计算运行总和、排名等。

示例:计算每个产品的销售排名

SELECT 
    product_id,
    sales_amount,
    RANK() OVER (ORDER BY sales_amount DESC) AS sales_rank
FROM 
    sales;

解释:

  • RANK() OVER (ORDER BY sales_amount DESC)为每个产品的销售额分配一个排名。

  • 这个查询将返回每个产品的销售额及其对应的排名,便于分析销售表现。

3. CTE(公共表表达式)

CTE可以让复杂的查询更具可读性,尤其是在多层嵌套查询时。

示例:计算每个产品的累计销售额

WITH sales_summary AS (
    SELECT 
        product_id,
        SUM(sales_amount) AS total_sales
    FROM 
        sales
    GROUP BY 
        product_id
)
SELECT 
    product_id,
    total_sales,
    SUM(total_sales) OVER (ORDER BY total_sales DESC) AS cumulative_sales
FROM 
    sales_summary;

解释:

  • 首先,CTE sales_summary计算每个产品的总销售额。

  • 然后,在外部查询中,使用SUM(total_sales) OVER (ORDER BY total_sales DESC)计算累计销售额。

4. 数据可视化

虽然PostgreSQL本身不提供可视化工具,但可以与多种数据可视化工具(如Tableau、Power BI、Grafana等)结合使用,通过SQL查询提取数据并进行可视化。

示例:结合Python和Matplotlib进行可视化

import psycopg2
import matplotlib.pyplot as plt

# 连接到PostgreSQL数据库
conn = psycopg2.connect("dbname='yourdbname' user='youruser' password='yourpassword'")
cur = conn.cursor()

# 执行查询
cur.execute("""
    SELECT 
        product_id, 
        SUM(sales_amount) AS total_sales
    FROM 
        sales
    GROUP BY 
        product_id
    ORDER BY 
        total_sales DESC;
""")
data = cur.fetchall()

# 数据处理
products = [row[0] for row in data]
sales = [row[1] for row in data]

# 绘制条形图
plt.bar(products, sales)
plt.xlabel('Product ID')
plt.ylabel('Total Sales')
plt.title('Total Sales by Product')
plt.show()

# 关闭连接
cur.close()
conn.close()

解释:

  • 使用psycopg2库连接到PostgreSQL数据库并执行查询。

  • 将查询结果提取到Python中,并使用Matplotlib库绘制条形图,展示每个产品的总销售额。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2189995.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Github界面学习

之前并没有使用到其他功能大多数是看代码,然后看discussion; now,在做毕设的时候发现了一个gymnasium关于异步环境的bug,查看github发现已经被修复了; 因此希望学习一下修复者是在哪个module修复以及如何修复以及提交代码&#…

Spring Boot框架在大学生就业招聘中的应用

3系统分析 3.1可行性分析 通过对本大学生就业招聘系统实行的目的初步调查和分析,提出可行性方案并对其一一进行论证。我们在这里主要从技术可行性、经济可行性、操作可行性等方面进行分析。 3.1.1技术可行性 本大学生就业招聘系统采用JAVA作为开发语言,S…

kaggle实战3RossmanStore商店销售额预测XgBoost解决回归问题案例1

kaggle实战2信用卡反欺诈逻辑回归模型案例1 数据集下载地址 https://download.csdn.net/download/AnalogElectronic/89844637 https://tianchi.aliyun.com/dataset/89785 加载数据 #预测销售额 回归问题 import numpy as np import pandas as pd import matplotlib.pyplot a…

无神论文解读之ControlNet:Adding Conditional Control to Text-to-Image Diffusion Models

一、什么是ControlNet ControlNet是一种能够控制模型生成内容的方法,能够对文生图等模型添加限制信息(边缘、深度图、法向量图、姿势点图等),在当今生成比较火的时代很流行。 这种方法使得能够直接提供空间信息控制图片以更细粒…

招联2025校招内推倒计时

【投递方式】 直接扫下方二维码,或点击内推官网https://wecruit.hotjob.cn/SU61025e262f9d247b98e0a2c2/mc/position/campus,使用内推码 igcefb 投递) 【招聘岗位】 后台开发 前端开发 数据开发 数据运营 算法开发 技术运维 软件测试 产品策…

【课程学习】随机过程之泊松过程

随机过程之泊松过程 泊松分布泊松过程 泊松分布 二项分布是离散性的分布,泊松分布是把二项分布取n趋于无穷得到的连续分布。也就是在一段时间内不停的观察某件事情发生的次数。 如:一个小时内观察一段路上经过行人的数目,如果每个半个小时观…

nginx和gateway的关系和区别

在技术选型时,选择 Nginx 和 Spring Cloud Gateway(或简称为 Gateway)主要取决于具体应用场景和技术需求。下面是两者的一些关键差异和适用场景。 一、Nginx 概念 Nginx 是一个高性能的 Web 服务器和反向代理服务器,常被用作静…

智能手表(Smart Watch)项目

文章目录 前言一、智能手表(Smart Watch)简介二、系统组成三、软件框架四、IAP_F411 App4.1 MDK工程结构4.2 设计思路 五、Smart Watch App5.1 MDK工程结构5.2 片上外设5.3 板载驱动BSP5.4 硬件访问机制-HWDataAccess5.4.1 LVGL仿真和MDK工程的互相移植5…

CSRF | CSRF 漏洞介绍

关注这个漏洞的其他相关笔记:CSRF 漏洞 - 学习手册-CSDN博客 0x01:CSRF 漏洞简介 CSRF(Cross-Site request forgery,跨站请求伪造)也被称为 One Click Attack 或者 Session Riding,通常缩写为 CSRF 或者 X…

【Java】IntelliJ IDEA开发环境安装

一、下载 官方地址:https://www.jetbrains.com/idea/ 点击Download直接下载 二、安装 双击安装包,点击Next 选择安装路径,点击Next 勾选安装内容 安装完成。 三、创建项目 打开IDEA,填写项目名称,选择项目安装路径…

S7-200 SMART的数据类型说明

S7-200 SMART的数据主要分为: 与实际输入/输出信号相关的输入/输出映象区: I:数字量输入(DI)Q:数字量输出(DO)AI:模拟量输入AQ:模拟量输出 内部数据存储区…

STM32 Hal库SDIO在FATFS使用下的函数调用关系

STM32 Hal库SDIO在FATFS使用下的函数调用关系 本文并不将FATFS的相关接口操作,而是将HAL在使用FATFS通过SDIO外设管理SD卡时,内部函数的调用逻辑,有助于当我们使用CUBEMX生成FATFS读取SD卡的代码时无法运行时Debug。本文也会说明一些可能出现…

如何编写一个优雅的commit message

在Git中,git commit 命令扮演着至关重要的角色。它的主要作用是将暂存区(staging area)里的改动内容提交到本地仓库(repository)中,形成一个新的版本或提交(commit)。这个过程是 Git…

渗透测试入门学习——使用python脚本自动识别图片验证码,OCR技术初体验

写在前面 由于验证码在服务端生成后存储在服务器的session中,而标用于标识用户身份的sessionid存在于用户cookie中 所以本次识别验证码时需要用requests.session()创建会话对象,模拟真实的浏览器行为,保持与服务器的会话才能获取登录时服务…

wsl2 ubuntu 桥接以太网卡

注意:此方法需要至少 Windows 11 22H2。桥接模式就是将主机网卡与虚拟机虚拟的网卡利用虚拟网桥进行通信。 在桥接的作用下,类似于把宿主机虚拟为一个交换机,所有桥接设置的虚拟机连接到这个交换机的一个接口上,宿主机也同样插在这…

通信工程学习:什么是RARP反向地址解析协议

RARP:反向地址解析协议 RARP(Reverse Address Resolution Protocol,反向地址解析协议)是一种网络协议,其主要作用是在设备只知道物理地址(如MAC地址)时,允许其从网关服务器的地址解析…

致亲爱的Android studio

你的未来发展趋势: 可不可以把兼容性,什么的搞得更好。起因是我想写期末大作业,然后简单的把功能写的差不多了之后,我就想到处看看有没有一套比较好的类似于组件库的东西,但是没找到,然后就把目标锁定到了G…

Vue入门-Node.js安装

进入Node.js中文网 ​​​​​​​点击进入Node.js中文网 或者手动输入网址: https://www.nodejs.com.cn/download.html 点击下载64位安装包: 下载好之后双击进行安装 可选择个性化安装或默认安装 直接点【Next】按钮,此处可根据个人需求…

深度解析 HTTP

我的主页:2的n次方_ 1. HTTP 的简单介绍 HTTP :超文本传输协议,不仅能传输文本,还能传输图片,音频文件,视频 目前基本上都用的是 1.1 版本 https 可以认为是 http 的升级版,区别就是引入了…

【pytorch】张量求导4

再再接上文,看到作者有一个关于向量乘矩阵的描述。 经过搜索发现,现在的pytorch已经修复了这一问题,提供了mv()和matmul()两种方式实现矩阵和一维向量的乘积,可以参看这篇文章。 经过查阅pytorch的文件,找到了cuda侧…