利用Python进行数据分析(附详细案例)

news2025/1/19 22:56:05

一、前期准备

分析要用到两个包:NumPy和Pandas,首先确保jupyter中成功安装了这两个包。

#导入numpy包
import numpy as np
#导入pandas包
import pandas as pd

二、基础知识

2.1 一维数据分析:NumPy
在这里插入图片描述
2.2 一维数据结构:Pandas
在这里插入图片描述
2.3 二维数据分析:numpy对应array
在这里插入图片描述
2.4 二维数据分析:pandas对应数据框DateFrame
在这里插入图片描述
此处遇到一个问题:读取Excel文件报错。

解决方法:

1 查看Excel文件存放路径

具体操作:点击文件名,鼠标右键,选择“属性”,找到下面标红的两个地方。
在这里插入图片描述
2 将上面标红的两处合成文件的路径,

格式为文件夹\文件名,比如F:\ann\Untitled1.ipynb

3 最后把路径中全部的斜杠(/)或者反斜杠(\)替换为双反斜杠(\)

最后的路径为F:\ann\Untitled1.ipynb

三、Python具体案例分析:药店销售数据

在这里插入图片描述

3.1 提出问题

分析指标:

月均消费次数
月均消费金额
客单件
消费趋势

3.2 理解数据
在这里插入图片描述
3.3 清洗数据
在这里插入图片描述
3.3.1 选择子集
在这里插入图片描述
3.3.2 列名重命名
在这里插入图片描述
3.3.3 缺失数据处理(dropna()函数)

Python缺失值有3种:None,NA,NaN。(分析数据时,如果遇到什么错误,比如float错误,就要考虑是否为缺失值,若是,则需要处理掉)。

  1. Python内置的None值;
  2. pandas中,将缺失值表示 为NA,表示不可用not available;
  3. 对应数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据;

None和NaN的区别:None是Python的一种数据类型(NoneType),NaN是浮点类型(float),两个都用作空值。
在这里插入图片描述
3.3.4 数据类型转换
在这里插入图片描述
3.3.5 数据排序
在这里插入图片描述
3.3.6 异常值处理
在这里插入图片描述
3.4 构建模型

3.4.1 指标1:月均消费次数=总消费次数/月份数
在这里插入图片描述
3.4.2 指标2:月均消费金额=总消费金额/月份数
在这里插入图片描述
3.4.3 指标3:客单价=总消费金额/总消费次数

客单价(per customer transaction):商场(超市)每位顾客平均购买商品的金额,即是平均交易金额。
在这里插入图片描述

3.4.3 消费趋势
在这里插入图片描述

#学习资源推荐

零基础Python学习资源介绍

👉Python学习路线汇总👈
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。(学习教程文末领取哈)
在这里插入图片描述

👉Python必备开发工具👈
在这里插入图片描述

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉Python学习视频600合集👈
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述

👉实战案例👈
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

👉100道Python练习题👈
检查学习结果。
在这里插入图片描述
👉面试刷题👈
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

资料领取

上述这份完整版的Python全套学习资料已经上传CSDN官方,朋友们如果需要可以微信扫描下方CSDN官方认证二维码输入“领取资料” 即可领取。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1455290.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

实习日志14

完善条件查询和word生成列表 条件查询 word生成列表 1.阶段性总结 1.1.入职培训 首先,蔡老师的活字格软件开发入门和应用培训为我提供了深入了解软件开发的机会。通过学习,我掌握了一些基础的开发技能,尤其是在数据库设计和管理方面有了更深…

SD-WAN稳定性如何?

随着网络技术的不断发展,软件定义广域网(SDWAN)作为一种新兴的网络架构,受到了越来越多企业的青睐。然而,对于许多人来说,关于SDWAN最关键的问题之一就是它的稳定性。本文将探讨SDWAN的稳定性表现&#xff…

普法GraphicBuffer诞生以及跨进程传递

GraphicBuffer诞生以及跨进程传递重认识 引言 对于Android的Graphics图形堆栈这块,自我感觉看了蛮多的博客啊文档(不管是比较老的还是新一点的)。但是仅仅只是看了而已,都是蜻蜓点水,没有进行记录也没有总结。所以每次哪怕阅读过程中产业了很…

统计图柱形图绘制方法

统计图柱形图绘制方法 常用的统计图有条形图、柱形图、折线图、曲线图、饼图、环形图、扇形图。 前几类图比较容易绘制,饼图环形图绘制较难。 今提供条形图和柱形图的绘制方法,附加环形图和艺术环图的绘制方法供参考。 本方法采用C语言的最基本功能&…

Vue3快速上手(七) ref和reactive对比

一、ref和reactive对比 表格形式更加直观吧: 项目refreactive是否支持基本类型支持不支持是否支持对象类型支持支持对象类型是否支持属性直接赋值不支持,需要.value支持是否支持直接重新分配对象支持,因为操作的.value不支持,需…

Shiro-05-shiro 基础知识补充密码学+哈希散列

密码学 密码术是隐藏或混淆数据的过程,因此窥探眼睛无法理解它。 Shiro的加密目标是简化JDK的加密支持并使之可用。 需要特别注意的是,密码通常不是特定于主题的,因此Shiro API的其中一个领域不是特定于主题的。 即使未使用“主题”&…

vue3-渲染机制

渲染机制 Vue 是如何将一份模板转换为真实的 DOM 节点的,又是如何高效地更新这些节点的呢?我们接下来就将尝试通过深入研究 Vue 的内部渲染机制来解释这些问题。 虚拟 DOM 你可能已经听说过“虚拟 DOM”的概念了,Vue 的渲染系统正是基于这…

基于JAVA(springboot)后台微信自我健康管理小程序系统设计与实现

博主介绍:黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程&#xff…

Javaweb基础-前端工程化学习笔记

前端工程化&#xff1a; 一.ES6 变量与模版字符串 let 和var的差别&#xff1a; <script>//1. let只有在当前代码块有效代码块. 代码块、函数、全局{let a 1var b 2} console.log(a); // a is not defined 花括号外面无法访问console.log(b); // 可以正常输出…

DTAN: Diffusion-based Text Attention Network for medical imagesegmentation

DTAN:基于扩散的医学图像分割文本关注网络 摘要 在当今时代&#xff0c;扩散模型已经成为医学图像分割领域的一股开创性力量。在此背景下&#xff0c;我们引入了弥散文本注意网络(Diffusion text - attention Network, DTAN)&#xff0c;这是一个开创性的分割框架&#xff0c…

【c++ debug】记一次protobuf结构相关的coredump问题

文章目录 1. 问题现象2. 问题描述3. 问题分析4. 问题根因5. 问题修复6. 补充&#xff1a;类成员变量定义为引用类型 1. 问题现象 其中curr_lanes是一个目标上一帧的当前车道current_lanes_curr_lane是lane_id对应的LaneInfo信息现象&#xff1a;在lane_info->lane().success…

《隐私计算简易速速上手小册》第5章:隐私计算在不同行业的应用(2024 最新版)

文章目录 5.1 金融行业5.1.1 基础知识5.1.2 重点案例:欺诈检测系统5.1.3 拓展案例 1:信用评分模型5.1.4 拓展案例 2:市场趋势分析5.2 医疗保健行业5.2.1 基础知识5.2.2 重点案例:匿名化患者数据分析5.2.3 拓展案例 1:使用差分隐私进行临床试验数据分析5.2.4 拓展案例 2:安…

【机构vip教程】​python(1):python正则表达式匹配指定的字符开头和指定的字符结束

一&#xff0c;使用python的re.findall函数&#xff0c;匹配指定的字符开头和指定的字符结束 代码示例&#xff1a; 1 import re 2 # re.findall函数;匹配指定的字符串开头和指定的字符串结尾(前后不包含指定的字符串) 3 str01 hello word 4 str02 re.findall((?<e).*?…

大模型LLM训练显存消耗详解

参考论文&#xff1a;ZeRO: Memory Optimizations Toward Training Trillion Parameter Models 大模型的显存消耗一直都是面试常见的问题&#xff0c;这次我就彻彻底底的根据论文ZeRO中的调研和分析做一次分析 显存消耗的两个部分&#xff1a;Model States&#xff08;跟模型的…

【机构vip教程】Android SDK手机测试环境搭建

Android SDK 的安装和环境变量的配置 前置条件&#xff1a;需已安装 jdk1.8及 以上版本 1、下载Android SDK&#xff0c;解压后即可&#xff08;全英文路径&#xff09;&#xff1b;下载地址&#xff1a;http://tools.android-studio.org/index.php/sdk 2、新建一个环境变量&…

linux内核模块module_put()函数详解--03

对应module_put()函数详细用法分享。 第一&#xff1a;函数简介 //函数原型 void module_put(struct module * module) //函数功能 该函数功能是将一个特定模块module的引用计数减一 这样当一个模块的引用计数不为0而不能被内核卸载的 时候&#xff0c;可以调用该函数一次或多…

这样用TVS管

对于工程师来说&#xff0c;浪涌保护不仅仅是选择合适的电源板或者拔下几根电缆&#xff0c;主要涉及在 PCB 布局中放置瞬态保护组件并应用明确的接地策略。 TVS 二极管是用于保护PCB布局中组件的常用组件&#xff0c;这些组件放置在数据线上&#xff0c;一旦电路中接收到ESD脉…

出生医学证明档案管理系统

出生医学证明档案管理系统是一种用于管理和维护出生医学证明档案的软件系统。该系统可以帮助医院、出生登记机构和其他相关部门有效地管理和存储出生医学证明档案&#xff0c;提高工作效率和数据安全性。 专久智能出生医学证明档案管理系统的核心功能包括&#xff1a; 1. 档案管…

Linux超详细笔记

文章目录 Linux学习笔记操作系统Linux初识Linux的诞生Linux内核Linux发行版 虚拟机VMware安装远程连接Linux系统FinalShellFinalShell连接Linux WSL配置UbuntuLinux常用命令1.入门2.ls命令cd命令3.pwd命令4.相对路径和绝对路径5.mkdir命令6.文件操作命令&#xff08;1&#xff…

【机构vip教程】Charles(1):Charles的介绍及安装

Charles Charles 是在 Mac &#xff08;Charles是跨平台的 &#xff09;下常用的网络封包截取工具&#xff0c;在做移动开发、测试时&#xff0c;我们为了调试与服务器端的网络通讯协议&#xff0c;常常需要截取网络封包来分析。Charles是一个HTTP代理服务器,HTTP监视器,反转代…