数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(3)

news2024/10/6 10:33:53

文章目录

    • 1.读取本的数据集
    • 2.查看数据的前5行
    • 3.将salary列的数据转换为最大值和最小值的平均值
    • 4.将数据根据学历进行分组计算平均值
    • 5.将createTime列转换为月日
    • 6.查看所索引,数据类型和内存信息
    • 7.查看数值型列的汇总统计
    • 8.新增一列根据salary将数据分为三组
    • 9.按照salary列队数据降序排序
    • 10.取出第33行的数据

1.读取本的数据集

# 读取本地的数据集
# 数据集可以私信我我发给你们,同样也可以
df = pd.read_excel('data1.xlsx')  
df

在这里插入图片描述

2.查看数据的前5行

使用head()函数查看数据的前几行,可以传入具体的数,默认是5

# 查看数据的前5行
df.head()

在这里插入图片描述

3.将salary列的数据转换为最大值和最小值的平均值

map和apply函数接受的参数都是一个行数,而且都不会直接改变原数据,都是返回一个新的DataFrame对象

# 将salary列数据转换为最大值和最小值的平均值
# 方式一 使用map函数
def fun(x):
    a,b = x.split('-')
    a = int(a.strip('k'))*1000
    b = int(b.strip('k'))*1000
    return int((a+b)/2)
df['salary'].map(fun)

# 方式二使用apply函数
df['salary'] = df['salary'].apply(fun)
df

4.将数据根据学历进行分组计算平均值

使用groupby()函数进行分组

# 将数据根据学历进行分组并计算平均值
df.groupby('education').mean()

在这里插入图片描述

5.将createTime列转换为月日

# 将create Time列转换为月日

for i in range(len(df)):
    df.iloc[i,0] = df.iloc[i,0].to_pydatetime().strftime('%m-%d')

df.head()

在这里插入图片描述

6.查看所索引,数据类型和内存信息

info()函数

# 查看索引,数据类型,和内存信息
df.info()

在这里插入图片描述

7.查看数值型列的汇总统计

describe() 返回的数据包括,数量,数据的平均值,标准差,最小值,最大值,25%、50% 75 % 的分位数

# 查看数值型列的汇总统计
df.describe()

在这里插入图片描述

8.新增一列根据salary将数据分为三组

# 新增一列根据salary将数据分为三组,并且设置等级
bins = [0,5000,20000,50000]
group_names = ['底','中','高']

df['categories'] = pd.cut(df['salary'],bins,labels=group_names)
df

在这里插入图片描述

9.按照salary列队数据降序排序

sort_values 默认是升序

# 按照salary列对数据降序排列
# ascending=False降序
# ascending=True升序

df.sort_values('salary',ascending=False)

在这里插入图片描述

10.取出第33行的数据

根据索引选出第33行,索引从0开始

# 取出第33行的数据
df.loc[32]

在这里插入图片描述

今天的10道题涉及的东西多了一些,groupbydescribecutsort_valuesinfo等,如果想要全部的了解这些,仅靠这10道题是远远不够的,希望大家能够额外找些试题练习,也可以根据跟着博主的文章一块刷题✨✨✨

推荐使用牛客网进行练习 直达牛客,快人一步

在这里插入图片描述

欢迎您的关注
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1629.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Day31】力扣算法(超详细思路+注释)[1441. 用栈操作构建数组 ] [621. 任务调度器]

您的点赞,收藏以及关注是对作者最大的鼓励喔 ~~ 刷题打卡,第 三十一 天题目一、1441. 用栈操作构建数组题目二、621. 任务调度器题目一、1441. 用栈操作构建数组 原题链接:1441. 用栈操作构建数组 题目描述: 给你一个数组targe…

5 个 Flutter VSCode 技巧和窍门,你可以马上使用!

5 个 Flutter VSCode 技巧和窍门,你可以马上使用! 前言 今天,我将向你展示 5 个非常有用的 Flutter 技巧,你可以立即应用到你的项目中。我不会给你任何软件包或扩展,但非常简单,但非常有用的技巧&#xff0…

【大厂高频真题100题】单词拆分 真题练习第7题 持续更新~

单词拆分 描述: 给你一个字符串 s 和一个字符串列表 wordDict 作为字典。请你判断是否可以利用字典中出现的单词拼接出 s 。 注意:不要求字典中出现的单词全部都使用,并且字典中的单词可以重复使用。 示例 1: 输入: s = "leetcode", wordDict = ["leet&q…

德邦股份第三季营收80亿:净利2.56亿 京东控制72%股权

雷递网 雷建平 10月28日德邦物流股份有限公司(证券代码:603056,证券简称:德邦股份)今日发布财报。财报显示,德邦股份2022年前9个月营收为228.17亿元,较上年同期增长1.14%;净利为3.5亿…

springboot+jsp志愿者岗位报名培训系统javaweb

当我知道北京冬奥会申请成功,也刚好是我的毕业,觉得自已需要做点什么,北京冬奥会申请成功觉得自已去做一个志愿者,这样不断丰富了自已的经历,还能给自已在现实生活中上了一课,为了迎合志愿者需求&#xff0…

每日学习06:=和== 和 equals 你学废了吗?

1.赋值运算符 :是赋值运算符。赋是指为变量或常量指定数值的符号。赋值运算符的符号为“”,它是双目运算符,左边的操作数必须是变量,不能是常量或表达式。 赋值运算符的优先级低于算术运算符,结合方向是自右向左&…

Python基础_第4章_Python数据序列(容器)

Python基础_第4章_Python数据序列(容器) 文章目录Python基础_第4章_Python数据序列(容器)Python数据序列(容器)一、作业回顾1、面试题2、报数字(数7)二、了解字符串1、字符串的定义2…

蓝桥杯备赛(二)

目录 前言: 一、ASC 分析 代码实现 二、 卡片 分析 代码实现 三、 直线 分析 代码实现 四、货物摆放 分析 代码实现 小结: 前言: 在刷题的过程中,发现蓝桥杯的题目和力扣的差别很大。让人有一种不一样的感觉&#xff…

【IO】文件操作基础知识

目录 1.文件的操作: 2.文件内容的读写—数据流: 3.文件操作练习: 1.文件的操作: 文件分为狭义上的文件和广义的文件。狭义上的文件:存储在硬盘上的数据,以“文件”为单位进行组织。文件夹也叫做目录。通…

图第三遍补充(各种算法与力扣)

一、一些补充的概念 如果具有n个结点的图中是一个环,则会有n个不同的生成树,每个生成树有n-1条边 连通、连通图、连通分量:路径,无向图 ,极大连通子图为连通分量,边数小于n-1,则图必为非连通图…

Xilinx XC7Z020双核ARM+FPGA开发板试用合集——自定义硬件工程

本期测试板卡是一款基于Xilinx Zynq-7000系列XC7Z010/XC7Z020高性能低功耗处理器设计的异构多核SoC工业级核心板,处理器集成PS端双核ARM Cortex-A9 + PL端Artix-7架构28nm可编程逻辑资源。 下面是测试内容,欢迎查阅。 SD卡启动设置 根据《TLZ7x-EasyEVM-S评估板硬件说明书》…

开心消消乐游戏网页设计作品 学生dreamweaver作业静态HTML网页设计模板 游戏主题网页作业制作

🎉精彩专栏推荐👇🏻👇🏻👇🏻 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业…

有营养的算法笔记(八)

有营养的算法笔记八摆砖块问题数字转换K递增子序列魔法子数组摆砖块问题 1.题目描述 给定一个正数数组arr,其中每个值代表砖块长度。所有砖块等高等宽,只有长度有区别,每一层可以用1块或者2块砖来摆。要求每一层的长度一样 要求必须使用所有…

【阅读笔记】低照度图像增强-《An Integrated Neighborhood Dependent...

本文介绍的是一种比较实用的低照度图像增强算法,选自2004年Tao的一篇论文,名称是《An Integrated Neighborhood Dependent Approach for Nonlinear Enhancement of Color Images 》 概述 图像中暗区图像增强的基本机制是对图像的亮度进行动态范围压缩&…

玩转rancher 2.6之 monitor监控

目录 前言 1. 安装monitor 2. 安装prometheus-webhook-dingtalk 2.1 配置钉钉告警配置文件 2.2 创建钉钉告警模板 2.3 创建dingtalk configmap配置文件 2.4 安装dingtalk 2.5 dingtalk调用方法 3. 配置告警 3.1 配置告警接收者 3.2 配置路由默认告警接收者 4. 测试 前…

初识C++ (三)

初识C 三引用一. 引用的概念代码演示二. 引用特性1. 引用在定义时必须要初始化2. 一个引用可以有多个实体3. 引用一旦引用一个实体,再不能引用其他实体三. 使用场景1. 做参数2. 做返回值内存销毁后空间还在吗?内存销毁后我们还能访问嘛?结论优…

论文写作——ICASSP论文写作及投稿

记录 ICASSP2023 写作投稿过程。小白如何写好并投稿自己的第一篇英文论文?投稿会议时(以 ICASSP2023 为例)有哪些需要关注的信息以及注意事项?论文写作必备软件有哪些?论文书写关注点有哪些?论文格式与排版…

【Node.JS 】http的概念及作用

往期文章 【Node.JS 练习】时钟案例 【Node.JS 】path路径模块 【Node.JS 练习】考试成绩整理 【Node.JS】buffer类缓冲区 【Node.JS】事件的绑定与触发 【Node.JS】写入文件内容 【Node.JS】读取文件内容 什么是http模块 在网络节点中,负责消费资源的电脑&…

【C语言】C语言文件操作详解(一)

前言 本章主要讨论的是数据文件,如何使用C语言对数据文件进行输入输出数据的操作,以及文件顺序读写涉及的库函数详解 目录前言1.为什么使用文件2.什么是文件2.1程序文件2.2数据文件2.3文件名3.文件的打开和关闭3.1文件指针3.2文件的打开3.3文件的关闭3.…

初识JAVA

文章目录初识 java 的 main 方法main 方法示例运行Java程序注释基本规则注释规范标识符关键字初识 java 的 main 方法 main 方法示例 public class test {public static void main(String[] args) {System.out.println("hello world!");} }如果我们学的C语言&#…