python-Numpy及Pandas数据分析应用

news2024/10/5 12:50:42

读取文件team.xlsx数据,其中'name':名字, 'team':所属团队, 'Q1':语文分数, 'Q2':数学分数, 'Q3':英语分数, 'Q4':政治分数

# (1) 查询该数据的索引、所有值、列名、数据类型、元素个数、维度以及形状

import pandas as pd

# 读取Excel文件
df = pd.read_excel('team.xlsx')
# (1) 查询该数据的索引、所有值、列名、数据类型、元素个数、维度以及形状
print("索引:", df.index)
print("所有值:", df.values)
print("列名:", df.columns)

print("数据类型:", df.dtypes)
print("元素个数:", df.size)
print("维度:", df.ndim)
print("形状:", df.shape)

 

(2) 访问该数据中’name’、’team’中的前5行数据

print("前5行数据(name, team):")
print(df[['name', 'team']].head())

 

# (3) 访问该数据所属团队为B组中的成员名字,并筛选出B组中'Q1'大于60分的同学

print("检查B组中'Q1'大于60分的成员:")
b_group_q1_above_60 = b_group[b_group['Q1'] > 60]
print(b_group_q1_above_60)

print("B组中'Q1'大于60分的同学名字:")
print(b_group_q1_above_60['name'])

(4) 在文件最后添加一列’tol’,意为该成员的四门课的分数总和

df['tol'] = df['Q1'] + df['Q2'] + df['Q3'] + df['Q4']
print("添加'tol'后的数据:")
print(df.head())

 

# (5) 对该数据按所属团队进行分类,查看每个团队的大小,并计算每个团队的Q1', 'Q2', 'Q3', 'Q4'四门课的总分和平均分

grouped = df.groupby('team')
team_size = grouped.size()
team_sum = grouped[['Q1', 'Q2', 'Q3', 'Q4']].sum()
team_mean = grouped[['Q1', 'Q2', 'Q3', 'Q4']].mean()

在本次实验中,通过读取 文件,我们首先对数据进行了基本信息的查询,包括索引、所有值、列名、数据类型、元素个数、维度和形状等。这些基础信息的获取为我们后续的分析和处理奠定了坚实的基础,确保我们对数据的整体结构和内容有了清晰的了解。接下来,我们深入访问了数据的具体内容,提取了 `name` 和 `team` 列的前五行数据。同时,我们对所属团队为 B 组的成员进行了筛选,并进一步筛选出语文成绩(Q1)大于60分的同学。这一步骤不仅提高了我们对数据操作的熟练度,也让我们掌握了数据筛选和条件查询的技巧。最后,我们在数据末尾添加了一列表示四门课分数总和的 `tol` 列,并对数据按团队进行分类统计,计算每个团队的大小以及四门课程的总分和平均分。这一步骤展示了如何进行数据的分组统计和计算,不仅深化了我们对数据处理的理解,也为实际应用中的团队成绩分析提供了有效的方法。

再使用东京奥运会奖牌分日数据数据继续分析

# 读取Excel文件
df = pd.read_excel('东京奥运会奖牌分日数据.xlsx')
df.head()

(1)将获奖时间修改为时间格式,并按照获奖时间升序排列

df['获奖时间'] = pd.to_datetime(df['获奖时间'])
df_sorted_time = df.sort_values(by='获奖时间')

 

2)按国家进行分组统计,计算每个国家的奖牌总数,并降序排列

country_medal_count = df_sorted_time.groupby('国家id').size().reset_index(name='奖牌总数').sort_values(by='奖牌总数', ascending=False)

(3)按运动员进行分组统计,计算每个运动员获得的奖牌总数,并降序排列

athlete_medal_count = df_sorted_time.groupby('运动员').size().reset_index(name='奖牌总数').sort_values(by='奖牌总数', ascending=False)
athlete_medal_count

 

(4)查看乒乓球项目的全部信息

pingpong_info = df_sorted_time[df_sorted_time['运动类别'] == '乒乓球']

 

(5)查看各国在不同项目上的获奖牌数量

country_sport_medal_count = df_sorted_time.groupby(['国家id', '运动类别']).size().reset_index(name='奖牌数量')

 

接着查询中国队的获奖牌数量

china_medal_count = country_sport_medal_count[country_sport_medal_count['国家id'] == 26]

东京奥运会奖牌数据分析

在分析东京奥运会奖牌数据时,我们首先将获奖时间调整为正确的时间格式,并按获奖时间升序排列。这一步骤确保了数据时间轴的准确性,为后续的时间序列分析提供了可靠的基础。

我们对数据进行了按国家和运动员分组统计,计算各国家和运动员的奖牌总数,并按总数降序排列。这一过程展示了数据分组和聚合计算的应用,通过降序排列,我们能够直观地看到哪些国家和运动员在奥运会中表现最为突出。

最后,我们提取了乒乓球项目的全部信息,并统计了各国在不同项目上的奖牌数量,特别关注了中国队的表现。这一步骤不仅展示了如何针对特定项目和国家进行深入分析,也突出了在复杂数据中提取关键信息的能力。

通过本次实验,我们不仅掌握了数据读取、基本信息查询、数据访问与筛选、分组统计与计算等基本技能,还在实际操作中深化了对数据分析流程的理解。在处理不同数据集的过程中,我们学会了如何从数据中提取有价值的信息,并进行系统性分析。整体上,本次实验提升了我们在数据处理与分析方面的实战能力,为将来应对更复杂的数据分析任务打下了坚实的基础。

数据和完整代码

创作不易,希望大家多点赞关注评论!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1812359.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C++课程学习】:Data类的实现

🎁个人主页:我们的五年 🔍系列专栏:C课程学习 🎉欢迎大家点赞👍评论📝收藏⭐文章 目录 🍩1.头文件 🍩2.实现文件: 🍩3.分析: &…

ARM32开发--PWM与通用定时器

知不足而奋进望远山而前行 目录 文章目录 前言 学习目标 学习内容 PWM pwm原理 需求 开发流程 初始化PWM PWM占空比控制 main函数修改duty 输出通道 关心的内容 重要的关键词 周期 分频 占空比 总结 前言 在微控制器开发中,理解和掌握PWM&#x…

计算机网络:网络层 - IPv4地址

计算机网络:网络层 - IPv4地址 分类编址划分子网子网掩码 无分类编址 CIDRCIDR 地址块构造超网 在酒店中,每个房间都有门牌号码,服务员送餐时,就可以根据门牌号码来判断一份餐要送到那个房间。 在网络中也是如此,一份…

泵制造5G智能工厂工业物联数字孪生可视化,推进制造业数字化转型

泵制造5G智能工厂工业物联数字孪生可视化,推进制造业数字化转型。泵制造行业,作为工业领域的核心部分,更是急需通过技术创新实现生产流程的智能化和高效化。而5G智能工厂工业物联数字孪生可视化技术的出现,为泵制造业的数字化转型…

【全网最齐报错的解决方法!】运行mvn命令打包项目jar包报错?“Fatal error compiling: 无效的目标发行版: 19 ”, 让我来看看~

最近写实验,要打包项目,但是不管是在cmd运行“mvn clean package -Dmaven.test.skiptrue”命令,还是在idea上去操作,都出现了这样的一个错误: [EROR] Failed to exeoute goal org.apache.maven.plugins:maven-comnpile…

作业6.11

练习1&#xff1a;输入一个数&#xff0c;判断是否是完美数 完美数&#xff1a;正序和逆序的结果一致 练习2&#xff1a; * ** *** **** for(int i0;i<4;i){for(int y1;y<4-i;y){ printf(" ");}for(int j0;j<i;j){printf("*&quo…

zabbix-agent如何版本回退降低?

文章目录 1&#xff0c;查看zabbix-agent版本号2&#xff0c;查看zabbix-server的版本号3&#xff0c;卸载已有的zabbix-agent4&#xff0c;找到与zabbix-server匹配版本的zabbix-agent5&#xff0c;安装zabbix-agent 5.0.42版本6&#xff0c;查看已安装的zabbix-agent的版本号…

谁是最会写作文的AI“考生”?“阅卷老师”ChatGPT直呼惊艳!

文章推荐 粽叶飘香&#xff0c;端午安康&#xff01;AI视频送祝福啦~ AI日报&#xff5c;文生语音大模型国内外均有突破&#xff0c;Pika完成6亿新融资&#xff0c;视频大模型也不远了&#xff01; ⭐️搜索“可信AI进展“关注公众号&#xff0c;获取当日最新AI资讯 一年一…

Visual Studio 调试 Win32 出现 Task Manager / Explorer 无法打开,无法关机/重启

现象 Access is denied 无法关机 无法通过开始 -> 关机/重启 进行关机或者重启 无法打开新的应用 无法通过开始 -> 双击应用打开新的应用 已打开应用的使用不受影响 已经打开的应用可以正常操作 原因 杀毒软件&#xff1b;关掉杀毒软件就好了 问题查找过程 参考…

记一次华为2288H V5更换主板的辛酸

1、开机提示找不到设备&#xff0c;通过带外检查硬盘raid是否正常&#xff0c;如果正常就不是硬件问题&#xff0c;也不会是线没接好 2、网络不通&#xff0c;服务重启啥的都正常不会报错&#xff0c;就是ping不通网关&#xff0c;后来通过带外发现是网卡漂移了。 核对mac地址发…

项目:双人五子棋对战-对战模块(6)

完整代码见: 邹锦辉个人所有代码: 测试仓库 - Gitee.com 当玩家进入到游戏房间后, 就要开始一局紧张而又刺激的五子棋对战了, 本文将就前端后端的落子与判断胜负的部分作详细讲解. 模块详细讲解 约定前后端交互的接口 首先是建立连接后, 服务器需要生成一些游戏的初始信息(可…

一五零、MAC 安装mysql可视化工具连接

mysql安装&#xff0c;按照网上教程一步步安装&#xff08;官网下载安装包->解压->完成安装&#xff09;&#xff0c;最后在「系统偏好设置」无法启动mysql。 原因&#xff1a;下载的版本是8.0最新版本&#xff0c;MAC上这种方法无法启动成功。 解决方法 换低版本的mys…

JDBC开发之四大核心API:DriverManager Connection Statement ResultSet

DriverManager 方法都是静态的 注册驱动 在Mysql5之后我们就不用注册驱动了 在jar包里已经写好了 读取文件 第二个方法 如果连接的是主机mysql并且端口是默认的3306 则可以简化书写 代码书写 import java.sql.Connection; import java.sql.DriverManager; import java.sql.S…

微软的这个按钮又双叒叕变了位置?有时候还不见了……

前言 小白最近打开Windows11系统的时间比较少&#xff0c;大部分时间都还是喜欢用MacBookPro码字。 之前小白写过一篇关于微软系统左下角的这个神奇按钮 Windows11更新之后&#xff0c;电脑左下角多出了一个奇怪的按钮&#xff08;点我跳转查看&#xff09; 没错&#xff0…

vivado HW_SIO_GT

描述 Xilinx的可定制LogiCORE™IP集成误码率测试仪&#xff08;IBERT&#xff09;核心 FPGA是为评估和监控千兆收发器&#xff08;GTs&#xff09;而设计的。IBERT core支持系统内串行I/O验证和调试&#xff0c;使您能够进行测量和优化 您的设计中的高速串行I/O链路。参考综合误…

webpack--压缩,代码的拆分,tree shinking

Terser 对代码进行压缩、丑化 const TerserPlugin require("terser-webpack-plugin");optimization: { minimize: true, //在开发环境下启用 CSS 优化minimizer: [new TerserPlugin({extractComments: false,terserOptions: {compress: {arguments: true,// 将函数…

CAPL如何发送一条SYN报文

在TCP协议中,发起连接的Client端首先会发送一条SYN报文,用来发起TCP连接请求。这条SYN报文的本质是TCP报文,只不过flags字段中SYN位置为1。 且SYN的序列号是随机的,所以可以用一个随机函数来生成随机数。而ack确认号是0。 TCP报文和UDP报文一样,需要设置源和目标端口号,…

最新小红薯引流无限曝光机,轻松高效精准曝光引流【引流软件+使用教程】

在现代数字营销的海洋中&#xff0c;精准引流已成为商家及创业者追求的圣杯。一种无需采集ID的新策略突破了传统营销的局限&#xff0c;提供了一条高效且安全的道路。这种方法旨在通过有针对性的关键词触达潜在的兴趣群体&#xff0c;实现品牌与用户之间的高效对接。 以关键词…

【CW32F030CxTx StartKit开发板】构建开发环境,测试LED和UART例程

目录 1、开发环境的构建 2、硬件连线 3. 例程测试 3.1 LED示例 3.2 UART printf示例 本文首发于21ic&#xff1a;https://bbs.21ic.com/forum.php?modviewthread&tid3382698&page1#pid14103102 感谢21ic和武汉芯源提供的测试机会。 此次测试的是CW32F030CxTx S…

新手grub 配置介绍

最近因为工作需要接触了grub&#xff0c;学到了一些相关知识&#xff0c;所以在这里写篇博客记录一下&#xff0c;有不对的部分欢迎指正。 目录 grub是什么&#xff1f; grub有哪些配置文件&#xff1f; 各配置文件区别 配置文件生成流程 配置文件有哪些内容&#xff1f;…