数据分析第一天(pandas简单的对快餐店数据进行操作获得想要的信息,使用apply，groupby)

news2026/3/10 5:03:36

前言

数据保存在
https://github.com/harkbox/DataAnalyseStudy
数据名称：快餐数据.tsv
（tsv是用\t作为字符分隔符的文件格式；csv是逗号）
因此可以用pandas的read_csv函数读取数据

1.读取数据

import pandas as pd
import matplotlib.pyplot as plot
chipo=pd.read_csv(data_file_name,delimiter='\t')

2.获得数据的一些基本信息

# 查看数据的前5项
chipo.head()
chipo.info()
#产看数据的信息，尤其是缺失值
#产看摘要信息
chipo.describe()

从上述的信息可以发现价格的类型是字符，如果需要用价格进行计算的话，还需要将其转变为float

第一个问题：## 1.下单数最多的商品是什么

将商品按照item_name分组，求和，并且排序就能找到最多的商品是什么

chipo_=chipo[['item_name','quantity']].groupby(by='item_name').sum()
chipo_.sort_values('quantity',inplace=True,ascending=False)
chipo_.head()

在这里插入图片描述

第二个问题：在item_name这一列中，一共有多少种商品被下单？

#分组后计数
chipo_.count()
#nunique
chipo['item_name'].nunique()
#unique
len(chipo['item_name'].unique())

第三个问题：将item_price转换为浮点数?


def convert_f(x):
    return float(x.strip().replace('$',''))
    
chipo['item_price']=chipo['item_price'].apply(convert_f)
#2.使用字符串的规律
def convert_f(x):
    return float(x[1:-1])
#3.使用str函数里面的strip
chipo['item_price'] =chipo['item_price'].str.strip('$').astype(float)

第四个问题:在该数据集对应的时期内，收入(revenue)是多少?

生成一个新的列，代表总价

chipo['item_total']=chipo['quantity']*chipo['item_price']
chipo['item_total'].sum()

第五个问题：每一单(order)对应的平均总价是多少？

先对order进行分组，然后计算平均值

chipo[['order_id','item_total']].groupby(by='order_id').mean()

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1794399.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

数据分析第一天(pandas简单的对快餐店数据进行操作获得想要的信息,使用apply，groupby)

前言

1.读取数据

2.获得数据的一些基本信息

第一个问题：## 1.下单数最多的商品是什么

第二个问题：在item_name这一列中，一共有多少种商品被下单？

第三个问题：将item_price转换为浮点数?

第四个问题:在该数据集对应的时期内，收入(revenue)是多少?

第五个问题：每一单(order)对应的平均总价是多少？

相关文章

YOLOv8_obb预测流程-原理解析[旋转目标检测理论篇]

跟TED演讲学英文：Your right to repair AI systems by Rumman Chowdhury

电脑响度均衡是什么？它如何开启？

IGraph使用实例——线性代数计算（blas）

深度神经网络——什么是扩散模型？

python API自动化(接口测试基础与原理)

网站调用Edge浏览器API：https://api-edge.cognitive.microsofttranslator.com/translate

OpenCV中的圆形标靶检测——背景概述

Paper Survey——3DGS-SLAM

windows根据时间自定义默认应用模式

记录遇见的小问题

【Elasticsearch】es基础入门-03.RestClient操作文档

【UE+GIS】UE5GIS CAD或shp构建3D地形

矩阵链相乘（动态规划法）

ETL or iPaaS，企业数据集成工具选择攻略

探索数据结构：堆，计数，桶，基数排序的分析与模拟实现

在IDEA中使用Git在将多次commit合并为一次commit

家政服务小程序，提高企业在市场中的竞争力

2024年华为OD机试真题-多段线数据压缩-C++-OD统一考试（C卷D卷）

webgl_effects_stereo

数据分析第一天(pandas简单的对快餐店数据进行操作获得想要的信息,使用apply，groupby)

前言

1.读取数据

2.获得数据的一些基本信息

第一个问题：## 1.下单数最多的商品是什么

第二个问题： 在item_name这一列中，一共有多少种商品被下单？

第三个问题：将item_price转换为浮点数?

第四个问题:在该数据集对应的时期内，收入(revenue)是多少?

第五个问题： 每一单(order)对应的平均总价是多少？

相关文章

第二个问题：在item_name这一列中，一共有多少种商品被下单？

第五个问题：每一单(order)对应的平均总价是多少？