Python数据分析-Steam 收入排名前 1500 的游戏

news2024/12/25 13:45:27

一、研究背景

随着全球数字化进程的加速,电子游戏产业已成为全球娱乐产业的重要组成部分,吸引了越来越多的资本与消费者关注。特别是基于互联网的游戏平台,如Steam,已成为全球范围内发行和销售游戏的重要渠道。Steam平台不仅为玩家提供了丰富的游戏内容,还为开发商和发行商提供了一个展示作品、与玩家互动、获得市场反馈的开放平台。截至2024年,Steam已经成为全球最具影响力的游戏平台之一,拥有数千万活跃用户和海量游戏作品。通过该平台,众多独立开发者以及大型游戏公司都能在全球范围内获得广泛的市场曝光。

近年来,随着游戏市场的竞争日益激烈,开发商和发行商不仅需要确保游戏的质量,还必须掌握市场的动态变化,如玩家的偏好、消费习惯、游戏定价策略、市场营销方式等。这些因素在很大程度上决定了一款游戏的成功与否。与此同时,玩家的参与度、游戏的口碑和评论得分等指标也日益成为衡量游戏市场表现的重要参数。

本研究基于2024年1月1日至9月9日期间,Steam平台上发布的前1500款游戏数据,旨在通过对这些游戏的销售数据、收入、玩家参与度、评论评分、开发商和发行商背景等多维度数据的深入分析,揭示影响游戏市场表现的关键因素。通过分析这些游戏的市场表现及其背后的市场机制,我们希望为未来的游戏开发与发行提供数据支持和策略参考。

二、研究意义

本研究的意义体现在以下几个方面:

  1. 市场洞察
    随着游戏产业的飞速发展,市场上的游戏种类和数量呈现爆发式增长。通过对Steam平台前1500款收入最高游戏的深入分析,本研究能够揭示哪些类型的游戏在市场上更受欢迎,以及影响其销量和收入的关键因素。这对于游戏开发商在未来制定开发方向、优化游戏设计有着重要的指导意义。

  2. 定价策略优化
    本研究通过分析游戏定价、销售量与收入之间的关系,帮助开发商和发行商更好地理解不同定价策略的效果。例如,价格是否对销量有显著影响,或者高价是否必然意味着高质量或高收益的游戏。这将为未来的定价决策提供实证支持,帮助开发商在市场中获得更好的经济回报。

  3. 玩家行为与市场反馈
    玩家参与度、平均游戏时长、评论分数等指标是衡量游戏受欢迎程度和质量的重要标准。本研究通过分析这些玩家行为数据,可以帮助开发商理解哪些因素最能影响玩家的忠诚度和留存率。通过研究这些行为模式,开发商可以更有针对性地改进游戏内容和优化用户体验。

  4. 开发商和发行商分析
    不同规模的开发商和发行商在游戏市场中的表现差异显著。本研究可以揭示大公司与独立开发者之间的竞争优势和劣势,并帮助小型开发商找到在竞争激烈的市场中脱颖而出的策略。同时,研究还可以揭示发行商在游戏营销和推广中的重要作用,从而为未来的发行合作提供参考。

  5. 趋势预测与市场策略
    通过对市场动态数据的分析,本研究还可以为游戏市场未来的发展趋势提供参考。通过研究销售排名和价格波动等数据,预测未来游戏市场可能的发展方向。这为游戏开发者和发行商在市场定位、资源分配和营销策略上提供了前瞻性的建议。

三、实证分析

此数据集包含 2024 年 1 月 1 日至 2024 年 9 月 9 日期间在 Steam 上发布的前 1500 款游戏的全面信息。进行了细微的调整,例如调整游戏发布日期以保持一致性。

主要特点: 游戏详情: 包括标题、发布日期和开发商/发行商信息。

Sales and Revenue:跟踪售出的副本数、产生的收入和定价详细信息。

玩家参与度:提供平均游戏时间、峰值玩家数量和其他用户参与度指标。

评论和分数:特色评论分数和评级。

动态市场数据:提供对游戏性能随时间变化趋势的见解,例如销售排名和价格波动。

导入数据包

代码和数据

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt 
import seaborn as sns 
import warnings 
warnings.filterwarnings('ignore')

读取数据

data =pd.read_csv(r"Steam_2024_bestRevenue_1500.csv")
data

数据缺失值查看 

发现存在缺失值,需进行处理

data.duplicated().sum()

查看数据具体情况

data.info()

 

查看NAME

data.name.value_counts()

查看一下每个特征的MAX

data.copiesSold.max()

data[data['copiesSold']==30739148]

 价格最高的游戏

data.price.max()

data[data['price']==99.99]

税收最高的游戏

data.revenue.max()

data[data['revenue']==837793356.0]

价格与税收的散点图

plt.scatter(data.price,data.revenue,color='red')
plt.xlabel('price')
plt.ylabel('revenue')

 

plt.figure(figsize=(6,4))
sns.histplot(data['price'],bins=20,kde=True,color='green',edgecolor="black")
plt.title("Distribution of Game Prices")
plt.xlabel("Price ($)")
plt.ylabel('Number of Games')
plt.show()

 

plt.figure(figsize=(6,4))
plt.pie(data.publisherClass.value_counts(), labels=data.publisherClass.value_counts().index, autopct='%1.1f%%', 
        colors=['#ff9999', '#ff66b3', '#99ff99', '#ffcc99'])
plt.title('Distribution of Games by Publisher Class')
plt.show()

数据描述性统计

该数据包含了游戏的发布日期、销量、价格、收入、平均游戏时长、评论分数和 steam 编号等信息,统计了 1500 个数据,发布日期在 2024 年 1 月 1 日到 2024 年 9 月 6 日之间,销量最少 593 最多 30739150,价格从 0 到 99.99,收入最少 20674 最多 837793400,平均游戏时长最少 0 最多 296.332852,评论分数在 0 到 100 之间,同时给出了各项数据的均值、25%、50%、75% 分位数以及标准差等统计信息。

相关系数热力图

sns.heatmap(data_corr)   
plt.title('Correlation Heatmap')
plt.show()

plt.figure(figsize=(6, 4))
sns.boxplot(data=data, x='publisherClass', y='reviewScore', palette='Set2')
plt.title('Review Scores by Publisher Class')
plt.xlabel('Publisher Class')
plt.ylabel('Review Score')
plt.xticks(rotation=45)
plt.grid(True)
plt.show()

 

sns.scatterplot(data=data, x='reviewScore', y='avgPlaytime', hue='publisherClass')

sns.boxplot(x='publisherClass', y='price', data=data)

data.groupby('releaseDate')['revenue'].sum().plot(kind='line', title='Revenue Over Time')

 

四、结论

通过对2024年Steam平台前1500款游戏的多维度数据分析,本研究得出了以下结论:

  1. 游戏类型和市场表现密切相关
    不同类型的游戏在市场上的表现差异明显。动作类、角色扮演类(RPG)和多人在线竞技类游戏(MOBA)在市场中表现突出,吸引了大量玩家和收入。而休闲类、独立游戏等虽然销量相对较少,但凭借较低的开发成本和针对性强的玩家群体,也在特定细分市场中占据一席之地。

  2. 玩家参与度和评论评分对游戏销售影响显著
    玩家参与度高的游戏通常在市场上表现较好。游戏的平均时长、峰值玩家数、游戏评论评分等指标能够直接反映玩家对游戏的喜爱程度和满意度。特别是评论分数较高的游戏,往往更容易获得长期的市场认可和稳定的玩家基础。

  3. 定价策略影响销售收入
    定价策略对于游戏的市场表现有着显著影响。本研究发现,高价格的游戏通常意味着较高的开发成本和质量保障,但也可能导致潜在玩家群体的减少。而较低的定价虽然能够吸引更多的玩家,但在收入方面未必能带来预期的增长。因此,如何制定合理的定价策略以平衡销量与收入,成为开发商和发行商需要重点考虑的问题。

  4. 开发商与发行商的市场角色
    大型开发商和发行商通常在市场中占据主导地位,它们拥有更多的资源和市场推广能力,因此更容易获得较高的销量和收入。然而,独立开发者也有机会通过创新和差异化策略,在细分市场中取得成功。尤其是一些独立游戏通过创新的玩法和独特的艺术风格,获得了广泛的市场认可。

总的来说,本研究为游戏开发者、发行商以及相关从业者提供了关于游戏市场表现的关键洞察。未来的研究可以进一步细化到不同地区市场、玩家行为模式的差异性,探讨更多的影响因素,以帮助游戏行业在全球范围内实现持续增长和创新。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2140842.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

高通Liunx 系统镜像编译

本文将会介绍如何在编译高通Liunx代码, 具体可以在高通 Linux | 高通下查看相关信息。 编译服务器配置 首先,准备一台Ubuntu 22.04版本主机或者服务器 1,编译Yocto 系统,需要如下一些配置 sudo apt update sudo apt install repo gawk wg…

钢轨缺陷检测-目标检测数据集(包括VOC格式、YOLO格式)

钢轨缺陷检测-目标检测数据集(包括VOC格式、YOLO格式) 数据集: 链接:https://pan.baidu.com/s/1h7Dc0MiiRgtd7524cBUOFQ?pwdfr9y 提取码:fr9y 数据集信息介绍: 共有 1493 张图像和一一对应的标注文件 标…

STM32—I2C

1.I2C I2C总线(Inter l0 BUs)是由Philips公司开发的一种通用数据总线两根通信线:SCL(Serial Clock)、SDA(Serial Data)同步,半双工带数据应答支持总线挂载多设备(一主多从、多主多从) MPU6050模块:可以进行姿态测量,使用了12C通信协议 第3个…

IAPP发布《2024年人工智能治理实践报告》

文章目录 前言一、黑箱问题►透明度、可理解性与可解释性二、法律和政策中的注意事项►欧盟的《通用数据保护条例》►欧盟的AI法案►NIST的AI风险管理框架►美国的第14110号行政命令►《生成式人工智能服务管理暂行办法》►新加坡的AI验证三、实施人工智能治理►模型卡与系统卡…

2023高教社杯全国大学生数学建模竞赛C题 Python代码演示

目录 问题一1.1 蔬菜类商品不同品类或不同单品之间可能存在一定的关联关系,请分析蔬菜各品类及单品销售量的分布规律及相互关系。数据预处理数据合并提取年、月、日信息对蔬菜的各品类按月求销量均值 季节性时间序列分解STL分解加法分解乘法分解 ARIMALSTM import p…

热成像目标检测数据集

热成像目标检测数据集 V2 版本 项目背景 热成像技术因其在安防监控、夜间巡逻、消防救援等领域的独特优势而受到重视。本数据集旨在提供高质量的热成像图像及其对应的可见光图像,支持热成像目标检测的研究与应用。 数据集概述 名称:热成像目标检测数据…

多目标优化算法求解LSMOP(Large-Scale Multi-Objective Optimization Problem)测试集,MATLAB代码

LSMOP(Large-Scale Multi-Objective Optimization Problem)测试集是用于评估大规模多目标优化算法性能的一组标准测试问题。这些测试问题通常具有大量的决策变量和目标函数,旨在模拟现实世界中的复杂优化问题。 LSMOP测试集包含多个子问题&am…

深度学习之微积分预备知识点

极限(Limit) 定义:表示某一点处函数趋近于某一特定值的过程,一般记为 极限是一种变化状态的描述,核心思想是无限靠近而永远不能到达 公式: 表示 x 趋向 a 时 f(x) 的极限。 知识点口诀解释极限的存在左…

2024 VMpro 虚拟机中如何给Ubuntu Linux操作系统配置联网

现在这是一个联网的状态 可以在商店里面下载东西 也能ping成功 打开虚拟网络编辑器 放管理员权限 进行设置的更改 选择DNS设置 按提示修改即可 注意的是首选的DNS服务器必须是114.114.114.114 原因 这边刚刚去查了一下 114.114.114.114 是国内的IP地址 8.8.8.8 是国外的I…

【人工智能】OpenAI最新发布的o1-preview模型,和GPT-4o到底哪个更强?最新分析结果就在这里!

在人工智能的快速发展中,OpenAI的每一次新模型发布都引发了广泛的关注与讨论。2023年9月13日,OpenAI正式推出了名为o1的新模型,这一模型不仅是其系列“推理”模型中的首个代表,更是朝着类人人工智能迈进的重要一步。本文将综合分析…

PFC和LLC的本质和为什么要用PFC和LLC电路原因

我们可以用电感和电容的特性,以及电压和电流之间的不同步原理来解释PFC(功率因数校正)和LLC(谐振变换器)。 电感和电容的基本概念 电感(Inductor): 电感是一种储存电能的组件。它的…

PhotoZoom Pro / Classic 9.0.2激活版安装激活图文教程

图像格式中,位图格式的图像是由点阵像素组成的数据文件,所以呢在把位图图像放大的时候,就会发现看到它是由于许多点构成,这就是为什么数码照片在使用普通的工具放大时会失真的原因。不过呢由于一些日常需求,我们经常需…

图神经网络模型扩展5--3

以图卷积网络为例,在每一层卷积中,我们需要用到两个输入A∈Rnn 和X∈Rnd。 很容易想象,当输入的图数据很大时(n 很大),图卷积网络的计算量是很大的,所需要的内存也是很大的。推广到更一般的信息传递网络,在每一层中&am…

Python 课程12-Python 自动化应用

前言 Python 自动化应用 可以帮助开发者节省时间和精力,将重复性、手动操作变为自动化脚本。例如,Python 可以用于自动化处理文件、邮件、生成报表,甚至可以控制浏览器执行复杂的网页操作任务。借助 Python 的强大库和工具,可以轻…

Kubernetes 常用指令2

kubernetes 常用命 令 1. 编写 yaml 文件 2. kubectl create 通过配置文件名或标准输入创建一个集群资源对象,支 持 json 和 yaml 格式的文件 语法: kubectl create -f 文件名 kubectl create deployment 资源名 --image镜像名 kubectl create deplo…

视频格式转为mp4(使用ffmpeg)

1、首先安装ffmpeg,下载链接如下 https://www.gyan.dev/ffmpeg/builds/packages/ffmpeg-6.1.1-full_build.7z 安装后确保ffmpeg程序加到PATH路径里,cmd执行ffmpeg -version出现下图内容表示安装成功。 2、粘贴下面的脚本到文本文件中,文件后缀…

【Linux进程控制】进程创建|终止

目录 一、进程创建 fork函数 写时拷贝 二、进程终止 想明白:终止是在做什么? 进程退出场景 常见信号码及其含义 进程退出的常见方法 正常终止与异常终止 exit与_exit的区别 一、进程创建 fork函数 在Linux中fork函数是非常重要的函数&#x…

魔方财务升级指南

本文将详细介绍如何升级魔方财务系统,确保您能够顺利地更新到最新版本。 重要提示 在进行任何系统升级之前,请务必备份数据。这是良好的习惯,也是我们的建议。 备份数据库,并下载到本地。最好将网站目录文件打包,并…

【最新华为OD机试E卷-支持在线评测】最长连续子序列(100分)多语言题解-(Python/C/JavaScript/Java/Cpp)

🍭 大家好这里是春秋招笔试突围 ,一枚热爱算法的程序员 💻 ACM金牌🏅️团队 | 大厂实习经历 | 多年算法竞赛经历 ✨ 本系列打算持续跟新华为OD-E/D卷的多语言AC题解 🧩 大部分包含 Python / C / Javascript / Java / Cpp 多语言代码 👏 感谢大家的订阅➕ 和 喜欢�…

沉浸式利用自然语言无代码开发工具生成式AI产品应用(上)

背景 小伙伴们过去在开发应用时,经常需要编写大量代码文件以实现业务逻辑,想必肯定有小伙伴开发过类似于快消行业索赔处理、订单库存跟踪和项目审批等系统。去解决这些业务实际问题,我们需要定制地开发业务应用程序为这些问题提供解决方案。…