Python数据分析-世界上最富有的1000人

news2024/12/24 2:35:41

一、研究背景

随着全球化的加速发展和技术的进步,财富分配问题日益成为全球关注的焦点。财富的不平等现象日益明显,少数极富有的个人掌握了全球大部分的财富资源。了解全球最富有个人的财富分布及其背后的行业和国家因素,对于分析全球经济趋势、财富积累路径及行业发展具有重要意义。

本研究基于截至 2023 年全球前 1000 名最富有的个人的数据,分析了这些亿万富翁的财富来源、财富积累的行业分布、以及财富与国家或地区的关系。通过对这些数据的分析,可以帮助我们深入了解全球财富分配的现状,探索在全球经济体系中哪些行业最有可能产生巨额财富,并了解各国经济发展对个人财富积累的影响。

此外,随着数字经济、科技行业的迅速崛起,以及传统制造业、金融业的持续发展,本研究还将探索不同经济周期和全球化进程对财富分布的影响,从而为政策制定者、经济学家和企业家提供决策参考。

二、研究意义

研究全球前 1000 名最富有个人的财富分布及其背后的因素具有以下几个重要意义:

  1. 揭示全球财富不平等的现状:通过分析这些亿万富翁的净资产及其地理分布,可以直观地反映出全球财富集中度的情况,有助于理解财富不平等的宏观背景。

  2. 行业和地区的财富积累特点:通过对这些个人主要业务行业的分析,可以揭示哪些行业在当前经济中最有可能产生巨额财富,帮助投资者、企业家及政策制定者把握经济机遇。此外,分析这些个人的国家/地区分布,有助于理解各国经济政策、产业结构与财富积累的关联性。

  3. 为政策制定提供依据:通过研究财富分布情况,政策制定者可以更好地理解当前经济体系中的优势和问题,从而制定更有效的政策以缩小财富差距,促进社会公平与包容性增长。

  4. 揭示财富积累背后的产业变迁:通过长期跟踪亿万富翁的财富积累,可以帮助学术界和行业从业者了解全球产业结构的变化,从而预测未来最有可能积累财富的行业发展趋势。

三、实证分析

该数据集提供了截至 2023 年全球前 1000 名最富有的个人的详细快照。对于任何有兴趣了解全球财富分配、培养最富有个人的行业以及他们所在的国家/地区的人来说,此数据集都是宝贵的资源。它包括有关每个人的净资产、他们的主要商业利益和他们的居住国的重要信息。Top_1000_wealthiest_people.csv

代码和数据

数据概览 该数据集由 5 个关键列组成,提供对全球亿万富翁财务状况的全面见解:

名字:此列列出了每个人的全名。它对于确定谁是最富有的 1000 人至关重要。

国家:这显示了个人居住的国家/地区或其主要业务运营所在的国家/地区。它有助于了解财富的地理分布。

工业:此列标识个人积累财富的主要行业或部门。这些信息提供了关于哪些行业最有利可图的财富的见解。

净资产(以十亿计):本专栏报告每个人的估计净资产,以数十亿美元表示。它反映了他们财富的财务规模。

公司:这将列出与每个人关联的主要公司或企业。它突出了他们积累财富的主要企业。

导入代码

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

读取数据

df=pd.read_csv("Top_1000_wealthiest_people.csv")
df.head()

 

查看数据形状

df.info()

 

检查一下缺失值

df.isna().sum()

# 绘制每个数值特征的直方图

绘制每个数值特征的箱形图

for feature in numeric_features:
    plt.figure(figsize=(10, 6))
    sns.boxplot(x=df[feature])
    plt.title(f'Box Plot of {feature}')
    plt.xlabel(feature)
    plt.show()

全球净财富top10 

top_10_richest = df.nlargest(10,"net_worth")
top_10_richest

 

绘制行业分布图 

plt.figure(figsize=(8,6))
industry_count = df['Industry'].value_counts()
sns.barplot(y=industry_count.index ,x=industry_count.values, palette='cividis')
plt.title('industry distubution')
plt.xlabel('no of people')
plt.ylabel('industry')
plt.show()

绘制国家/地区的分布 

 绘制按行业划分的平均净资产 

plt.figure(figsize=(8,6))
industry_net_worth=df.groupby('Industry')['net_worth'].mean().sort_values()
sns.barplot(y=industry_net_worth.index,x=industry_net_worth.values,palette='viridis')
plt.title('Average Net Worth by Industry')
plt.xlabel('Average Net Worth (in billions)')
plt.ylabel('Industry')
plt.show()

按国家绘制平均净资产 

plt.figure(figsize=(8,6))
country_net_worth=df.groupby('Country')['net_worth'].mean().sort_values(ascending=False)
sns.barplot(y=country_net_worth.index,x=country_net_worth.values,palette='plasma')
plt.title('Top 10 Countries by Average Net Worth')
plt.xlabel('Average Net Worth (in billions)')
plt.ylabel('Country')
plt.show()

计算混淆矩阵

按国家和行业划分的净资产箱线图

plt.figure(figsize=(15, 10))
sns.boxplot(data=df,x='Country',y='net_worth',hue='Industry')
plt.title('Net Worth Distribution by Country and Industry')
plt.xlabel('Country')
plt.ylabel('Net Worth (in billions)')
plt.legend(loc='upper right')
plt.show()

 

按国家/地区查找首富

richest_by_country=df.loc[df.groupby('Country')['net_worth'].idxmax()]
richest_by_country

 

richest_by_industry=df.loc[df.groupby('Industry')['net_worth'].idxmax()]
richest_by_industry

按行业寻找首富

绘制代表性最多的前 5 家公司

plt.figure(figsize=(12, 8))
top_companies = df['Company'].value_counts().head(5)
sns.barplot(y=top_companies.index, x=top_companies.values, palette='cubehelix')
plt.title('Top 5 Companies with the Most Representatives')
plt.xlabel('Number of Representatives')
plt.ylabel('Company')
plt.show()

 绘制代表最多的前 10 个国家

plt.figure(figsize=(12, 8))
top_countries =df['Country'].value_counts().head(10)
sns.barplot(y=top_countries.index, x=top_countries.values, palette='plasma')
plt.title('Top 10 Countries with the Most Representatives')
plt.xlabel('Number of Representatives')
plt.ylabel('Country')
plt.show()

绘制按行业划分的净资产分布 

plt.figure(figsize=(12, 8))
sns.boxplot(y='Industry', x='net_worth', data=df, palette='muted')
plt.title('Distribution of Net Worth by Industry')
plt.xlabel('Net Worth (in billions)')
plt.ylabel('Industry')
plt.show()

 绘制按国家/地区划分的净资产分布

plt.figure(figsize=(12, 8))
top_countries_net_worth = df[df['Country'].isin(df['Country'].value_counts().head(10).index)]
sns.boxplot(y='Country', x='net_worth', data=top_countries_net_worth, palette='Set3')
plt.title('Distribution of Net Worth by Country')
plt.xlabel('Net Worth (in billions)')
plt.ylabel('Country')
plt.show()

四、结论

通过对全球前 1000 名最富有个人的数据分析,本研究得出以下结论:

  1. 财富集中度极高:全球财富分配极不平衡,前 1000 名个人控制了全球极大比例的财富。财富集中于少数人手中,而这些个人往往通过特定的高利润行业获得了巨额财富。

  2. 科技和金融行业占据主导地位:从行业分布来看,科技行业和金融业是创造亿万富翁的主要来源,尤其是近年来科技公司快速崛起,带来了大量的财富积累。制造业、零售和资源行业也占据了一定比例,但总体上,现代高科技行业对财富的积累影响显著。

  3. 财富的地理分布不均衡:在地域分布上,欧美国家特别是美国和欧洲富豪的数量占据显著比例。这些地区拥有成熟的资本市场和先进的科技产业,是财富积累的核心地带。相比之下,亚洲国家,特别是中国的亿万富翁数量快速增长,反映了新兴市场的经济快速发展和全球经济重心的转移。

  4. 亿万富翁主要通过企业积累财富:数据表明,大多数亿万富翁的财富积累来源于他们在相关企业中的股权,尤其是他们创立或参与领导的大型企业。这也突显了企业创新、市场化运作在财富积累中的重要性。

本研究为理解全球财富分布及其行业和地域特点提供了宝贵的洞见,对于未来全球财富格局的变化及其背后的经济驱动因素有重要参考价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2140952.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Element-ui el-table 全局表格排序

实现效果如下&#xff1a; 一、当页数据排序 如果只想要当前页面排序&#xff0c;只会涉及到前端&#xff0c;只需在<el-table-column>标签上添加 :sortable"true"即可 二、自定义排序 如果想要全局排序&#xff0c;需要自定义排序函数&#xff0c;请求后台排…

Linux基础---10进程管理

一.查看和关闭进程 1.查看进程 基础指令: ps -efPID 进程编号&#xff0c;PPID 父进程编号&#xff0c; CMD命令名称 进阶指令–查看进程的树形结构&#xff1a; yum install psmisc -y #首先安装psmisc后可直接使用pstreepstree2.关闭进程 要想关闭某个或多个进程需要知道…

简洁明了!中缀表达式转为后缀表达式规则及代码

简单来说&#xff0c;就是弄两个栈&#xff0c;判断执行&#xff1a; 上代码&#xff1a; #include<iostream> #include<stack> #include<cstring> using namespace std; stack<char>s1,s2; char now; int main(){string c;cin>>c;for(int i0;…

微信视频号导出视频软件

最近研究了一下微信视频号导出视频的方法&#xff0c;目前发现还是比较难搞&#xff0c;查了一些资料&#xff0c;写了一个可以导出视频的软件&#xff0c;目前还不完善&#xff0c;但是导出视频到本地还是没问题&#xff0c;先用着吧&#xff0c;后期再完善。先记录一下。 测…

人工智能浪潮下,程序员如何锻造不可替代的核心竞争力?

人工智能时代&#xff0c;程序员如何保持核心竞争力&#xff1f; 在人工智能时代&#xff0c;程序员如何保持核心竞争力是一个值得深思的问题。随着技术的快速发展&#xff0c;特别是AI技术的不断进步&#xff0c;程序员的角色和工作方式正在经历前所未有的变革。以下是一些关…

docker部署Stirling-PDF

github网址&#xff1a; GitHub - Stirling-Tools/Stirling-PDF: #1 Locally hosted web application that allows you to perform various operations on PDF files 1、官方docker镜像无法拉取&#xff0c;使用别人阿里云私人镜像仓库下载Stirling-PDF镜像&#xff1a; regi…

如何设置word页码从指定页开始

如何设置word页码从指定页开始 在使用Word编辑一些比较正式的文档时&#xff0c;封面页或者是前几页都是不能有页码的&#xff0c;那么怎么设置页码从指定页开始&#xff0c;可以通过分隔符来实现页码从指定页开始。 word设置页码从指定页开始的具体步骤如下&#xff1a; 1.…

2024.9最新:CUDA安装,pytorch库安装

目录 一、CUDA安装 1.查看自己电脑适配的CUDA的最高版本 2.安装CUDA 3.检查环境变量是否配置&#xff0c;安装是否成功 二、pytorch库安装 1.pytorch库下载 2.选择合适的版本 3.查看版本 一、CUDA安装 1.查看自己电脑适配的CUDA的最高版本 在命令提示符里输入nvidia-…

LeetCode题集-4 - 寻找两个有序数组的中位数,图文并茂,六种解法,万字讲解

题目&#xff1a;给定两个大小分别为 m 和 n 的正序&#xff08;从小到大&#xff09;数组 nums1 和 nums2。请你找出并返回这两个正序数组的 中位数 。 算法的时间复杂度应该为 O(log (mn)) 。 作为目前遇到的第一个困难级别题目&#xff0c;我感觉这题还是挺难的&#xff0c…

MATLAB 从 R2024B 开始支持树莓派 5

树莓派&#xff08;Raspberry Pi&#xff09;系列是一系列基于单板计算机的微型电脑&#xff0c;由英国的树莓派基金会于 2012 年开始发布。它的目标是提供一个低成本、易于学习和玩耍的平台&#xff0c;用于教育和初学者学习计算机科学和编程。 目前市面上&#xff0c;最新最…

工地高空安全防护装备检测系统源码分享

工地高空安全防护装备检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of …

Linux驱动.之中断系统,裸机下设置寄存器,绑定中断处理函数hander(二)

17.3.3通用中断驱动文件编写 在start.S文件中我们在中断服务函数IRQ_Handler中调用了C函数system_irqhandler来处理具体的中断。此函数有一个参数&#xff0c;参数是中断号&#xff0c;但是函数system_irqhandler的具体内容还没有实现&#xff0c;所以需要实现函数system_irqha…

大屏可视化适配方案

大屏适配方案 方案一&#xff1a;rem 单位 动态设置 html 的 font-size&#xff1b;方案二&#xff1a;vw 单位&#xff1b;方案三&#xff1a;scale 等比例缩放 对比 方案一 核心思想&#xff1a;动态调整 HTML 根字体大小和 body 字体大小&#xff0c;结合百分比或vw/vh单…

配置cobbler服务提供centos7安装源

cobbler服务和pxe服务的作用类似但是从安装部署角度来说比pxe简单得多。 cobbler可以用来快速建立Linux网络安装环境&#xff0c;大幅度降低了Linux网络安装的技术门槛。 一.cobbler介绍 由RedHat公司基于python语言开发&#xff0c; 作用&#xff1a;快速批量部署Linux系统…

艾里斑(Airy Disk)与瑞利判据(Rayleigh criterion)

艾里斑的定义与形成 艾里斑&#xff08;Airy Disk&#xff09;&#xff0c;又称艾里图样&#xff08;Airy Pattern&#xff09;&#xff0c;是光通过圆形孔径发生衍射时&#xff0c;在焦点处形成的光斑。这一现象由英国数学家和天文学家George Biddell Airy在19世纪首次详细描…

面试官问:你在团队中的角色是什么?

面试官问你在团队中的角色是什么&#xff0c;其目的是了解你如何在团队环境中工作&#xff0c;以及你如何看待自己在团队中的定位。他们希望听到你如何与他人协作、你的领导能力或团队合作精神&#xff0c;以及你是否能适应不同的团队角色。 回答这类问题时&#xff0c;你可以…

shiro漏洞复现

目录 shiro介绍框架介绍判断是否使用shiro框架 环境搭建CVE-2010-3863漏洞原理影响版本漏洞复现 CVE-2016-4437漏洞原理影响版本漏洞复现 CVE-2020-1957漏洞原理影响版本漏洞复现 shiro-721拉取环境漏洞原理漏洞复现 shiro介绍 框架介绍 Apache Shiro提供了认证、授权、加密和…

关于手机号码数理的计算和推导,获得“平替”尾号

文章背景&#xff1a;我个人比较相信命运&#xff0c;对于手机号码的吉凶或是数理颇为在乎。最近&#xff0c;我沉浸于这方面的研究中&#xff0c;并发现许多手机号码的数理核心竟出奇地一致——关键在于后四位尾号&#xff0c;而前面的数字似乎并不占据主导位置。然而&#xf…

电气自动化入门01:电工基础

视频链接&#xff1a;1.1 电工知识&#xff1a;电工基础_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1PJ41117PW?p2&vd_sourceb5775c3a4ea16a5306db9c7c1c1486b5 1.电能和电力系统 2.电工常用物理量及其应用 2.1电阻&#xff1a; 2.2电流&#xff1a; 2.3电压&…

队列-------

队列总览 队列的定义 队列的基本操作 队列回顾 顺序队列总览 队列的顺序实现 队列的初始化 入队操作&#xff0c;rear&#xff0c;后面的&#xff0c;下一个队列元素要插入的位置。front&#xff0c;前面的&#xff0c;当前队列的第一个元素。 循环队列入队操作 循环…