身兼数据科学家和自由职业者,算算我在2022赚了多少钱?

news2025/2/25 11:25:49
2022年,我作为自由职业者数据科学家赚了多少钱?

长按关注《Python学研大本营》,加入读者群,分享更多精彩

扫码关注《Python学研大本营》,加入读者群,分享更多精彩

大家好,首先,我已经等了很久了。

2021 年我在土耳其以自由职业者的身份工作,2022 年我意识到我已经准备好通过做出重大决定来从事全球工作。

我可以说,对于个人发展和开展各种项目来说,这是非常好的一年。

我从 Upwork 平台和各种额外平台接触到客户。

今天分享Upwork给大家的数据,我们来做一个数据分析。祝你读书愉快。

第一步:导入库


import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport plotly.express as pxfrom plotly.offline import init_notebook_mode, iplotinit_notebook_mode(connected = True)

第二步:导入数据集


df = pd.read_csv('upwork_gelir.csv')df.head()

第三步:数据准备

![](https://files.mdnice.com/user/30879/689d989a-ba7c-4392-89e0-dd72f15bfa57.png)df.info()

当我们第一眼看到它时,我们可以了解到 Agency 和 PO 值有很多缺失的数据。

df.isnull().sum()

当我们查询缺失数据时,我们看到 Agency、PO、Amount in local currency、Currency、Freelancer 和 Team 列有太多缺失数据。

df.drop(columns = ['Ref ID','Description','Agency','PO','Amount in local currency','Currency'],axis=1,inplace = True)

这就是为什么我们需要从数据集中删除无用的列和缺失数据过多的列。

df['Date'] = pd.to_datetime(df["Date"])df.set_index('Date',inplace = True)

删除丢失的数据后,我们将 Date 列分配给我们的索引。

现在我们的数据集已准备好进行处理。

df.head()

第四步:EDA


我从公司赚取的收入分布:

fig = px.scatter(df,x = 'Amount',y = 'Team',color = 'Team')fig.show()

当我们检查图表时,我们可以了解到项目数量最多和收入最高的项目属于房地产公司。

前20名项目:

top_20_project = df.sort_values(by=['Amount'],ascending=False)[:20]top_20_project
px.histogram(top_20_project,x = 'Team' , y = 'Amount',color = 'Team')

当我列出我赚得最多的20个项目时,我可以清楚地看到第一名是房地产公司,第二名是一家名为Type A的公司。

支付


payment = df[df[ 'Type' ] == 'Payment' ] payment
px.histogram(payment,x = payment.index, y = 'Amount' )
total_payment = round ( sum (payment.Amount), 2 ) total_payment

全年,我总共向 Upwork 支付了 119.96美元。

会员费


membership = df[df['Type'] == 'Membership Fee']membership['Amount'] = membership['Amount'] * -1membership
px.histogram(membership,x = membership.index , y = 'Amount')
total_membership = round(sum(membership.Amount),2)total_membership

总的来说,我还向 Upwork 支付了 211.42美元的会员交易费用。

Upwork 中有两种类型的工作。第一个是小时工资。第二个是固定价格协议。我是一个通常以固定价格在 Upwork 平台上工作的人。现在我们先来看每小时的价格数据。

小时工


hourly_price = df[df[ 'Type' ] == 'Hourly' ] hourly_price

小时工总收入


income_hourly = sum (hourly_price.Amount) income_hourly

2022 年我的总收入是465 美元。

固定价格收入


fixed_price = df[df[ 'Type' ] == 'Fixed Price' ] fixed_price
px.histogram(x=fixed_price.Team.value_counts().keys(),y = fixed_price.Team.value_counts().values,color = fixed_price.Team.value_counts().values)

在这里,我们看到我们有 14 个不同的客户,与我们开展业务最多的是房地产公司。我合作最少的客户是 AI Punks 公司。

income_fixed_price = sum (fixed_price[ 'Amount' ])

我最赚钱的客户


max_profit = fixed_price[fixed_price[ 'Team' ] == 'PERSONAL REAL ESTATE CORP' ] max_profit
px.histogram(max_profit,x = max_profit.index, y = 'Amount' )

我们看图,好像每个月都在增加,但是7-8月之间是没有项目的。

sum(max_profit['Amount'])

我从房地产公司总共赚了3450.0 美元。

总收入


total_income = income_fixed_price + income_hourly total_income

当我计算我所有的客户时,我的总收入是6820.0 美元。

结论:


如果我必须计算我在 2022 年的收入,网络和 Upwork 的总体收入,我可以说我赚了 10,000 美元作为额外收入。当然,这个数字听起来不错,但我不得不说,对于真正刚刚起步的人来说,这将是一个非常艰难的过程。我为总共 14 家不同的公司和 5 个不同的国家做过专业项目。

你认为我明年会服务多少个不同的国家?

推荐书单


《PyTorch深度学习简明实战 》

本书针对深度学习及开源框架——PyTorch,采用简明的语言进行知识的讲解,注重实战。全书分为4篇,共19章。深度学习基础篇(第1章~第6章)包括PyTorch简介与安装、机器学习基础与线性回归、张量与数据类型、分类问题与多层感知器、多层感知器模型与模型训练、梯度下降法、反向传播算法与内置优化器。计算机视觉篇(第7章~第14章)包括计算机视觉与卷积神经网络、卷积入门实例、图像读取与模型保存、多分类问题与卷积模型的优化、迁移学习与数据增强、经典网络模型与特征提取、图像定位基础、图像语义分割。自然语言处理和序列篇(第15章~第17章)包括文本分类与词嵌入、循环神经网络与一维卷积神经网络、序列预测实例。生成对抗网络和目标检测篇(第18章~第19章)包括生成对抗网络、目标检测。

本书适合人工智能行业的软件工程师、对人工智能感兴趣的学生学习,同时也可作为深度学习的培训教程。

作者简介:

日月光华:网易云课堂资深讲师,经验丰富的数据科学家和深度学习算法工程师。擅长使用Python编程,编写爬虫并利用Python进行数据分析和可视化。对机器学习和深度学习有深入理解,熟悉常见的深度学习框架( PyTorch、TensorFlow)和模型,有丰富的深度学习、数据分析和爬虫等开发经验,著有畅销书《Python网络爬虫实例教程(视频讲解版)》。

购买链接(新书限时5.5折):https://item.jd.com/13528847.html

精彩回顾

《Pandas1.x实例精解》新书抢先看!
【第1篇】利用Pandas操作DataFrame的列与行
【第2篇】Pandas如何对DataFrame排序和统计
【第3篇】Pandas如何使用DataFrame方法链
【第4篇】Pandas如何比较缺失值以及转置方向?
【第5篇】DataFrame如何玩转多样性数据
【第6篇】如何进行探索性数据分析?
【第7篇】使用Pandas处理分类数据
【第8篇】使用Pandas处理连续数据
【第9篇】使用Pandas比较连续值和连续列
【第10篇】如何比较分类值以及使用Pandas分析库

长按关注《Python学研大本营》

长按二维码,加入Python读者群

扫码关注《Python学研大本营》,加入读者群,分享更多精彩

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/151539.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

保姆级 | 最新Burpsuite安装配置

文章目录 0x00 前言 0x01 环境说明 0x02 准备工作 0x03 安装JDK 0x04 配置JDK环境 0x05 Burpsuite安装 0x06 Burpsuite环境配置 0x07 Burpsuite设置代理 0x08 Burpsuite使用验证 0x09 总结 0x00 前言 Burp Suite 是用于攻击 web 应用程序的集成平台,包含了…

mongodb 中做 join 的方法

【问题】Imagine you have a collection for posts, and each of these posts has the attribute userid: ObjectId( ), where ObjectID is referencing a document in the Users collection.How would you go about retrieving the user information (in this case, the user …

GC耗时高,原因竟是服务流量小?

简介 最近,我们系统配置了GC耗时的监控,但配置上之后,系统会偶尔出现GC耗时大于1s的报警,排查花了一些力气,故在这里分享下。 发现问题 我们系统分多个环境部署,出现GC长耗时的是俄罗斯环境,…

高校舆情监控系统建设(TOOM)如何做好教育行业舆情监控方案?

高校作为高密度学生聚集地,舆情管理上,需要保持高度的警惕性。高校中大学生是活跃在互联网上的重要群体,他们作为文化水平较高、思维较活跃的特殊群体,其网络中的言论合集往往会引发社会关注。高校舆情监控系统建设(TOOM)如何做好…

Sapped of vitality 生机已被耗尽 | 经济学人社论高质量双语精翻

选自TE20221217,leaders The global economy:Sapped of vitality 世界经济:生机已被耗尽 Why are the rich world’s politicians giving up on economic growth? 为什么发达国家的政客们不再追求经济增长目标? The prospect of …

智能音箱app开发-广州app开发定制

科技高速发展,智能产品遍地都是。日常生活都是智能化时代,智能音箱app也开始被开发出来。为用户提供便捷的服务,优化体验。 智能音箱app开发特点 一:搭建快速 线上渠道在各个行业中不可或缺的,因为线上平台不管是流量…

nginx学习笔记3(小d课堂)

nginx访问日志的作用: 我们先去查看一下我们的nginx.conf文件: BAT大厂应用运维平台案例统计 awk 默认以空格进行分隔。 {print $1} 只取第一个属性 sort -n排序 sort -rn倒序 uniq -c去重 head -n 100取前100个。 自定义日志统计接口性能 我们修改完…

上半年要写的博客文章28

上半年要写的博客文章21 这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个…

基于ESP32的蓝牙刷屏器自动点击器的制作

ESP32模块的选型: 这里是利用蓝牙连接手机来做点击器或刷屏器,ESP8266只有WIFI而ESP32有WIFI和蓝牙,所以选择ESP32模块。 ESP32模块可以选择ESP32-NodeMCU: 或ESP32-MiniKit: 这里使用的是ESP32 MINI KIT,Arduino环境下烧录选择如…

Nginx搭建Web服务器

环境: CentOS 7.2.1511 一、搭建静态web服务器 访问基本的静态页面(基于IP访问) 1.使用源码包编译安装nginx 启动ngin 直接在服务器测试访问: 访问nginx Web页面实现用户认证 修改nginx配置文件 2.生成密码文件&#xff…

64. 方法的值的传递及调用类内部的属性、方法

64. 方法的值的传递及调用类内部的属性、方法 文章目录64. 方法的值的传递及调用类内部的属性、方法1. 知识回顾2. 值的传递3. 没有值4. 需要向方法传递值5. 调用类内部的属性和方法6. 综合代码7. 类在爬虫中的应用7.1 创建类7.2 创建对象7.3 调用方法7.4 第2次调用方法7.5 第2…

MSE ZooKeeper 数据导入导出功能上线

作者:草谷 背景 MSE 提供了托管版的 ZooKeeper,拥有比自建开源 ZooKeeper 稳定性更高的SLA,同时管控面提供了丰富的服务自治功能。赶在2022年的岁末,MSE ZooKeeper 上线了一个非常实用的功能-数据导入导出功能,彻底解…

Mybatis自动生成增删改查代码

GitHub项目地址 Gitee项目地址 使用 mybatis generator 自动生成代码&#xff0c;实现数据库的增删改查。 1 配置Mybatis插件 在pom文件添加依赖&#xff1a; <plugins> <plugin><groupId>org.mybatis.generator</groupId><artifactId>myba…

宝塔面板Nginx开启Brotli压缩,提升网站加载速度

前言Google 认为互联网用户的时间是宝贵的&#xff0c;他们的时间不应该消耗在漫长的网页加载中&#xff0c;因此在 2015 年 9 月 Google 推出了无损压缩算法 Brotli。Brotli 通过变种的 LZ77 算法、Huffman 编码以及二阶文本建模等方式进行数据压缩&#xff0c;与 Gzip相比效率…

图解cross attention

英文参考链接&#xff1a; https://vaclavkosar.com/ml/cross-attention-in-transformer-architecture 交叉注意力与自我注意力 除了输入&#xff0c;cross-attention 计算与self-attention相同。交叉注意力不对称地组合了两个相同维度的独立嵌入序列&#xff0c;相比之下&a…

移动互联网社交江湖已定,抖音为何仍不放过微信?

进入2023年&#xff0c;抖音集团依然放不下“社交梦”。2022年12月30日&#xff0c;抖音官网上线了一款名为“抖音聊天”的桌面端聊天软件&#xff0c;提供Windows和Mac两个版本&#xff0c;进入软件需使用抖音App扫码登录。这并不是抖音集团首次推出社交产品。2019年以来&…

Day854.两阶段终止模式 -Java 并发编程实战

两阶段终止模式 Hi&#xff0c;我是阿昌&#xff0c;今天学习记录的是关于两阶段终止模式的内容。 从纯技术的角度看&#xff0c;都是启动多线程去执行一个异步任务。既启动&#xff0c;那又该如何终止呢&#xff1f; 那如何优雅地终止线程&#xff0c;正所谓有始有终。在Ja…

Kafka 概念

Kafka 属于分布式的消息引擎系统&#xff0c;主要功能 &#xff1a;提供一套完备的消息发布与订阅解决方案 生产者和消费者都是客户端&#xff08;Clients&#xff09;&#xff1a; 生产者&#xff08;Producer&#xff09;&#xff1a;向主题发布消息的客户端应用程序消费者…

前端基础(九)_this基本使用、this指向判断、改变this指向的方法

前言&#xff1a; 看这个例子&#xff1a; 例&#xff1a;给所有的div标签都添加点击事件&#xff0c;并打印当前节点的内容 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta http-equiv"X-UA-Compa…

HW14基于规则化的终身学习Regularization-based Lifelong Learning

文章目录一、介绍-终身学习目标数据集任务示例代码-准备数据模型体系结构样本代码-训练和评估Training Pipeline:MAS - Memory Aware SynapseSISCP - Sliced Cramer Preservation二、实验1、baseline2、EWC3、MAS4、SI5、RWalk6、SCP一、介绍-终身学习 目标 一个模型可以打败…