Python pandas数据分析

news2024/11/18 14:57:00

Python pandas数据分析:

2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试


文章目录

  • Python pandas数据分析:
    • @[TOC](文章目录)
  • Python pandas数据分析:
  • 总结

Python pandas数据分析:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
语言这行
df[内部控制字段的条件]
在这里插入图片描述
大小写有问题
在这里插入图片描述
在这里插入图片描述
包含Python的哪些列揪出来

简单方法多好啊,搞那么多锤子作甚

直接输出columns
在这里插入图片描述
修改列名字
rename
把字段score改为这个population
在这里插入图片描述
value_counts()
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
中间是控制条件
去重
drop_diplicates
在这里插入图片描述
在这里插入图片描述
list转呗
.tolist()

在这里插入图片描述
数据.to_excel(路径)
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
交换两个列的位置
在这里插入图片描述
max
在这里插入图片描述
拿最大行
在这里插入图片描述
删除最后那个位置
在这里插入图片描述
增加一行
写个字典
然后append吧
在这里插入图片描述
sort_values()
在这里插入图片描述
在这里插入图片描述
lambda的目的是定义x
然后f(x)处理返回值,放到新的字段中

读取数据
在这里插入图片描述
查看数据的前几行
head()
在这里插入图片描述
中间可以加参数
切割split
转数字为int
把字符去掉strip(‘k’)
最大最小值拿到后,求取平均

apply是合并,用函数func去合并了,但是func是一条一条去处理
在这里插入图片描述
这个合并的用法,相当于单独处理那一列,懂???

这些应该学学
根据学历分组
算平均薪资
分组聚合
groupby关键字
mean求均值
在这里插入图片描述
把月日格式输出
.format?
一个个循环
for i in range(len(df)):
ix是啥?底i行?第0列
转为pydatetime
.strftime(“%m-%d”)月日
在这里插入图片描述
查看索引,数据类型和内存信息
info
在这里插入图片描述
数值型列的汇总
在这里插入图片描述
新增一列,将薪水分为三组
bins搞三个区间
然后分组仨名字,用啥函数来搞可能
新启动一列,cut切割,谁?薪水,按bins切割,然后名字的labels挂上

在这里插入图片描述
sort_values(字段,ascending=False),降序
True是升序
在这里插入图片描述
按照salary来排序

取出行
loc
在这里插入图片描述
中位数
np能,
np.median(df中salary数据)
pandas也能
在这里插入图片描述
绘制薪资的频率分布直方图
有matplotlib.pyplot

plt
df.salary.plot(kind=‘hist’)
直接用它自带的属性
在这里插入图片描述

df.salary.plot(kind=‘kde’, xlim=(0,8000))水平密度线
在这里插入图片描述
水平的密度
薪资有多人?

删除列
drop
在这里插入图片描述
合并两列
在这里插入图片描述
在这里插入图片描述
最值只差
apply:
lambda x:x.max()-x.min()
在这里插入图片描述
中间多了[]这个是啥意思

总之就似乎它的最大小之差
在这里插入图片描述
第8行加到末尾
append
在这里插入图片描述
好像loc和iloc都能获取行
在这里插入图片描述
数据的类型
dtypes

设置索引
setindex
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
减法,继续增加一列
直接干字段,后面跟着数据
在这里插入图片描述

在这里插入图片描述
包含缺失值吗

在这里插入图片描述
在这里插入图片描述
大于10000的次数
在这里插入图片描述
在这里插入图片描述
调取
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
df[里面是条件]

遍历每个字段,如果有缺失,则统计一波
然后照这个列,如果有null,就给他的values设定为True,把index弄出来,变tolist
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
收盘价
折现图
matplotlib
用seaborn-darkgrid画质
rc设置字体大小
fig出一个句柄画布

在这里插入图片描述
直接plot也行
你需要时间轴
在这里插入图片描述
俩都画
把数据整俩
在这里插入图片描述
在这里插入图片描述
hist
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
换手率
每行换手率
iloc行列
在这里插入图片描述
在这里插入图片描述
删除所有
非数字的行
for循环

定位i行13列
如果不是数字,做成列表
挨个去drop或者删除
labels=那个列表
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
收取平均
骚啊rolling
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
连着plot就是一个图

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
向后移动
向前移动

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
pandas和numpy经常混合使用

np.version
pd.version

在这里插入图片描述
搞一个np.random.randint(1,100,20)1–100,20个数据
然后搞一个dataframe
在这里插入图片描述
在这里插入图片描述
np.arrange(0,100,5)
这个是步长为5,固定的
在这里插入图片描述
在这里插入图片描述
正态分布也行
在这里插入图片描述
合并仨行
axis=0就是行
concat方法就是合并
在这里插入图片描述
在这里插入图片描述

往下拼接
我们看看axis=1列
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
牛逼
percentile(df,q=[0,25,75,100])%
本质是
精准在这里插入图片描述
修改列名
在这里插入图片描述
输出看看
在这里插入图片描述
第一列中不在第二列
是否存在?
在这里插入图片描述
df[][这里输出真假]
控制
频率,统计,排序
values_count自然是降序呗
在这里插入图片描述
找位置
np.argwhere
df%5==0
整除
在这里插入图片描述
前后差
diff().to_list
在这里插入图片描述
顺序颠倒
在这里插入图片描述
拿数据take
在这里插入图片描述
每一行均值
在这里插入图片描述
第三列升序排序,整体要带动吗
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2norm
在这里插入图片描述
单独列出别的呢
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
converter
转换
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
round直接取%

在这里插入图片描述
data直接0:2%前面对其,后面2个小数点

在这里插入图片描述
在这里插入图片描述
翻转行
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
CD字段也过来了
多列
在这里插入图片描述在这里插入图片描述
左右是看key1,还是2


总结

提示:重要经验:

1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1252827.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux shell编程学习笔记29:shell自带的 脚本调试 选项

Linux shell脚本的调试方法比较多,上次我们探讨和测试了shell内建命令set所提供的一些调试选项,其实 shell 本身也提供了一些调试选项。我们以bash为例来看看。 1 bash 的命令行帮助信息(bash --help) purleEndurer csdn ~ $ ba…

带你用uniapp从零开发一个仿小米商场_3.animate.css动画库在uniapp中的使用

这篇文章仅做简单介绍animate.css动画库在uniapp中如何使用 animate.css动画库引入 怕有人没看专栏前面的文章,所以这里重新介绍一边animate.css动画库的引入,知道的可以跳过 可以在这里下载 animate.css动画库官网http://www.animate.net.cn/ 下载好animate.css后在项目根…

5.2每日一题(无穷级数敛散性:绝对收敛、比较法/比较法的极限形式、p级数)

一般看到绝对收敛和条件收敛——先看级数绝对值的敛散性

ubuntu修改系统语言

修改ubuntu系统语言 操作指令修改系统设置总结 操作 ubuntu系统自带的英文环境,个人觉得用起来不方便。改掉吧。换成中文 指令修改 参考了一些博客的解决方式 ctrlartT 打开终端。 sudo apt-get install language-pack-zh-hans 输入下载汉化包的指令。 但是&…

SpringMVC系列-7 @CrossOrigin注解与跨域问题

背景 前段时间帮同事分析了一个跨域问题,正好系统分析和整理一下。 1.跨域 理解同源策略是理解跨域的前提。同源策略定义如下: 在同一来源的页面和脚本之间进行数据交互时,浏览器会默认允许操作,而不会造成跨站脚本攻击&#x…

ImportError: No module named python_util.util

ImportError: No module named python_util.util 从师兄那里拷贝了一个python文件,运行报错ImportError: No module named python_util.util,python小白上网搜,并没有搜到有价值的答案。。。经过摸索,最后解决。 其实这就是缺少…

vue3+elementPlus之侧边菜单栏功能

选择默认的颜色&#xff0c;将代码拷贝至<el-aside>模块中 稍微把不需要的修改一下。 <template><div class"common-layout"><el-container><el-header class"homeHeader"><div class"headerTitle">Devops…

抖音权重查询源码H5源码

源码下载&#xff1a;123网盘

Linux的基本指令 ( 一 )

目录 前言 Linux基本指令 快速认识五个指令 ls指令 补充内容 pwd指令 补充内容 cd指令 补充内容 重新认识指令 指令的本质 which指令 alias指令 最后 一个文件的三种时间 tree指令及安装 tree指令 前言 关于Linux操作系统的桌面&#xff0c;在学校教学中我们…

共享模型之内存

JMM JMM&#xff1a;Java内存模型。定义了主存&#xff08;所有线程共享的数据&#xff09;、工作内存&#xff08;每个线程对应的私有数据&#xff09;的抽象概念。 JMM存在以下几个特征 原子性&#xff1a;保证指令不会受到线程上下文切换所影响。可见性&#xff1a;保证指…

C语言—什么是数组名

#define _CRT_SECURE_NO_WARNINGS 1#include<stdio.h> int main() {int arr[]{1,2,3,4};printf("%p\n",arr);printf("%p\n",&arr);printf("%p\n",*arr);return 0; } 结论&#xff1a;数组名是数组首元素地址&#xff08;下标为0的元素…

PC端从零搭建微信自动回复机器人(一)基础框架搭建及源码

由于工作需要&#xff0c;最近一年一直在研究和使用C#&#xff0c;加上最近工作上有做微信机器人的需要&#xff0c;在已经对接、调试稳定之后&#xff0c;将项目的源码分享给大家&#xff0c;传递开源精神。 一、环境依赖 1、开发工具&#xff1a;Vistual Studio 2022 2、Ne…

【FFmpeg视频解码】解码数据结构及函数总结

转载自原文地址&#xff1a;https://www.cnblogs.com/wangguchangqing/p/5744941.html 本文的总结分为以下两个部分&#xff1a; 数据读取&#xff0c;主要关注在解码过程中所用到的FFmpeg中的结构体。解码过程中所调用的函数 在学习的过程主要参考的是dranger tutorial&…

从零开始搭建博客网站-----源代码试部署

拿到了该项目的源码&#xff0c;先尝试是否可以成功部署&#xff0c;详细的部署视频地址 后端项目部署 先把maven配置好&#xff0c;都改成自己下载的maven地址 文件编码改成utf-8&#xff0c;防止配置文件乱码 如果maven是刚下的&#xff0c;要改一下下载包的地址&#xff0…

使用信息面板沟通研发工作

凌鲨里面的内容面板里面有专门针对研发团队的白板功能&#xff0c;它可以把文档&#xff0c;图片&#xff0c;软件设计&#xff0c;需求&#xff0c;任务/缺陷等相关研发要素串接起来。 使用 你还可以调整背景颜色。 引用项目内数据 点击面板中的连接会在右侧打开对应内容

电子学会C/C++编程等级考试2021年12月(二级)真题解析

C/C++等级考试(1~8级)全部真题・点这里 第1题:统计指定范围里的数 给定一个数的序列S,以及一个区间[L, R], 求序列中介于该区间的数的个数,即序列中大于等于L且小于等于R的数的个数。 时间限制:1000 内存限制:65536输入 第一行1个整数n、,分别表示序列的长。(0 < n…

浅谈建筑节能监管平台在高校能源管理中的实践与应用

安科瑞 华楠 摘要&#xff1a;以节约型校园建设示范工程———宁夏大学节能监管平台项目建设为例&#xff0c;对系统的总体构架、关键技术、管理软件功能进行了详细的介绍。同时针对项目建设、运行和管理过程中出现的一些问题&#xff0c;提出有针对性的解决措施&#xff0c;为…

模拟退火算法应用——求解一元函数的最小值

仅作自己学习使用 一、问题 需求&#xff1a; 计算函数 的极小值&#xff0c;其中个体x的维数n10&#xff0c;即x(x1,x2,…,x10)&#xff0c;其中每一个分量xi均需在[-20,20]内。因此可以知道&#xff0c;这个函数只有一个极小值点x (0,0,…,0)&#xff0c;且其极小值是0&…

信息检索指标直接优化的通用近似框架

1、直接优化信息检索指标的背景 1.1、存在问题 直接优化信息检索的指标是信息检索的一大方向。主要包含两类方法&#xff0c;一类是将IR指标作为上界进行优化&#xff1b;另一类是使用平滑函数近似表示IR指标进行优化。 直接优化IR指标方式很自然&#xff0c;但没有提供理论…

【ArcGIS Pro微课1000例】0037:ArcGIS Pro中模型构建器的使用---以shp批量转kml/kmz为例

文章目录 一、ArcGIS Pro模型构建器介绍二、shp批量转kml/kmz1. 打开模型构建器2. 添加工作空间4. 添加【创建要素图层】工具5. 添加【图层转kml】工具6. 输出文件命名7. 运行模型一、ArcGIS Pro模型构建器介绍 模型构建器是一种可视化编程语言,用于构建地理处理工作流。 地理…