Pandas之Series(一)

news2024/11/16 9:36:40

 

Hi😊😊~大家好呀~最近两天釉色酱在学习python中的数据分析的一个基本库——pandas。今天就先学习pandas中最基本的数据结构Series。下面我们一起进入Series的世界吧!😝

Pandas简介:

  • Pandas是一种基于Python语言的快速、强大、灵活且易于使用的开源数据分析和数据操作工具。
  • pandas使用Data Frame来存储多列的数据集,使用Series存储单列数据集。
  • Data Frame是二维的数据表,有行有列。Data Frame可以说是由一组Series组成的。

Series:

  • Series有标记(lable)
  • Series的每个值有顺序(order,索引位置)
  • 可以通过标记和位置来引用Series里面的值
  • Series是带有标记的同质数据的一维数组

 

Series简介

Series是pandas里面的类,所以需要先引用pandas:

import pandas as pd

创建Series类·的实例

pd.Series()

这其实相当于一个构造函数,可以添加参数。(比如列表,元组,字典等)

为Series填充值

参数为列表(list)

import pandas as pd

ls=["周一","周二","周三","周四","周五"]
print(pd.Series(ls))

运行结果如下:

dff21700700f40ba9378353819c348b4.png

由此,我们可以看到第一列,即”0 1 2 3 4“就是索引。我们没有指定index,所以使用默认索引。在Series中,默认索引是从0开始的数字,指定索引后才有所改变。

设置索引(index)

import pandas as pd
ls=["周一","周二","周三","周四","周五"]
serial=[1,2,3,4,5]
print(pd.Series(data=ls,index=serial))

运行结果如下:

530fdb55de7e479c9102027b33874a51.png

 其他类型的例子

整型:

lucky_numbers={4,8,15,16,23,42}
print(pd.Series(lucky_numbers))

浮点型:

stock_prices={985.32,950.44}
time_of_day={"Open","Close"}
print(pd.Series(data=stock_prices,index=time_of_day))

bool类型:

bunch_of_bools={True,False,False}
print(pd.Series(bunch_of_bools))

构造函数强制类型转换:

(dtype:数据类型)

lucky_numbers={4,8,15,16,23,42}
print(pd.Series(data=lucky_numbers,dtype="float"))
import pandas as pd
import numpy as  np
temperatures={94,88,np.nan,91}
print(pd.Series(data=temperatures))

(注意:dtype是float64)

当含有nan值时,pandas会自动把数值的类型转化为浮点型,目的是保持类型的一致。

从其他Python类型创建Series:

从字典(Dictionary创建Series)

import pandas as pd
persons={"张三":185,"李四":177,"王二麻子":181.4}  #key与value
print(pd.Series(persons))

运行结果如下:

6b319e3354f14037a72f2dddaf1a08ab.png

 这时key就作为lable,values还是字典中的values。

从元组(tuple)创建Series

import pandas as pd
color=("Red","Green","Blue")
print(pd.Series(data=color))

这时的索引仍然是默认的:

901181d3985d426590acb32e5321a602.png

注意:不能使用set(集合),因为它是无序的。

从Numpy的ndarray

rd=np.random.randint(1,101,10)#创建1~100之间的10个随机数
print(rd)
print(pd.Series(rd))

 Series的属性

1.values属性

 

import pandas as pd
color=("Red","Green","Blue")
s=pd.Series(color)
print(s.values)

 

运行结果如下:

['Red','Green','Blue']

 其属性为

nump.ndarray

2.index属性

import pandas as pd
color=("Red","Green","Blue")
s=pd.Series(color)
print(s.index)

运行结果为:

RangeIndex(start=0,start=3,step=1)

 其属性为:

pandas.core.indexes.base.Index

 3.dtype属性

import pandas as pd
color=("Red","Green","Blue")
s=pd.Series(color)
print(s.dtype)

运行结果为:

object

4.size属性

返回values的个数

print(s.size)
3

5.shape属性:

返回一个元组(由于Series是一维的,所以只返回一个数)

print(s.shape)
(3,)

6.is_unique属性

若Series里面有相同的,则返回False。若没有,则返回Ture

print(s.is_unique)
Ture

获取前几行和后几行

d=range(0,500,5) #生成一个序列
ns=pd.Series(data=d)
print(ns)

d1a8ba524e604724b181ae96fdccef2f.png

取前n个数需要用到函数head()。

如果没有传递参数,那么默认为5。(不同编译系统可能不同)

import pandas as pd
d=range(0,500,5)
ns=pd.Series(data=d)
print(ns)

ns_2=ns.head(5)
print(ns_2)

ns_3=ns.head(10)
print(ns_3)

1b826a09385e4db58f02d8932b4afac5.png

 获取后几行,利用函数tail()

ns_4=ns.tail(3)
ns_5=ns.tail(5)
print(ns_4)
print(ns_5)

e737faae5fb44bd68ab35e33f0d947ec.png

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/707789.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

sklearn.model_selection模块介绍

数据集划分方法 train_test_split train_test_split(*arrays, test_sizeNone, train_sizeNone, random_stateNone, shuffleTrue, stratifyNone)参数包括: test_size:可选参数,表示测试集的大小。可以是一个表示比例的浮点数(例…

Android:ViewPager2

简介 ViewPager2内部使用RecyclerView实现,并提供了增强功能 特性 支持水平、垂直方向布局 android:orientation “vertical” 支持从右到左 android:layoutDirection “rtl” 禁止滑动 setUserInputEnabled() 可修改Fragment集合 对可修改的Fragment集合进行分…

深入探究Bean生命周期的扩展点:Bean Post Processor

概要 在Spring框架中,Bean生命周期的管理是非常重要的一部分。在Bean的创建、初始化和销毁过程中,Spring提供了一系列的扩展点,使开发者能够在不破坏原有功能的基础上,对Bean的生命周期进行定制化操作。其中,Bean Post…

LLM记录202304-202306

RLHF RAFT RAFT: Reward rAnked FineTuning for Generative Foundation Model Alignment code RRHF RRHF: Rank Responses to Align Language Models with Human Feedback without tears code p i = ∑ t lo

English Learning - L3 作业打卡 Lesson7 Day53 2023.6.28 周三

English Learning - L3 作业打卡 Lesson7 Day53 2023.6.28 周三 引言🍉句1: It was this moment that I asked myself that life-defining question:成分划分同化连读爆破语调 🍉句2: If my life were a book and I were the author, how would I want t…

基于Web的小学学科数字教学资源管理系统

摘要 小学学科数字教学资源管理是一个典型的学习项目,从教学资源、教材信息的统计和分析,在过程中会产生大量的、各种各样的数据。本文以小学学科数字教学资源管理系统为目标,采用B/S模式,以Springboot为开发框架,java…

计算机网络面经之TCP三次握手和四次挥手的详解

常见问题 1.详细描述三次握手和四次挥手的过程。 2.三次握手可以变成两次握手吗? 3.简述 TCP 连接和关闭的状态转移。 4.简述TCP 四次挥手的 TIME_WAIT状态,以及为什么需要有这个状态 重要的字段定义与作用 (1)序号(sequence nu…

循环双链表

目录 双向循环链表结构体初始化函数添加数据头插删除数据显示函数示例程序一(简易版本):运行结果:示例程序二输出结果: 双向循环链表 结构图示: 结构体 typedef struct node {int data;struct node* pre; //指向前驱struct …

C++迭代器

目录 1.iterator 2.数组 1.iterator 迭代器就是个内置指针&#xff0c;可以 -- &#xff0c;可以解引用。 迭代器分两种类型 iterator 和const_iterator&#xff08;只读&#xff0c;不能修改&#xff09; 迭代器要用作用域限定类型 vector<int>::iterator it; 如果不限制…

Yarn的实现原理详解

概要 Yarn作为分布式集群的资源调度框架&#xff0c;它的出现伴随着Hadoop的发展&#xff0c;使Hadoop从一个单一的大数据计算引擎&#xff0c;成为一个集存储、计算、资源管理为一体的完整大数据平台&#xff0c;进而发展出自己的生态体系&#xff0c;成为大数据的代名词。 Ya…

C++11新特性 智能指针

智能指针 nuique_ptr特点不允许拷贝构造和赋值运算符重载-> () *unique_ptr 删除器仿写删除文件删除普通对象 shared_ptr特点示意图仿写shared_ptr删除器部分特化拷贝构造 移动构造 && 左值赋值 和移动赋值完整实现 weak_ptr特点weak_ptr 实现解决循环引用弱指针一个…

java: 警告: 源发行版 11 需要目标发行版 11解决方案

出现这样的问题首先检查一下自己的项目结构是否使用的对应的jdk 如果这里是正确的&#xff0c;之后查看一下自己的pom文件中是否指定了正确的jdk 这里的时候你改完运行就会发现还会报错&#xff0c;一定要记得刷新一下maven 再重新启动项目&#xff0c;即解决

剑指 Offer 63: 股票的最大利润

最标准答案 不可以有前一项的影响&#xff0c;只能用来对比并不叠加 这里max设置0就会导致先行进入大于max的判断语句&#xff01; 无语了&#xff0c;自己把问题想的太复杂了&#xff01; class Solution {public int maxProfit(int[] prices) {if(prices.length<2) retur…

十二个常用化学文献检索网站

一、Royal Society of Chemistry英国皇家化学学会 英国皇家化学学会&#xff08;Royal Society of Chemistry&#xff0c;简称RSC&#xff09;&#xff0c;是一个国际权威的学术机构&#xff0c;是化学信息的一个主要传播机构和出版商&#xff0c;其出版的期刊及资料库一向是化…

886. 可能的二分法

链接&#xff1a;886. 可能的二分法 题解&#xff1a; class Solution { public:bool possibleBipartition(int n, vector<vector<int>>& dislikes) {// -1&#xff0c;代表这个点没有访问过&#xff0c; 0&#xff0c;1代表两个染色的组std::vector<int&…

python机器学习——聚类评估方法 K-Means聚类 神经网络模型基础

目录 聚类模型的评价方法&#xff08;1&#xff09;轮廓系数&#xff1a;&#xff08;2&#xff09;评价分类模型 【聚类】K-Means聚类模型&#xff08;1&#xff09;聚类步骤&#xff1a;&#xff08;2&#xff09;sklearn参数解析&#xff08;3&#xff09;k-means算法特点 神…

GPT模型训练实践(3)-参数训练和代码实践

一、参数训练 GPT模型参数的训练过程宏观上有两个大环节&#xff0c;先从上往下进行推理&#xff0c;再从下往上进行训练&#xff0c;具体过程为&#xff1a; 1、模型初始化参数随机取得&#xff1b; 2、计算模型输出与真实数据的差距&#xff08;损失值和梯度&#xff09; …

VS2019的安装和简单使用

这里写自定义目录标题 欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题&#xff0c;有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一个…

【数据结构与算法】学校运动会管理系统(C/C++)

这是一个完整的项目&#xff0c;若有需要整个项目的压缩包&#xff08;源代码、文档、md文件等&#xff09;可私聊发送"学校运动会管理系统"。 问题描述 在“学校运动会管理系统”中&#xff0c;设有n个单位参加运动会&#xff08;单位可是学院、系、年级等&#xf…

Java 实现支付宝支付、退款、订单查询

最在开发一款APP&#xff0c;需要实现支付宝支付&#xff0c;记录一下实现过程 流程整体交互图如下所示 一、引入pom依赖 <dependency><groupId>com.aliyun</groupId><artifactId>aliyun-java-sdk-core</artifactId><version>4.0.3<…