数据分析12——Pandas中数据合并方法

news2025/1/11 12:43:28

0、前言:

  • 在pandas中进行数据合并的操作和数据库中的join操作非常类似。

1、merge横向合并:

  • 前言:该函数只能做横向合并
  • 函数名:merge()
  • 函数参数:
    • left: 数据类型为’DataFrame | Series’,需要进行合并的左侧数据框
    • right: 数据类型为 ‘DataFrame | Series’,需要进行合并的右侧数据框
    • how: 需要执行的合并方式(下面所说的数据框,可以理解为数据表,只解释函数使用时必须传递的参数)
      • ‘inner’:内连接,只保留左右数据框中都存在的行(类似于交集)
      • ‘outer’:外连接,保留左右数据框中所有的行,缺失部分填充NaN(类似于并集)
      • ‘left’:左连接,以左侧数据框为基准,左侧数据都会出现,右侧如果没有和左侧对应的,就填充NaN
      • ‘right’:右连接,以右侧数据框为基准,右侧数据都会出现,左侧如果没有和左侧对应的,就填充NaN
      • ‘cross’:交叉连接,如表一有三个列字段,表二有四个列字段,连接之后就是十二个列字段
    • on: 左右数据框中可以对应连接的列名,必须同时出现在左右两个数据框中(用于两边连接列名一致的情况)
    • left_on: 指定左边数据框中要连接的列名(用于两边连接列名不一致的情况)
    • right_on: 指定右边数据框中要连接的列名(用于两边连接列名不一致的情况)
    • left_index: ‘bool’ = False,
    • right_index: ‘bool’ = False,
    • sort: ‘bool’ = False,
    • suffixes: ‘Suffixes’ = (‘_x’, ‘_y’),
    • copy: ‘bool’ = True,
    • indicator: ‘bool’ = False,
    • validate: ‘str | None’ = None,
  • 举例:
    在这里插入图片描述

2、join横向合并:

  • 前言:join在使用之前要将关联字段设置为行索引,具体见实例
  • 函数名:表1.join()
  • 函数参数:
    • other: 数据类型为’DataFrame | Series’,表示要合并的数据框
    • how: 表示要执行的操作
      • left:左连接
      • right:右连接
      • outer:外连接
      • inner:内连接
  • 举例:
    在这里插入图片描述

3、concat横向合并和纵向合并:

横向连接:

  • 前言:join在使用之前要将关联字段设置为行索引,具体见实例
  • 函数名:表1.concat()
  • 函数参数:
    • objs: 要执行连接的数据框,通过列表的形式传入
    • axis: 要执行的连接类型,等于0为纵向合并,等于1为横向合并
    • join: 要执行的合并方式,只有两种
      • outer:外连接
      • inner:内连接
  • 举例:
    在这里插入图片描述

纵向连接:

  • 前言:join在使用之前要将关联字段设置为行索引,具体见实例
  • 函数名:表1.concat()
  • 函数参数:
    • objs:要执行连接的数据框,通过列表的形式传入
    • axis:要执行的连接类型,等于0为纵向合并,等于1为横向合并
    • ignore_inde:是否忽略之前的排序,重新排序
  • 举例:
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/548611.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[CTF/网络安全] 攻防世界 PHP2 解题详析

[CTF/网络安全] 攻防世界 PHP2 解题详析 index.php.phps扩展名姿势 翻译:你能给这个网站进行身份验证吗? index.php index.php是一个常见的文件名,通常用于Web服务器中的网站根目录下。它是默认的主页文件名,在访问一个网站时&am…

说说计算这事儿:从开关到人工智能

目录 一 前言 二 计算历史 三 计算探秘 四 算力优化 五 未来展望 一 前言 计算本身其实是一个比较抽象的词,或者说比较笼统。很多场景都可能用到计算这个词,因此具体的含义就需要根据上下文来确定。今天我们讨论的计算,是比较狭义的计算…

【环境准备】在虚拟机的Ubuntu下安装VS Code并配置C/C++运行环境

1.点击进入 vscode官网 下载.deb安装包 2.启动虚拟机下的Ubuntu,Windows下的Xftp和Xshell Xftp:用于将刚刚在Windows下下载好的vscode.deb安装包传输到Ununtu中。Xshell:用于远程登录Ununtu,进行 vscode.deb 安装包安装&#xff…

算法26:递归练习

目录 题目1:给你一个字符串,要求打印打印出这个字符串的全部子序列(子序列不能重复) 题目2:打印一个字符串的全部排列。 题目3:针对题目2,要求去除重复元素 题目4:给定一个字符串…

ARM的读写内存指令与栈的应用

1.基础读写指令 写内存指令:STR MOV R1, #0xFF000000 MOV R2, #0x40000000 STR R1, [R2] 将R1寄存器中的数据写入到R2指向的内存空间 需注意,此命令是将R1中的数据写给R2所指向的内存空间,而不是直接把R1的数据赋给R2,R2寄存器…

chatgpt赋能Python-python3_9如何安装

Python 3.9 安装教程 Python 是一款非常流行的编程语言,而 Python 3.9 是其中的最新版本。不过,有些人可能会遇到一些问题,因为这是一个新版本。在本篇文章中,我们将介绍 Python 3.9 的安装过程,并提供一些关键的步骤…

无线通信网 - 动态主机配置协议 DHCP

文章目录 1 概述2 DHCP2.1 工作原理2.2 报文类型 3 扩展3.1 网工软考真题 1 概述 #mermaid-svg-VTnvU3Vd01Y4gppz {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-VTnvU3Vd01Y4gppz .error-icon{fill:#552222;}#merm…

[CTF/网络安全] 攻防世界 Training-WWW-Robots 解题详析

[网络安全] 攻防世界 Training-WWW-Robots 解题详析 在这个小训练挑战中,你将学习 Robots_exclusion_standard(机器人排除标准)。 robots.txt 文件是由网络爬虫用来检查是否允许他们爬行和索引你的网站或仅部分内容。有时这些文件揭示目录结构…

Vivado HLS 第1讲 软件工程师该怎么了解FPGA架构

Vivado HLS是将基于C/C++描述的算法转化成相应的RTL代码,最终在FPGA上实现。这就要求软件工程师对FPGA的内部架构有一些基本的认识,目的在于保证生成的RTL代码在性能和资源上能够达到很好的平衡。实际上,C语言与FPGA是有一些对应关系的。比如: C语言中的数组可对应于FPGA中…

直方图与直方图均衡化

直方图 图像直方图是用来表现图像中亮度分布的直方图,给出的是图像中某个亮度或者某个范围亮度下共有几个像素,即统计一幅图某个亮度像素数量。 直方图作为一种简单有效的基于统计特性的特征描述子,在计算机视觉领域广泛使用。 它的优点主要…

上下文无关文法、句柄、正规文法、规范推导、文法二义性

目录 上下文无关文法 句柄 正规文法 规范推导 文法二义性 上下文无关文法 上下文无关文法(Context-Free Grammar,CFG)是一种形式语言,用于描述一类语言的语法结构。它由一组产生式规则组成,每个规则定义了如何将一…

hackthebox htb interface:CVE-2022-28368

本题考察:CVE-2022-28368 CVE-2022-28368 - 通过远程 CSS 字体缓存安装的 RCE 参考: https://www.0le.cn/archives/58.htmlhackthebox-interface信息搜集nmap扫描端口发现开放的22和80PORT STATE SERVICE REASON22/tcp open ssh syn-ac...https://www.0le.cn/archives/58.htm…

Spring 经典面试题总结

❤ 作者主页:欢迎来到我的技术博客😎 ❀ 个人介绍:大家好,本人热衷于Java后端开发,欢迎来交流学习哦!( ̄▽ ̄)~* 🍊 如果文章对您有帮助,记得关注、点赞、收藏、…

learn_C_deep_12 (深度理解“取整“、“取余“、“取模“运算、掌握运算符优先级 )

目录 关于“取整” "取整"规则 1、向零取整 2、向-∞取整 3、向∞取整 4、四舍五入 关于"取模和取余" 运算符优先级 关于“取整” #include <stdio.h> int main() {//本质是向0取整int i -2.9;int j 2.9;printf("%d\n", i); /…

【C++】 排列与组合算法详解(进阶篇)

文章目录 写在前面算法1&#xff1a;朴素算法思路缺点 算法2&#xff1a;递推预处理思路时间复杂度&#xff1a; O ( n 2 ) O(n^2) O(n2) 算法3&#xff1a;阶乘逆元思路时间复杂度&#xff1a; O ( n log ⁡ n ) O(n \log n) O(nlogn)思考&#xff1a;读者也可以尝试写 O ( n…

PySide6/PyQT多线程之 多线程 与 线程池的模板(拿来即用)

前言 关于PySide6/PyQT多线程系列的最后一篇。写这篇文章的动机是方便后续代码的直接复用。 本篇文章实际是水文&#xff0c;给出了 PySide6/PyQT的多线程以及线程池的基础使用模板&#xff0c;方便后面有需要时候直接拿来就用。 多线程 这里分两种情况来谈论&#xff0c;有返…

[Hadoop]MapReduce与YARN

目录 大数据导论与Linux基础 Apache Hadoop、HDFS MapReduce MapReduce思想 MapReduce设计构思 MapReduce介绍 MapReduce官方实例 Map阶段执行流程 Reduce阶段执行流程 shuffle机制 YARN YARN介绍 YARN架构、组件 程序提交YARN交互流程 YARN资源调度器Scheduler…

IOS新建应用

一&#xff1a;Application App。普通app。Document App。打开是记事本类似App。Game。新建游戏相关app。RealityKit为新建一个打开摄像机&#xff0c;一个Ar立方体的应用。 SenceKit为有一架飞机旋转的游戏App。 SpirteKit为一个手指头按上会出一个手指特效的应用。 Metal为一…

【IDEA使用指南】使用Hibernate框架的Java项目,如何通过数据库表自动生成实体模型?

文章目录 【IDEA使用指南】使用Hibernate框架的Java项目,如何通过数据库表自动生成实体模型?步骤1:找到并打开“Persistence”工具栏。步骤2:找到并打开“Import Database Schema” 窗口。步骤3:配置数据源信息步骤4:查看自动生成的实体模型。【IDEA使用指南】使用Hibern…

如何在IDEA中显示时序图

如何在IDEA中显示时序图 有时候&#xff0c;我们想要了解代码的运行过程的时候&#xff0c;想要看到方法的调用流程。 这个时候就希望有一个时序图可以看&#xff0c;但是人工来画时序图太麻烦了&#xff0c;有没有办法在IDEA中直接生成呢&#xff1f; 当然是可以的。 这里…