数据分析05——往Pandas中导入数据

news2025/1/22 19:08:41

1、导入Excel:

  • 注意这种方法可以导入xlsx和xls两种类型的数据
  • 读入的数据会以DataFrame的格式显示
  • 举例:df = pd.read_excel(‘./data/demo_03.xlsx’)
  • 还可以导入excel文件中具体的某一个表格:pd.read_excel(‘./data/demo_03.xlsx’, sheet_name=‘工作表1’)
  • 导入时要看字段名在excel表的哪一行(以第二行为例):pd.read_excel(‘./data/demo_03.xlsx’, sheet_name=‘工作表3’, header=1)
  • 通过指定的列索引来导入第1列:pd.read_excel(‘./data/demo_03.xlsx’, usecols=[0])
  • 通过指定的列索引来导入第1列、第4列:pd.read_excel(‘./data/demo_03.xlsx’, usecols=[0, 3])
  • 通过指定的列名来导入指定列:pd.read_excel(‘./data/demo_03.xlsx’, usecols=[‘name’, ‘sex’])

2、导入csv文件:

  • 导入csv,并指定编码格式:pd.read_csv(‘./data/demo_03.csv’, encoding=‘utf-8’)

3、导入txt文件:

  • pd.read_csv(‘./data/demo_03.txt’, encoding=‘utf-8’, sep=‘\t’) # sep是指定分隔符

4、导入json,并指定数据结构:

  • json是一种轻量级的数据交换格式,它使用文本进行格式化和编码,通常用于Web服务之间的数据传输。
    • json:非表单结构,读取无意义
    • json:表单结构(split, records, index, table, values),读取有意义
    • 举例:pd.read_json(‘./data/records.json’, orient=‘records’) # orient参数具体给什么就看要导入的数据是类型的json的
  • 在 pd.read_json 函数中,还可以设置其它的 orient 值(类似于第一个参数),以便按照不同的数据结构将 JSON 文件读入到 Pandas 数据库中来供进一步操作。常见的除了 “records” 还包括 “index”、“columns”、“values” 和 “table” 等,具体格式如下:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/522102.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SD-MTSP:麻雀搜索算法SSA求解单仓库多旅行商问题(提供MATLAB代码,可以修改旅行商个数及起点)

一、单仓库多旅行商问题 多旅行商问题(Multiple Traveling Salesman Problem, MTSP)是著名的旅行商问题(Traveling Salesman Problem, TSP)的延伸,多旅行商问题定义为:给定一个𝑛座城市的城市集…

postgresql源码学习(55)—— 列中的NULL值是如何存储和判断的?

问题来自 《PostgreSQL面试题集锦》学习与回答_Hehuyi_In的博客-CSDN博客 第11题 一、 NULL值存储位置 在pg元组头数据中,有一个t_bits数组,用于存储空值位图。当元组中没有null值的时候,t_bits可以被认为是空的,当元组有null值的…

javaweb学习 html+css基础1

1、学习路线 2、web网站的开发模式 课程安排 web 前端 前端学习内容 html和css的帮助网站 HTML 系列教程 (w3school.com.cn) html快速入门 使用VSCode开发工具,输入 !enter,即可出现骨架。 ctrl/ 可以将文字转换为注释 右击一个页面…

【JavaEE】计网之IP协议+以太网+DNS

博主简介:想进大厂的打工人博主主页:xyk:所属专栏: JavaEE初阶 网络层重点协议——IP协议,在复杂的网络环境中确定一个合适的路径~ 本篇文章我们来讲解什么是 IP协议及以太网,在IP协议中,有 地址管理 和 路由选择 两个…

C++中基类和派生类的构造函数与析构函数的调用顺序分析

基类为B,派生类为C,直接上代码以及运行结果。 目录 思路分析 代码一 运行结果一 代码二:B(i)改为b(i) 运行结果二 代码三:加上B(i) 运行结果三 代码四:删掉C类定义的B对象b,删除b(i) 运行结果四 思路…

Linux使用全应用

一、CentOS安装Docker Docker CE 支持 64 位版本 CentOS 7,并且要求内核版本不低于 3.10, CentOS 7 满足最低内核的要求,所以我们在CentOS 7安装Docker。 基础命令 搜索镜像:docker search mysql 下载镜像:docker p…

[架构之路-197]-《软考-系统分析师》- 关键技术 - 问题分析阶段重要的四个任务

目录 前言: 一、信息系统/软件产品的问题分析概述 二、信息系统/软件产品的问题/痛点分析四步骤 步骤1、问题领域分析:研究遇到问题的业务领域(诉求) 步骤2、 领域问题和机会分析:分析业务领域的问题、痛点、难点…

计算机网络学习 一 (计算机网络体系结构)

计算机网络 基本概念 计算机网络是一个将分散的,具有独立功能的计算机系统. 简单来说,计算机网络就是一些互连的,自治的计算机系统的集合 分类 广义上:是一个资源共享的系统. 资源共享上: 1.目的–资源共享 2.组成单元–分布在不同地理位置的多台独立的"自治计算机"…

第十四届蓝桥杯青少组模拟赛Python真题 (2022年11月8日)

第十四届蓝桥杯青少组模拟赛Python真题 (2022年11月8日) 编程题 第 1 题 问答题 二进制位数 十进制整数2在十进制中是1位数,在二进制中对应10,是2位数。 十进制整数22在十进制中是2位数,在二进制中对应10110,是5位数。 请问十…

Linux高级---k8s之service服务

文章目录 一、service基本概念二、service类型三、service的使用1、实验环境准备2、ClusterIP类型的Service3、HeadLiness类型的Service4、NodePort类型的Service5、LoadBalancer类型的Service6、ExternalName类型的Service 一、service基本概念 在kubernetes中,pod…

【Java多线程编程】线程的六种状态

前言: 在我们进行多线程编程,脑海里会想到线程运行的状态到底是什么?因此我整理出这线程的状态这篇博文。线程的状态分为六种:新建状态(NEW)、就绪状态(RUNNABLE)、阻塞状态&#xf…

1-Linux环境安装JDK

Linux环境安装JDK 准备: ① Linux 环境 本文中Linux环境为 CentOS Linux 7 可使用以下命令查询 linux 系统版本: hostnamectl② 准备JDK包 进入官网 https://www.oracle.com/java/technologies/downloads/#java17下载对应jdk包 此处使用以前下载的旧…

Linux驱动编程(驱动程序基石)(下)

一、中断的线程化处理 复杂、耗时的事情,尽量使用内核线程来处理。上节视频介绍的工作队列用起来挺简单,但是它有一个缺点:工作队列中有多个 work,前一个 work 没处理完会影响后面的 work。解决方法有很多种,比如干脆…

String类的学习笔记(下):字符串拼接以及StringBuilder和StringBuffer的学习

本文介绍了String类对字符串进行拼接的方法 和拼接字符串的效率分析 以及能对字符串内容进行修改的StringBuilder和StringBuffer类其常用方法和区别 , 最后介绍了两个字符串经典面试题 StringBuilder和StringBuffer的学习 一.String类概括二.StringBuilder和StringBuffer1.字符…

是未来的超级计算机还是只是一场炒作?

随着科技的飞速发展和创新,量子计算技术逐渐成为了人们关注的热点话题。量子计算作为一种前沿的计算方式,具有超强的运算能力和突破性的创新潜力,因此备受瞩目。然而,随着各大公司和机构纷纷加入到这一领域的竞争中,一…

超详细github配置(仔细看,看完不会,你怪我)

github的重要性: 网络时代的程序员必备。 github的作用: 版本管理多人协作开源共享 常用方案: gitTortoiseGitgithub [Tortoise,程序员常称其为小乌龟,小海龟] 安装配置步骤 1.注册 GitHub: Where the world bu…

服务(第二十二篇)主从复制和读写分离

主从复制原理: 首先主节点会开启二进制日志,从节点会开启中继日志,从节点会开启io线程检测主节点是否有更新,如果更新了就会向主节点请求二进制事件,主会开启dump线程发送二进制事件,然后保存在从节点的中…

假如面试官让你十分钟完成双向循环链表

💌 博客内容:假如面试官让你十分钟完成双向循环链表,多一秒都不行 😀 作  者:陈大大陈 🚀 个人简介:一个正在努力学技术的准前端,专注基础和实战分享 ,欢迎私信&…

大前端技能讲解:NodeJS、Npm、Es6、Webpack

文章目录 1. 基础概述2. Nodejs2.1 Nodejs 了解和快速入门2.2 Nodejs 实现 Httpserver 服务(实现请求响应)2.3 Nodejs 操作 MySQL 数据库 3. ES63.1 ES6 的概述3.2 ES6 的语法:let 和 const 命令3.3 ES6 的语法:模板字符串3.4 ES6…

基于SSM的在线电影购票系统设计与实现【附源码】

基于SSM的在线电影购票系统设计与实现 互联网的不断迅猛发展,每个行业都在寻找新的机会,都在从传统的人工方式向先进的信息化过度。随着人民生活水平的提高伴随的精神文化层次的享受,而现代互联网时代人们的重要精神消费之一是电影行业&…