【数据分析】读取文件

【数据分析】读取文件

news2026/2/14 12:09:13

3. 读取指定列

针对只需要读取数据中的某一列或多列的情况，pd.read_csv()函数提供了一个参数：usecols，将包含对应的columns的列表传入该参数即可。

上面，我们学习了读取 "payment" 和 "items_count" 这两列的数据。
当然，Pandas也提供了to_csv()函数，用于将DataFrame转换为CSV数据。

# 导入pandas模块，并以"pd"为该模块的简写

import pandas as pd

# 使用pd.read_csv()函数和usecols参数

# 读取路径为 "/Users/yequ/电商数据清洗.csv" 的CSV文件里的"payment"和"items_count"这两列中的数据

# 并将结果赋值给变量data

data = pd.read_csv("/Users/yequ/电商数据清洗.csv", usecols=["payment","items_count"])

# 将data保存到指定路径

data.to_csv("/Users/yequ/电商数据清洗2.csv")

ps：对DataFrame对象使用to_csv()函数，将文件保存路径作为参数，即可将DataFrame保存到指定的文件路径，并存储为后缀名是.csv的文件。

如图，我们在调用to_csv()若只设置路径参数，会将行索引信息写入CSV文件的第1列。

to_csv()函数和read_csv()函数类似，除了路径这个参数外，还有大量可选参数可以选用。

对于to_csv()函数，我们再简单了解2个可选参数。

对于前面的情况，我们通过设置参数index=False，这样就不会将行索引信息写入第一列。

# 导入pandas模块，并以"pd"为该模块的简写

import pandas as pd

# 使用pd.read_csv()函数和usecols参数

# 读取路径为 "/Users/yequ/电商数据清洗.csv" 的CSV文件里的"payment"和"items_count"这两列中的数据

# 并将结果赋值给变量data

data = pd.read_csv("/Users/yequ/电商数据清洗.csv", usecols=["payment","items_count"])

# 将data保存到指定路径，并不将行索引信息写入第一列

data.to_csv("/Users/yequ/电商数据清洗2.csv",index=False)

同样的道理，使用to_csv()函数，也有可能因为中文字符的编码问题，造成生成的csv文件乱码。

此时，我们可以将参数encoding设置为"utf-8-sig"。

格式：encoding="utf-8-sig"

示例代码：

import pandas as pd

data = pd.read_csv("/Users/yequ/电商数据清洗.csv", usecols=["payment","items_count"])

# 将data保存到指定路径

data.to_csv("/Users/yequ/电商数据清洗2.csv",encoding="utf-8-sig")

保存CSV文件

Pandas也提供了to_csv()函数，用于将DataFrame转换为CSV数据。
必选参数：要保存的CSV文件的文件路径
可选参数：
1. 设置保存编码格式：encoding="utf-8-sig"
2. 不将行索引写入第一列：index = False

与读取CSV文件相似， Excel文件的读取也差不多。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2316835.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Dify使用部署与应用实践

Dify使用部署与应用实践

最近在研究AI Agent，发现大家都在用Dify，但Dify部署起来总是面临各种问题，而且我在部署和应用测试过程中也都遇到了，因此记录如下，供大家参考。Dify总体来说比较灵活，扩展性比较强，适合基于它做…

阅读更多...

Java 大视界 -- 基于 Java 的大数据机器学习模型的迁移学习应用与实践（129）

Java 大视界 -- 基于 Java 的大数据机器学习模型的迁移学习应用与实践（129）

💖亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也…

阅读更多...

1.Windows+vscode+cline+MCP配置

1.Windows+vscode+cline+MCP配置

文章目录 1.简介与资源2.在windows中安装vscode及Cline插件1. 安装vscode2. 安装Cline插件3. 配置大语言模型3. 配置MCP步骤(windows) 1.简介与资源 MCP官方开源仓库 MCP合集网站参考视频 2.在windows中安装vscode及Cline插件 1. 安装vscode 2. 安装Cline插件 Cline插件…

阅读更多...

C#的字符串之String类与StringBuilder类区别于适用场景

一、分清楚值类型与引用类型正确理解值类型与引用类型，可以更好的帮助软件开发人员写出性能更好且正确稳定运行的程序： C#值类型与引用类型区别区别值类型引用类型定义所有继承自【System.ValueType】类型的都是值类型（valueType继承自Sys…

阅读更多...

关于WPS的Excel点击单元格打开别的文档的两种方法的探究【为单元格添加超链接】

关于WPS的Excel点击单元格打开别的文档的两种方法的探究【为单元格添加超链接】

问题需求目录和文件结构如下： E:\Dir_Level1 │ Level1.txt │ └─Dir_Level2│ Level2.txt│ master.xlsx│└─Dir_Level3Level3.txt现在要在master.xlsx点击单元格进而访问Level1.txt、Level2.txt、Level3.txt这些文件。方法一：“单元格右键…

阅读更多...

conda的基本使用及pycharm里设置conda环境

conda的基本使用及pycharm里设置conda环境

创建conda环境 conda create --name your_env_name python3.8 把your_env_name换成实际的conda环境名称，python后边的根据自己的需要，选择python的版本。激活conda环境 conda activate your_env_name 安装相关的包、库 conda install package_name …

阅读更多...

计算机网络-网络规划与设计

计算机网络-网络规划与设计

基本流程需求分析—》通信规范分析—》逻辑网络设计—》物理网络设计—》实施阶段需求分析： 确定需求，包括：业务需求、用户需求、应用需求、计算机平台需求、网络通信需求等。产物：需求规范通信规范分析： 现有…

阅读更多...

六种最新优化算法（TOC、MSO、AE、DOA、GOA、OX）求解多个无人机协同路径规划（可以自定义无人机数量及起始点），MATLAB代码

六种最新优化算法（TOC、MSO、AE、DOA、GOA、OX）求解多个无人机协同路径规划（可以自定义无人机数量及起始点），MATLAB代码

一、算法简介 （一）阿尔法进化（Alpha Evolution，AE）算法阿尔法进化（Alpha Evolution，AE）算法是2024年提出的一种新型进化算法，其核心在于通过自适应基向量和随机步长的…

阅读更多...

练习-依依的询问最小值（前缀和差分）

练习-依依的询问最小值（前缀和差分）

问题描述依依有个长度为 n 的序列 a，下标从 1 开始。她有 m 次查询操作，每次她会查询下标区间在[li,ri] 的 a 中元素和。她想知道你可以重新排序序列 a，使得这 m 次查询的总和最小。求你求出 m 次查询总和的最小值。输入格式第…

阅读更多...

ctfshow web刷题记录

ctfshow web刷题记录

RCE 第一题 eval代码执行 ： 1、使用system 加通配符过滤 ?csystem("tac%20fl*") ; 2、反字节执行 xxx %20 echo 反字节 3、变量转移重新定义一个变量让他代替我们执行 4、伪协议玩法 ?cinclude$_GET[1]?>&1php://filter/readc…

阅读更多...

MySQL单表查询大全【SELECT】

MySQL单表查询大全【SELECT】

山再高，往上攀，总能登顶；路再长，走下去，定能到达。 Mysql中Select 的用法 ------前言------【SELECT】0.【准备工作】0.1 创建一个库0.2 库中创建表0.3 表中加入一些数据 1.【查询全部】2.【查询指定列】2.1查询指定列…

阅读更多...

考研系列-408真题计算机网络篇(18-23)

考研系列-408真题计算机网络篇(18-23)

写在前面此文章是本人在备考过程中408真题计算机网络部分（2018年-2023年）的易错题及相应的知识点整理，后期复习也常常用到，对于知识提炼归纳理解起到了很大的作用，分享出来希望帮助到大家~ # 2018 1.停止-等待协议的…

阅读更多...

$卷积神经网络（CNN）之 EfficientNet$

卷积神经网络（CNN）之 EfficientNet

在深度学习领域，模型的计算效率与性能之间的平衡一直是一个核心挑战。随着卷积神经网络（CNN）在图像分类、目标检测等任务中取得显著成果，模型的复杂度和计算需求也急剧增加。2019年，Google Research 提出的 EfficientN…

阅读更多...

【eNSP实战】将路由器配置为DHCP服务器

【eNSP实战】将路由器配置为DHCP服务器

拓图要求： 为 office100 和 office200 分别配置地址池 AR1接口配置 interface GigabitEthernet0/0/0ip address 192.168.100.1 255.255.255.0 # interface GigabitEthernet0/0/1ip address 192.168.200.1 255.255.255.0 AR1路由器上创建office100地址池 [AR1…

阅读更多...

Postman下载安装及简单入门

Postman下载安装及简单入门

一．Postman简介 Postman是一款API测试工具，可以帮助开发、测试人员发送HTTP请求，与各种API进行交互，并分析响应二．下载与安装访问Postman官网（https://www.postman.com/），下载适…

阅读更多...

vulnhub靶场之loly靶机

vulnhub靶场之loly靶机

前言挑战攻克该靶机30分钟靶机：loly靶机，IP地址为192.168.10.11 攻击：kali，IP地址为192.168.10.6 靶机和攻击机都采用VMware虚拟机，都采用桥接网卡模式文章涉及的靶机及工具，都可以自行访问官网或者项…

阅读更多...

LLM论文笔记 25: Chain-of-Thought Reasoning without Prompting

LLM论文笔记 25: Chain-of-Thought Reasoning without Prompting

Arxiv日期：2024.5.31机构：Google DeepMind 关键词 cot-decoding推理路径pretrain 核心结论 1. LLMs 不需要prompting就可以生成链式推理路径，prompting只是将这些能力显性化的一种手段 2. cot path 往往与更高的model confidence相关&…

阅读更多...

新型XCSSET恶意软件利用增强混淆技术攻击macOS用户

新型XCSSET恶意软件利用增强混淆技术攻击macOS用户

微软威胁情报团队发现了一种新型的XCSSET变种，这是一种复杂的模块化macOS恶意软件，能够感染Xcode项目，并在开发者构建这些项目时执行。这是自2022年以来的首个已知XCSSET变种，采用了增强的混淆方法、更新的持久化机制以及新的感…

阅读更多...

C++初阶——类和对象（三）构造函数、析构函数

C++初阶——类和对象（三）构造函数、析构函数

C初阶——类和对象（三） 上期内容，我们围绕类对象模型的大小计算，成员存储方式，this指针，以及C实现栈和C语言的比较，进一步认识了C的封装特性。本期内容，我们开始介绍类的默认成员函…

阅读更多...

【Function】使用托管身份调用Function App触发器，以增强安全性

【Function】使用托管身份调用Function App触发器，以增强安全性

推荐超级课程：本地离线DeepSeek AI方案部署实战教程【完全版】Docker快速入门到精通Kubernetes入门到大师通关课AWS云服务快速入门实战目录 1. 背景介绍2. 设置3. 使用Web应用调用Function App触发器（Node.js示例）4. 执行结果此方法允许您使用托管身份(Managed Identity)调…

阅读更多...

推荐文章

最新文章