数据分析基础之《numpy（6）—IO操作与数据处理》

数据分析基础之《numpy（6）—IO操作与数据处理》

news2026/2/11 2:23:01

了解即可，用panads

一、numpy读取

1、问题
大多数数据并不是我们自己构造的，而是存在文件当中，需要我们用工具获取
但是numpy其实并不适合用来读取和处理数据，因此我们这里了解相关API，以及numpy不方便的地方即可

2、np.genfromtxt(fname, dtype, comments, delimiter, ...)
说明：
fname：文件名，也可以是字符串、列表、StringIO对象、迭代器等，如果是文件名是 '.gz' or '.bz2'，还可以自动解压处理
dtype：指定数据类型（不同类型需要指定）
delimiter：分隔符（比如一般使用","）

3、例子

id,value1,value2,value3
1,123,1.4,23
2,110,,10
3,,2.1,19

# numpy读取
data = np.genfromtxt(fname="test.csv", delimiter=",")

data

但是有问题，第一行字符串没有读出来
numpy是运算工具，所以不支持读取字符串

二、如何处理缺失值

1、什么是缺失值
什么时候numpy中会出现nan：当我们读取本地的文件为float的时候，如果为空，就会出现nan。或者读取字符串也会出现nan

2、缺失值处理
那么，在一组数据中单纯的把nan替换为0，合适吗？会带来什么样的影响？
比如，全部替换为0后，替换之前的平均值如果大于0，替换之后的均值肯定会变小，所以更一般的方式是把缺失的数值替换为均值（或中值）或者直接删除有缺失值的一行

3、替换/插补法
求这一列的平均值或者中位数
也很麻烦，用pandas

4、如何删除有缺失值的那一行（列）
在pandas中介绍

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1362756.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Rockchip平台双屏异显功能实现(基于Android13)

Rockchip平台双屏异显功能实现(基于Android13)

Rockchip平台双屏异显功能实现(基于Android13) 1. 异显实现方案 Rockchip SDK平台支持两种不同的异显方案：Android Presentation和Android Activity指定屏幕启动。使用Android Presentation方案，需要在APP开发中调用相应接口以使指定视图&#xff08…

阅读更多...

ATTCK视角下的信息收集：主机发现

ATTCK视角下的信息收集：主机发现

目录 1、利用协议主动探测主机存活利用ICMP发现主机利用ARP发现主机利用NetBIOS协议发现主机利用TCP/UDP发现主机利用DNS协议发现主机利用PRC协议发现主机程序 2、被动主机存活检测利用Browser主机探测存活主机利用ip段探测主机存活利用net命令探测主机存活…

阅读更多...

论文笔记 Understanding Electricity-Theft Behavior via Multi-Source Data

论文笔记 Understanding Electricity-Theft Behavior via Multi-Source Data

WWW 2020 oral 1 INTRO 1.1 背景 1.1.1 窃电窃电（electricity theft）指用户为了逃避电费而进行非法操作的一种行为常用的反窃电方法可分为两类： 基于硬件驱动的反窃电方法电表开盖检测、集中器检测。。。。硬件驱动的…

阅读更多...

18.标题统计

18.标题统计

题目 import java.util.Scanner;public class Main {public static void main(String[] args) {Scanner sc new Scanner(System.in);String str sc.nextLine();int res 0;for(int i0;i<str.length();i) {char c str.charAt(i);if(c! && c!\n) {res;}}System.o…

阅读更多...

Simply主题简约风格的Emlog博客模板响应式布局

Simply主题简约风格的Emlog博客模板响应式布局

主题介绍 Simply是一款简约风格的Emlog博客模板，响应式布局、界面简单大方，实用性强！ 支持夜间模式，采用localStorage存储配置。IOS系统下支持随系统自动切换浅/深色模式。文章页支持显示文章字数及阅读时间。支持http/https …

阅读更多...

$MCS-51单片机的基本结构$

MCS-51单片机的基本结构

目录一.单片机的逻辑结构 1.单片机的基本结构 2.引脚 3.中断系统 4.时钟电路 5.时序 6.典型指令的取指、执行时序 7.80C51中定时器/计数器二.单片机的复位三.程序的执行方式 1.单步执行方式 2.低功耗操作方式 3.EPROM编程和校验方式首先补充一个知识点&#x…

阅读更多...

JVM工作原理与实战(八)：类加载器的分类

JVM工作原理与实战(八)：类加载器的分类

专栏导航 JVM工作原理与实战 RabbitMQ入门指南从零开始了解大数据目录专栏导航前言一、类加载器介绍二、类加载器的分类 1.Java代码实现的类加载器 2.Java虚拟机底层源码实现的类加载器 3.默认的类加载器层次（JDK8及之前的版本） 总结前言…

阅读更多...

听GPT 讲Rust源代码--compiler(15)

听GPT 讲Rust源代码--compiler(15)

File: rust/compiler/rustc_arena/src/lib.rs 在Rust源代码中，rustc_arena/src/lib.rs文件定义了TypedArena，ArenaChunk，DroplessArena和Arena结构体，以及一些与内存分配和容器操作相关的函数。 cold_path<F: FnOnce,drop,new,…

阅读更多...

PHP在线sqlite转html表格小功能(sqlite2html)

PHP在线sqlite转html表格小功能(sqlite2html)

6KB PHP实现在线sqlite转html表格小功能(支持大文件上传,得到一表一文件) 可自定义：上传限制大小；支持后缀格式!下载格式位压缩包，内含一表一个html文件。作用：程序员实用工具，上传sqlite数据得到html表格数据供本地…

阅读更多...

主流大语言模型从预训练到微调的技术原理

主流大语言模型从预训练到微调的技术原理

引言本文设计的内容主要包含以下几个方面： 比较 LLaMA、ChatGLM、Falcon 等大语言模型的细节：tokenizer、位置编码、Layer Normalization、激活函数等。大语言模型的分布式训练技术：数据并行、张量模型并行、流水线并行、3D 并行、零冗余优…

阅读更多...

迁移数据mysql到clickhouse

迁移数据mysql到clickhouse

场景： 项目上需要将mysql表中数据迁移到clickhouse。理论： 借助MaterializeMySQL 说明： 首先该方案实施需要启动mysql的binlog配置否则同步不了，尽管MaterializeMySQL官方说是在实验阶段，不应该在生产上使用&#x…

阅读更多...

【详解】静态库和动态库的认识和使用【Linux】

【详解】静态库和动态库的认识和使用【Linux】

静态库和动态库的认识和使用静态库和动态库的概述动静态库的实现静态库动态库库文件名称和引入库的名称静态库和动态库的概述静态库（.a）：程序在编译链接的时候把库的代码链接到可执行文件中。程序运行的时候将不再需要静态库动态库&#…

阅读更多...

【InternLM】书生-浦语大模型demo搭建服务接口部署本地映射

【InternLM】书生-浦语大模型demo搭建服务接口部署本地映射

目录前言一、InternLM大模型介绍1-1、大模型简介1-2、InternLM大模型简介1-2-1、InternLM-7B1-2-2、InternLM-20B 二、从0开始搭建InternLM-Chat-7B 智能对话 Demo2-0、环境搭建2-1、创建虚拟环境2-2、导入所需要的包2-3、模型下载2-4、代码克隆2-5、终端运行三、服务器接口部…

阅读更多...

uniapp微信小程序投票系统实战 (SpringBoot2+vue3.2+element plus ) -后端鉴权拦截器实现

锋哥原创的uniapp微信小程序投票系统实战： uniapp微信小程序投票系统实战课程 (SpringBoot2vue3.2element plus ) ( 火爆连载更新中... )_哔哩哔哩_bilibiliuniapp微信小程序投票系统实战课程 (SpringBoot2vue3.2element plus ) ( 火爆连载更新中... )共计21条视频…

阅读更多...

C# 自定义配置文件序列化生成+文件格式错误自动回档

C# 自定义配置文件序列化生成+文件格式错误自动回档

文章目录前言选择Xml简单的Xml使用测试用例简单的写简单的读简单的生成配置修改配置类测试用例运行结果对比代码逻辑封装逻辑示意封装好的代码测试生成配置文件格式错误测试使用默认值覆盖来解决问题配置文件人为修改错误如何解决解决方案代码测试用例运行结果代码封装总结…

阅读更多...

Linux系统使用超详细(八)~磁盘管理

Linux系统使用超详细(八)~磁盘管理

目录一、认识磁盘二、磁盘运行机制三、磁盘检查 3.1查找设备名称和分区号 3.1.1使用lsblk命令： 3.1.2使用fdisk命令： 3.1.3使用blkid命令： 3.2检查方向 3.2.1文件系统完整性： 3.2.2磁盘健康状态： 3.2.3磁…

阅读更多...

C#，深度优先搜索（DFS）、广度优先搜索（BFS）算法的源代码与数据可视化

C#，深度优先搜索（DFS）、广度优先搜索（BFS）算法的源代码与数据可视化

概述下载源代码： 链接：https://pan.baidu.com/s/1sLxMT78LVg2dWyXXFvM--w?pwd2kwl 提取码：2kwl --来自百度网盘超级会员V5的分享https://pan.baidu.com/s/1sLxMT78LVg2dWyXXFvM--w?pwd2kwl 深度优先搜索（亦称深度优先遍历&a…

阅读更多...

uniapp选择android非图片文件的方案踩坑记录

uniapp选择android非图片文件的方案踩坑记录

这个简单的问题我遇到下面6大坑，原始需求是选择app如android的excel然后读取到页面并上传表格数据json 先看看效果 uniapp 选择app excel文件读取 1.uniapp自带不支持 uniapp选择图片和视频非常方便自带已经支持可以直接上传和读取但是选择word excel的时候就出现…

阅读更多...

红外传感器(含代码注释）

红外传感器(含代码注释）

一.引言红外传感器是一种能够检测和测量红外光的传感器。由于红外光的特性，红外传感器在许多领域中得到了广泛的应用，如军事、航空航天、医疗、环保、工业控制等。本文将详细介绍红外传感器的原理、应用以及未来发展趋势。二.红外传感器的工作原理红外…

阅读更多...

Vue3-41-组件- 动态组件 component 标签和 is 属性的使用

Vue3-41-组件- 动态组件 component 标签和 is 属性的使用

说明 <component> 标签有一个 is 属性， 可以给这个 is属性赋值为一个组件对象， 这样这个<component> 标签就可以渲染指定的组件对象了。使用案例本案例中会准备两个简单的组件， 在 App.vue 中导入这两个组件，并…

阅读更多...

推荐文章

最新文章