数据分析13——Pandas数据导出/日期数据处理/样本采样

news2024/11/18 1:47:25

Pandas数据导出

1、导出Excel:

  • 举例:
    • 代码:df.to_excel(‘./data/text_01.xlsx’, sheet_name=‘订单明细’, index=False)
    • 解释:将df数据导入到相对路径为’./data/text_01.xlsx’的文件中,其中数据表名称为’订单明细’,去除之前的索引

2、导出CSV:

  • 举例:
    • 代码:df.to_csv(‘export_02.csv’, encoding=‘utf_8_sig’, index=False)
    • 解释:类似上面的导出excel

3、导出Txt:

  • 举例:
    • 代码:df.to_csv(‘export_03.txt’, sep=‘\t’, encoding=‘utf_8_sig’, index=False)
    • 解释:类似上面的导出excel,sep='\t’表示用制表符分隔数据,encoding='utf_8_sig’表示编码格式

4、导出Json:

  • 举例:
    • 代码:df.to_json(‘export_04.json’, orient=‘split’, force_ascii=False)
    • 解释:类似上面的导出excel,orient是json中存放数据的形式有很多{‘split’, ‘records’, ‘index’, ‘columns’, ‘values’, ‘table’},force_ascii设置为False,则force_ascii编码就会失效,否则默认force_ascii编码的话,中文就会被加密,显示不出来。

4、导出到数据库:

  • 说明:本质就是模拟了一个sql添加表的过程
  • 注意:要导入到数据库中要保证有对应的两个python库,没有的话在对应环境中执行下面语句装一下:
    • pip install sqlalchemy
    • pip install pymysql
  • 举例:
    在这里插入图片描述


日期数据处理

1、日期解析

  • 日期解析举例:
    在这里插入图片描述

  • 日期组合举例:
    在这里插入图片描述

  • 提取日期举例:注意dt表示时间类型,类似于字符串的str,在dt中集合了时间处理的相关方法
    在这里插入图片描述

  • 日期切片:
    在这里插入图片描述

  • 重采样举例:

    • 说明:重采样相当于按照日期分组聚合,重采样的前提是把日期对应的列先设为索引
    • 按年统计:
      在这里插入图片描述
    • 按季度统计:
      在这里插入图片描述
    • 按月统计:
      在这里插入图片描述
  • OHLC函数:一般股市用的比较多
    在这里插入图片描述



样本采样

1、sample函数

tb = pd.DataFrame(
    data=[['貂蝉', 4],
          ['西施', 3],
          ['王昭君', 2],
          ['杨玉环', 1]],
    columns=['贵妃', '权重'])
# n:抽样数量
# frac:抽样比例,如果设置抽样比例就不用设置n,抽样比例为0.5,表示从所有样本中抽出1/2
# replace:是否重复抽样,默认否
# weights:抽样权重,选取数据中某一列作为抽样权重,权重大的抽样概率高
# random_state:随机种子
# axis:指定轴,一半不设定,就按照默认的抽行数据

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/548425.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【算法】单源最短路径算法——Dijkstra算法

文章目录 一、简介与使用场景二、算法思想三、朴素版Dijkstra四、堆优化版Dijkstra五、总结 一、简介与使用场景 迪杰斯特拉算法(Dijkstra)是由荷兰计算机科学家狄克斯特拉于1959 年提出的,因此又叫狄克斯特拉算法。这是从一个顶点到其余各顶点的最短路径算法&#…

STM32 使用SYN6288语音模块

文章目录 前言一、SYN6288介绍二、SYN6288原理讲解三.数据的异或校验四.代码编写1.串口的初始化2.SYN6288代码编写3.main函数逻辑 总结 前言 本篇文章带大家学习一下SYN6288语音模块,这个模块可以用于车载设备,语音电子书等众多产品当中,而且…

Android 创建线程源码分析 JavaThreadNativeThread

前言 本文分析在Android中创建线程时候的源码分析,即JavaThread和NativeThread。 java/lang/Thread.java art/runtime/native/java_lang_Thread.cc art/runtime/thread.cc 两种Java Thread 有两种可以运行Java代码的线程。有两种情况: 通过new Thread创建的java线程在Nati…

若依分离版——IDEA开发SpringBoot的webservice接口

一.webservice介绍 WebService是帮助多个应用程序与平台和编程语言之间以独立的方式互相通信的标准化技术。它是利用标准 XML messaging(主要 SOAP) 技术,可以访问网络上的其他计算机的记述多种操作的软件接口。此接口主要由 WSDL (WebService Description Language…

WPF 未能加载文件或程序集 System.Windows.Interactivity

先说一下原因,这是因为微软抛弃了Interactivity导致。 NuGet下载Behaviors.Wpf 在xaml界面替换掉有Interactivity那一行,替换为: xmlns:i“http://schemas.microsoft.com/xaml/behaviors”

OA管理痛点解决:从“硬编码”到“低代码”

低代码开发平台是一种逐渐流行起来的软件开发方式,它可以以快速且简单的方式构建各种应用程序,从而帮助企业快速响应市场变化和满足不断变化的业务需求。在企业的日常管理工作中,OA系统是一种非常常见的应用程序,它可以帮助企业管…

外包五年,你知道这五年我怎么过的吗?

”五年,你知道我这五年怎么过的吗?“ 5年时间,我一路从外包到字节,说一句很俗的话, 现在的我真的要好好谢谢当初拼命努力的自己,要感谢跳出舒适圈的自己, 外包薪资真的不少,当初毕…

10几个类ChatGPT国内AI大模型【内附体验网址】

文章目录 前言1. AI文本工具站效率工具自媒体创作工具代码工具 2.道和顺ChatIC3.星期五4.文心一言5.讯飞星火认知大模型6.通义千问7.商汤-日日新8.Moss9.ChatGLM10. 360智脑写在最后 前言 随着ChatGPT迅速走红,国内各大企业纷纷发力认知大模型领域。经过一段时间的酝酿&#x…

微前端子应用间通信和数据共享

前面讲到了微前端的应用:(94条消息) 微前端应用(qiankunumiantd)_他夏了夏天吖的博客-CSDN博客https://blog.csdn.net/zh0623/article/details/130615234?spm1001.2014.3001.5501今天讲一下不同子应用的通信和数据共享问题 微前端不同子应用之间可能需要进行通信和数据共享,假…

深度学习中,batch大小对模型的效果有影响吗?

内容来自李宏毅-2021机器学习 ##先说结论:同一个模型,大batch结果往往会较差。 上图中,横轴代表batch size,从左到右越来越大;纵轴代表准确率acc,越往上正确率越来越高。 在观察validation上的结果时&…

【数据结构与算法】基础数据结构

文章目录 数组概述动态数组二维数组局部性原理越界检查 链表概述单向链表单向链表(带哨兵)双向链表(带哨兵)环形链表(带哨兵) 队列概述链表实现环形数组实现 栈概述链表实现数组实现应用 双端队列概述链表实…

Android内部存储与外部存储(私有目录与公共目录)图文详解

目录 一、存储空间概述 二、存储空间的划分 1、存储划分 2、内部存储 2.1 内部存储概述 2.2 内部存储 - 私有目录 3. 外部存储 3.1 外部存储概述 3.2 外部存储 - 私有目录 3.3 外部存储 - 公共目录 三、内部存储与外部存储比较 1、横向对比 2、目录结构 3、存储分…

English Learning - L3 作业打卡 Lesson3 Day15 2023.5.19 周五

English Learning - L3 作业打卡 Lesson3 Day15 2023.5.19 周五 引言🍉句1: We present more expressions about food.成分划分连读爆破语调 🍉句2: They are from Elenir Scardueli, a listener in Brazil.成分划分弱读连读语调 🍉句3: My m…

plsql为什么连不上远程或本地的Oracle,需要做哪些准备?

文件配置解说 tnsnames.ora文件 文件所在地址:ORACLE_HOME\network\admin ORACLE_HOME:Oracle数据库或者客户端软件所在的地址 但是我的在Oracle数据库的目录下,而不是Oracle客户端软件(instantclient_11_2)下 里…

分布式架构设计及理论指导

目录 核心概念分布式分布式SOA架构微服务架构微服务技术对比 服务拆分拆分思想和原则创建父类工程创建子工程 远程调用方式引入RestTemplate CAP/BASE理论CAP理论分区容错 (Partition-tolerance)一致性(Consistency)可用性&#x…

【C++】继承/虚拟继承/菱形虚拟继承

继承 继承的概念继承体系中对象赋值转换继承方式对继承后的访问限定(重定义-同名隐藏)继承体系中派生类的默认成员函数友元函数、静态成员在继承中的特点菱形继承和菱形虚拟继承 继承的概念 为了让代码可以复用,当前类可以继承其他类的成员变…

阿里云OSS存储空间绑定自定义域名,浏览器通过自定义域名预览文件

阿里云官方文档: 如何绑定自定义域名_对象存储-阿里云帮助中心 华东1(杭州)地域创建了名为monkey的存储空间 Bucket:monkey Endpoint:oss-cn-hangzhou.aliyuncs.com 上传文件默认域名的url: https://monkey.oss-cn-han…

微信小程序nodejs+vue课程推荐报名学习分享平台uniapp

本文以实际运用为开发背景,运用软件工程原理和开发方法, 整个开发过程首先对课程分享平台进行需求分析,得出课程分享平台主要功能。接着对课程分享平台 进行总体设计和详细设计。总体设计主要包括小程序功能设计、小程序总体结构设计、小程序…

Python数据可视化小结

1. 引言 原始形式的数据对大多数人来说可能都是枯燥乏味的,但是如果掌握正确的可视化工具,给人的印象就会变得引人入胜。本文通过实际例子,让我们利用数据可视化工具来探索不一样的数据体验。 闲话少说,我们直接开始吧&#xff…

推荐3款超好用的海报设计软件!

在现代社会,海报设计已经成为了一种非常重要的视觉传达方式。如果你需要制作一个引人注目的海报,但却没有设计师的技能和经验,那么在线海报设计图片软件就是你的最佳选择。下面我们将介绍 5 款最受欢迎的在线海报设计图片软件,它们…