二、机器学习基础知识:Python数据处理基础

news2024/11/27 0:40:10

文章目录

  • 1、基本数据类型
    • 1.1 数字类型(Number)
    • 1.2 字符串类型(String)
    • 1.3 列表类型(List)
    • 1.4 元组类型(Tuple)
    • 1.5 字典类型(Dictionary)
    • 1.6 集合类型(Set)
  • 2、数据文件读写
    • 2.1 打开与关闭文件
    • 2.2 读取文件内容
    • 2.3 将数据写入文件

1、基本数据类型

在Python3的环境中,提供了6种基本的内置数据类型,包括数字类型(Number)、字符串类型(String)、列表类型(List)、元组类型(Tuple)、字典类型(Dictionary)以及集合类型(Set)。根据数据对象是否可变,又将它们划分为可变数据类型和不可变数据类型。
可变数据类型包括列表、字典和集合,它们在声明时会开辟一块内存空间,使用Python的内置方法对内存中的数据进行修改时,内存地址不发生变化。
不可变数据类型包括数字、字符串和元组,它们在声明时也会开辟一块内存空间,但不能改变这块内存内的数据,如果改变了变量的赋值,就会重新开辟一块内存空间。

1.1 数字类型(Number)

Python的数字类型包括int、float、bool和complex复数类型。当指定一个值时,就创建了一个数字类型的对象。
在这里插入图片描述

在上图实例中,使用id函数可以看到在变量a加1之后,内存地址已经发生了改变,说明a=a+1不是原有的int对象加1,而是重新创建了一个int对象,大小为a+1。
详细参考:Python程序设计基础:数值

1.2 字符串类型(String)

Python中的字符串用半角的单引号或双引号括起来,对于字符串内的特殊字符,使用反斜杠‘\’进行转义,若要获取字符串中的一部分,可以采用切片的方式,截取格式如下:

字符串变量[头下标:尾下标]

字符串的起始下标为0,正序或逆序读取均可。
字符串的赋值与访问:
在这里插入图片描述

详细参考:Python程序设计基础:字符串

1.3 列表类型(List)

列表使用方括号[]进行定义,数据项之间使用逗号分隔,数据项可以是数字、字符串或列表。
列表也是一种Python序列,其截取语法与字符串类似,格式如下:

列表变量[头下标:尾下标]

同样,列表的起始下标为0,正序或逆序读取均可。
列表的访问、修改与遍历:
在这里插入图片描述

详细参考:Python程序设计基础:列表与元组(一)

1.4 元组类型(Tuple)

元组写在小括号()中,元素之间使用逗号进行分割,元素可以具有不同的类型,它与列表相似,但是元组的元素不可修改。
元组的截取语法和字符串、列表类似,起始下标为0,正序或逆序读取均可。
元组的访问:
在这里插入图片描述

详细参考:Python程序设计基础:列表与元组(二)

1.5 字典类型(Dictionary)

字典是一种可变容器模型,可存储任意类型对象,使用大括号{}定义,格式如下:

字典名={:}

字典的键和值使用冒号分隔,每个键值对之间使用逗号分隔。键一般是唯一的,如果出现了重复,则后面的键值对会替换前面的键值对。值的数据及类型不限,可以是字符串、数字或元组。
字典的访问及修改:
在这里插入图片描述

详细参考:Python程序设计基础:字典与集合(一)

1.6 集合类型(Set)

集合是一列无序的、不重复的数据项组成,Python中的集合是可变类型。与数学中的集合概念相同,集合中每个元素都是唯一的。同时,集合不设置顺序,每次输出时元素的排序可能都不相同。
集合使用大括号表示,形式上和字典相同,但数据项不是成对的。
由于集合和字典一样都是使用大括号表示,因为在创建空集合时,必须使用set()函数进行创建。
集合的主要操作:
在这里插入图片描述

详细参考:Python程序设计基础:字典与集合(二)

2、数据文件读写

机器学习的本质是对数据进行处理,如果数据是少量的、临时的,可以使用上述数据类型变量进行存储,如果数据是大量的,则需要使用到数据文件。

2.1 打开与关闭文件

Python中打开文件的内置函数是open()函数,打开文件后会创建一个文件对象,对文件的访问都是通过这个文件对象进行,语法格式如下:

open(file_name[,access_mode][,buffering])

其中file_name为字符串类型,是要访问的文件名称;access_mode是文件的打开模式,如读取、写入或追加等,默认为r(只读模式),写数据通常使用的是w和a,表示改写和添加;buffering表示文件缓冲区的策略,当该值为0时,表示不使用缓冲区。
打开文件之后可以向文件中写入相关内容,使用write()方法,参数为要写入的字符串。
在文件操作结束后,需要关闭文件对象,释放缓存,需要使用文件对象的close()方法。
文件的打开、写入与关闭:

filename = '1.txt'
f=open(filename,'a') #打开1.txt文件并进行写操作
f.write("machine learning")
f.close

使用with语句可以调用f.close()方法就能自动关闭文件。

filename = '1.txt'
with open('1.txt','a') as f:
    f.write("machine learning")

2.2 读取文件内容

常见的读取文件方法主要有三种,包括read()、readline()、readlines()。
read():默认读取整个文件,若设置了参数字节数,则读取对应字节数,返回值为字符串。
readline():从当前位置开始,读取文件中的一行,返回值为字符串。
readlines():从当前位置开始,读取文件的所有行,返回值为列表,每行为列表的一项。
使用read()读取整个文件:
在这里插入图片描述

使用readline()逐行读取文件:
在这里插入图片描述

使用readlines()一次读取多行:
在这里插入图片描述

2.3 将数据写入文件

如果要将数据写入文件,打开方式需要选择w(写入)或者a(追加)模式,写入文件可以使用Python提供的write方法,其语法格式如下:

fileobject.write(byte)

其中byte为待写入文件的字符串或字节。
文件的写入与追加:

with open('1.txt','w') as f:
    f.write("machine learning.\n") #写入相关内容,清空原文件
filename = '1.txt'
with open('1.txt','a') as f:
    f.write("python learning.\n") #追加写入相关内容,不覆盖原数据

详细参考:Python程序设计基础:文件操作

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1056184.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

力扣 -- 494. 目标和(01背包问题)

参考代码&#xff1a; 未优化的代码&#xff1a; class Solution { public:int findTargetSumWays(vector<int>& nums, int target) {int nnums.size();int sum0;for(const auto& e:nums){sume;}//aimbsum//aim-btarget//aim(sumtarget)/2int aim(sumtarget)/2…

利用EasyX绘制国旗

所谓国庆&#xff0c;举国同庆 今天我就来分享一下利用图形库来制作一个比例版缩小的五星红旗&#xff08;尽量精确了&#xff09; 需要利用到前边的知识note2基本图形的绘制 进入正题 五星红旗的长和高之比为三比二 创建一个长为960像素&#xff0c;宽为640像素的窗体 更…

【1++的Linux】之进程(五)

&#x1f44d;作者主页&#xff1a;进击的1 &#x1f929; 专栏链接&#xff1a;【1的Linux】 文章目录 一&#xff0c;什么是进程替换二&#xff0c;替换函数三&#xff0c;实现我们自己的shell 一&#xff0c;什么是进程替换 我们创建出来进程是要其做事情的&#xff0c;它可…

用类继承计算长方体体积

编写ClassA收集长、宽、高键盘输入&#xff0c;编写ClassB继承ClassA并拟方法计算长方体体积。 (本笔记适合正在研习Class类的 coder 翻阅) 【学习的细节是欢悦的历程】 Python 官网&#xff1a;https://www.python.org/ Free&#xff1a;大咖免费“圣经”教程《 python 完全自…

入门运维之MySQL管理

一、系统数据库 Mysql数据库安装完成后,自带了以下四个数据库,具体作用如下: 1.1常用工具 1.1.1 mysql 该mysql不是指mysql服务,而是指mysql的客户端工具。 语法 :mysql [options] [database] 选项 :-u, --user=name #指定用户名-p, --password[=name] #指定密码-h,…

mfc140u.dll是什么文件?mfc140u放在哪个文件夹?详细修复教程

今天我想和大家分享一个非常常见的问题——mfc140u.dll丢失的困扰以及解决方法。 首先&#xff0c;让我们来了解一下什么是mfc140u.dll。这是一个非常重要的动态链接库文件&#xff0c;它是Microsoft Foundation Class Library的一个组件。许多软件和游戏都需要这个文件的支持才…

品牌数字人IP如何从虚拟到现实快速出圈?

在数智化时代&#xff0c;数字人如何赋能品牌IP&#xff0c;为品牌挖掘出更多的增长机会&#xff1f;近日&#xff0c;纯甄馋酸奶官数字人“解小馋”以一支精致的CG视频正式亮相。 *图片源于网络 品牌数字人以CG动画可以让品牌形象更具象化&#xff0c;通过数字人三维动画的形…

前期开发用最内聚环境,最直观简单的方法管理代码

代码稍微一多我们就会思考代码如何去规划和管理&#xff0c;首先想到MVN等管理工具去帮助我们&#xff0c;结果配置了好长时间感觉不是很方便。首先因为没有系统去了解这个工具的使用方法&#xff0c;另外发现IDEA在原本松散的工具之间以插件的形式做了一定的配置&#xff0c;将…

【办公自动化】在Excel中按条件筛选数据并存入新的表(文末送书)

&#x1f935;‍♂️ 个人主页&#xff1a;艾派森的个人主页 ✍&#x1f3fb;作者简介&#xff1a;Python学习者 &#x1f40b; 希望大家多多支持&#xff0c;我们一起进步&#xff01;&#x1f604; 如果文章对你有帮助的话&#xff0c; 欢迎评论 &#x1f4ac;点赞&#x1f4…

Filter/过滤器基本使用

&#x1f600;前言 本篇博文是关于Filter/过滤器基本使用&#xff0c;希望你能够喜欢 &#x1f3e0;个人主页&#xff1a;晨犀主页 &#x1f9d1;个人简介&#xff1a;大家好&#xff0c;我是晨犀&#xff0c;希望我的文章可以帮助到大家&#xff0c;您的满意是我的动力&#x…

Scala第十五章节

Scala第十五章节 1. 递归 2. 案例一: 求阶乘 3. 案例二: 斐波那契数列 4. 案例三: 打印目录文件 scala总目录 文档资料下载

mybatis-关联关系一对多关联多对一关联多对多

目录 1. 准备 2. 一对多关联查询 2.1 创建Model 2.2 创建Mapper层 2.3 创建service层 2.4 创建测试类进行测试 3. 多对一关联关系 4. 多对多 1. 准备 通过脚本创建相关的数据表&#xff1a;一对多&#xff08;db1-n.txt&#xff09; 2. 一对多关联查询 2.1 创建Model…

Python无废话-基础知识列表list详讲

本文详细的介绍了在Python中如何处理list数据类型&#xff0c;涉及了Python 基础知识列表list 详讲&#xff0c;包含list 定义、遍历循环、元素获取、切片、添加、删除、查找元素&#xff0c;以后列表在函数、copy中使用。 列表List数据类型 列表特征 1) 列表中的各个元素&…

实现水平垂直居中的十种方式

本文节选自我的博客&#xff1a;实现水平垂直居中的十种方式 &#x1f496; 作者简介&#xff1a;大家好&#xff0c;我是MilesChen&#xff0c;偏前端的全栈开发者。&#x1f4dd; CSDN主页&#xff1a;爱吃糖的猫&#x1f525;&#x1f4e3; 我的博客&#xff1a;爱吃糖的猫&…

leetcode:2806. 取整购买后的账户余额(python3解法)

难度&#xff1a;简单 一开始&#xff0c;你的银行账户里有 100 块钱。 给你一个整数purchaseAmount &#xff0c;它表示你在一次购买中愿意支出的金额。 在一个商店里&#xff0c;你进行一次购买&#xff0c;实际支出的金额会向 最近 的 10 的 倍数 取整。换句话说&#xff0c…

网络工程师学习中但是发现这个岗位非常卷怎么办

大家好&#xff0c;我是网络工程师成长日记实验室的郑老师&#xff0c;您现在正在查看的是网络工程师成长日记专栏&#xff0c;记录网络工程师日常生活的点点滴滴 有个同学说&#xff0c;他说现在有很多培训机构搞的这个网络工程师也非常卷。他现在还没有入行&#xff0c;他现在…

Scala第十四章节

Scala第十四章节 1. 隐式转换和隐式参数介绍 2. 隐式转换 3. 隐式参数 4. 案例: 获取列表元素平均值 scala总目录 文档资料下载

计算机竞赛 深度学习疫情社交安全距离检测算法 - python opencv cnn

文章目录 0 前言1 课题背景2 实现效果3 相关技术3.1 YOLOV43.2 基于 DeepSort 算法的行人跟踪 4 最后 0 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; **基于深度学习疫情社交安全距离检测算法 ** 该项目较为新颖&#xff0c;适合作为竞赛…

神经网络中的知识蒸馏

多分类交叉熵损失函数&#xff1a;每个样本的标签已经给出&#xff0c;模型给出在三种动物上的预测概率。将全部样本都被正确预测的概率求得为0.70.50.1&#xff0c;也称为似然概率。优化的目标就是希望似然概率最大化。如果样本很多&#xff0c;概率不断连乘&#xff0c;就会造…

手把手教你用 Milvus 和 Towhee 搭建一个 AI 聊天机器人

作为向量数据库的佼佼者,Milvus 适用于各种需要借助高效和可扩展向量搜索功能的 AI 应用。 举个例子,如果想要搭建一个聊天机器人,Milvus 一定是其进行数据管理的首选。那么,如何让这个应用程序开发变得易于管理及更好理解,那就需要借助 Towhee(https://towhee.io/)了。…