Python实现逻辑回归与判别分析--西瓜数据集

news2025/2/27 1:43:00

数据

        数据data内容如下:

d0a9f3f077fe4c0898f86fb88604636a.png

        读取数据:

import numpy as np
import pandas as pd
data = pd.read_excel('D:/files/data.xlsx')

        将汉字转化为01变量:

label = []
for i in data['好瓜']:
    l = np.where(i == '是',1,0)
    label.append(int(l))
data['label'] = label

        区分数据集,70%训练集和30%测试集:

from sklearn.model_selection import train_test_split
data_train,data_test = train_test_split(data,test_size=0.3,random_state=0)  # random_state是为了保留种子,保证每次跑出来的数都一样
trainx,trainy = data_train[['密度','含糖率']],data_train['label']
testx, testy = data_test[['密度','含糖率']],data_test['label']

逻辑回归

        逻辑回归主要解决二分类问题,通常称为正向类和负向类(1/0),被解释变量使用逻辑函数(又被称为Sigmoid函数)建模,形成一个特征变量的线性组合函数,逻辑函数总是返回一个0~1之间的概率值,如果该概率等于或大于一个用来区分的阈值(通常是0.5),则被预测为正向类,否则被预测为负向类。逻辑回归(也称对率回归)代码如下:

from sklearn.linear_model import LogisticRegression
model = LogisticRegression()  
model.fit(trainx,trainy)
model.predict(testx)
model.score(testx,testy)   #预测准确度

判别分析

        判别分析就是一种分类方法,即判断样本所属类别的一种统计方法,判别分析是在已知研究对象分成若干类并已取得各类的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类的方法。判别分析代码实现如下:

#线性判别分析
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
model = LinearDiscriminantAnalysis()
model.fit(trainx,trainy)
model.score(testx,testy)   #预测准确度

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1823648.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

南师大GIS专业2024排名NO.1!!!

南师大GIS 666 学科专业实力666,研究方向多多多! 有学术方向有开发应用方向, 有GIS(建模、数字地形、基础理论和三维GIS等)、 有Cartography (叙事地图、动态地图、地图风格迁移等&#…

线性规划问题——单纯形算法

第一步:化“约束标准型” 在每个等式约束中至少有一个变量的系数为正,且这个变量只在该约束中出现。在每个约束方程中选择一个这样的变量称为基本变量。 剩下变量称为非基本变量。 一个简单的栗子 上图是一个约束标准型线性规划的例子。 等式1&#x…

【总线】AMBA总线架构的发展历程

目录 引言 发展历程 第一代AMBA(AMBA 1) 第二代AMBA(AMBA 2) 第三代AMBA(AMBA 3) 第四代AMBA(AMBA 4) 第五代AMBA(AMBA 5) AMBA协议简介 ASB&#x…

Capto2024软件怎么下载安装? 【详细安装图文教程】

Capto 2024是一款专为Mac用户设计的屏幕录制编辑软件。无论是想要制作教育视频、工作演示、游戏录制,还是进行简单的屏幕捕捉,Capto 2024都能满足您的需求。接下来,我将详细介绍其主要功能、特点以及使用场景,并为您评价这款软件。…

linux执行ifconfig命令ens33没有显示ip地址解决方法

1.右键启动VMware DHCP和NAT这两个服务 2.执行reboot命令,重启linux。然后再执行ifconfig命令,可以看到inet了,就是ip。xshell也可以连接到主机了。

为什么说这个方向,是网工人最大的机会

号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部 下午好,我的网工朋友 都说各行各业早就没有了什么黄金时机,IT行业被称为含金量最高的行业之一,也难逃降薪裁员…

C++ static关键字详解

背景 前段时间初步整理了C中static的相关知识点,以此做个记录。 在C中,static关键字是常见的修饰符。从大方向上static分为两类: 1.类或结构体外的static 2.类或结构体内的static 因此,本文内容的划分如下: 接下来会…

supOS工业操作系统的由来

作为“世界制造工厂”,我国拥有最庞大、最完整的工业企业集群与产业链,其中既有众多全球性制造巨头,又有数以百万计的中小型工厂。但这些企业的制造工厂在推进数字化、网络化、智能化进程时普遍受阻:1)系统软件定制程度…

mybatis之特殊SQL的执行

1.1模糊查询 尝试&#xff1a; //模糊查询用户 List<User> getUserByLike(Param("mohu") String mohu);<select id"getUserByLike" resultType"user">select * from user where username like %#{mohu}% </select>Test publ…

本地密码记录工具-KeePass

文章目录 软件界面软件下载KeePass配置KeePass修改中文创建数据库配置数据库锁定配置账户密码为不同应用配置账号密码插件安装及使用 数据库同步 在此之前&#xff0c;没有使用过类似的账户密码记录工具&#xff0c;甚至完全没有接触过&#xff0c;由于Edge浏览器自带保存密码并…

视频监控汇聚平台:系统日志介绍及在运维中的实际应用

目录 一、系统日志的重要性 &#xff08;一&#xff09;安全保障 &#xff08;二&#xff09;故障排查 &#xff08;三&#xff09;运营管理 &#xff08;四&#xff09;事件回溯与分析 二、产品说明 &#xff08;一&#xff09;产品介绍 &#xff08;二&#xff09;接…

把纸质文件扫描成word电子版的3种方法!

在数字化日益盛行的今天&#xff0c;纸质文件转化为电子版的需求愈发强烈。不论是出于环保的考虑&#xff0c;还是为了提高工作效率&#xff0c;将纸质文件扫描成Word电子版都是一项必备技能。那么&#xff0c;如何将纸质文件轻松转化为Word电子版呢&#xff1f;本文将为您揭秘…

【Windows10】查看WIFI密码

操作步骤 电脑上查看已连接Wi-Fi的密码的步骤如下: 连接需要查看密码的Wi-Fi。右键点击任务栏上的 [网络] 图标&#xff0c;选择 [开启"网络和Internet"设置]。在 高级网络设置 项目中&#xff0c;点选 [网络和共享中心]。开启网络和共享中心的窗口后&#xff0c;点…

One能聊天接入百度千帆大模型 —— 文心一言

One能聊天介绍&#xff1a;基于ChatGPT实现的微信小程序&#xff0c;适配H5和WEB端。包含前后端&#xff0c;支持打字效果输出流式输出&#xff0c;支持AI聊天次数限制&#xff0c;支持分享增加次数等功能One能聊天开源地址&#xff1a;https://github.com/oldinaction/ChatGPT…

【算法专题--链表】相交链表--高频面试题(图文详解,小白一看就会!!)

目录 一、前言 二、题目描述 三、解题方法 ⭐双指针 --- 数学思维 ⭐双指针 --- 按链表长度计算 &#x1f95d; 判断相交 &#x1f347; 求出交点 &#x1f34d;实现步骤 四、总结与提炼 五、共勉 一、前言 相交链表这道题&#xff0c;可以说是--链表专题--&#xf…

docker-compose部署FastDFS分布式文件系统

文章目录 一、技术选型二、fastDFS组成部分三、docker-compose文件四、客户端nginx配置五、存储器spring Boot集成参考文献 一、技术选型 还有一个更好的google FS&#xff08;但是他不开源&#xff0c;我也没找到社区版一类的可以不要钱使用的&#xff09;。 最后考虑到我们存…

通信设备的网卡

一、网卡的作用 将计算机或者路由器连接到传输介质上的接口&#xff0c;传输介质可以是有线也可以是无线的。 &#xff08;1&#xff09;计算机的网卡 现在的计算机大多有两个网卡&#xff0c;一个是有线网卡一个无线网卡&#xff0c;比如以我们的台式电脑为例 台式电脑千兆网…

推进现代化的财务计划,打造可持续的企业发展

现阶段一个重大问题是&#xff0c;大多数企业无法保持决策与规划水平的一致性&#xff0c;财务团队的现状难以支持复杂环境下的新型决策&#xff0c;从而造成了劳动力和资源的错误匹配。由于财务功能的过度扩展&#xff0c;企业难以持续发展。财务团队不得不为了企业的存亡不断…

【代码】数据类型之复合数据类型

Hello&#xff01;大家好&#xff0c;我是学霸小羊&#xff0c;今天讲讲数据类型之复合数据类型。 上一个博客讲了讲基本数据类型&#xff0c;今天讲讲复合数据类型&#xff0c;没学过基本数据类型的建议先去学一学哈。 【代码】数据类型之基本数据类型https://blog.csdn.net…

AI论文速读 | 2024[SIGIR]基于大语言模型的下一个兴趣点推荐

论文标题&#xff1a;Large Language Models for Next Point-of-Interest Recommendation 作者&#xff1a;Peibo Li ; Maarten de Rijke ; Hao Xue &#xff08;薛昊&#xff09;; Shuang Ao ; Yang Song ; Flora D. Salim 机构&#xff1a;新南威尔士大学(UNSW)&#xff0c…