【机器学习算法基础】(基础机器学习课程)-10-逻辑回归-笔记

news2025/1/24 22:39:28

一、模型的保存与加载

 

 

 

 

逻辑回归是一种常见的机器学习算法,广泛用于分类问题。为了在不同的时间或环境下使用训练好的模型,我们通常需要将其保存和加载。

保存模型

  1. 训练模型:首先,你需要用你的数据训练一个逻辑回归模型。例如,在Python中使用scikit-learn库,你可以这样做:

    from sklearn.linear_model import LogisticRegression 
    model = LogisticRegression() 
    ​​​​​​​model.fit(X_train, y_train)

  2. 保存模型:训练好模型后,你需要将其保存到一个文件中。这样你就不需要每次都重新训练模型。常用的方法是使用Python的pickle库或joblib库。以下是使用joblib库的示例:

    import joblib
    joblib.dump(model, 'logistic_regression_model.pkl')
    

    这里的'logistic_regression_model.pkl'是你保存模型的文件名。你可以选择任何合适的文件名和路径。

加载模型

  1. 加载模型:当你需要使用之前保存的模型时,可以将其从文件中加载回来。继续使用joblib库,加载模型的方法如下:

    model = joblib.load('logistic_regression_model.pkl')
    

    使用模型进行预测:加载模型后,你就可以直接使用它进行预测,而不需要重新训练模型。例如:

  2. 使用模型进行预测:加载模型后,你就可以直接使用它进行预测,而不需要重新训练模型。例如:
    predictions = model.predict(X_test)

总结

  • 为什么保存模型? 保存模型的主要目的是为了节省时间和计算资源。训练模型可能需要大量的数据和时间,而保存模型后可以在需要时直接加载和使用。
  • 保存模型的方法:常用的库包括pickle和joblib,joblib在处理大文件时效率更高。
  • 加载模型:加载模型非常简单,只需一行代码就可以将保存的模型加载回来,方便快速进行预测或分析。

实际应用场景

想象你是一个数据科学家,在一个项目中你花了几个小时甚至几天时间来训练一个逻辑回归模型,用于预测某些客户是否会购买你的产品。模型训练好了,你不希望每次运行预测时都重新训练模型,所以你会将其保存。当你需要在下个月或明年再次运行预测时,你只需要加载保存好的模型,而无需重新训练,大大节省了时间和资源。

这种方法不仅适用于逻辑回归模型,还适用于其他机器学习模型,如决策树、支持向量机和神经网络等。模型的保存与加载是机器学习工作流程中非常重要的一部分,可以提高效率和便利性。

二、逻辑回归定义,损失函数,优化与线性回归比较

 

 

 

 

 

 

 

 

 逻辑回归是一种用于分类问题的机器学习算法,尽管名字中有“回归”二字,但它实际上用于二分类或多分类任务。

 

小结

  • 逻辑回归用于分类问题,通过逻辑函数将线性模型的输出映射到概率值。
  • 损失函数为对数损失函数,最小化它以优化模型。
  • 优化方法主要为梯度下降。
  • 与线性回归的比较显示了它们在任务、输出、假设、模型和损失函数上的不同之处。

三、逻辑回归预测癌症案例

 

 

 

 

场景设定

假设我们有一组数据,记录了若干患者的健康状况及其是否患有癌症。数据包括患者的年龄、体重、是否吸烟等信息,以及是否患有癌症(0表示未患癌,1表示患癌)。

目标

我们的目标是利用这些数据训练一个逻辑回归模型,当我们输入新的患者信息时,模型可以预测该患者是否患有癌症的概率。

步骤

  1. 收集和准备数据

    • 数据集可能包含以下信息:
      | 年龄 | 体重 | 吸烟 | 是否患癌 |
      |----|----|----|-------|
      | 45 | 70 | 1  | 1     |
      | 50 | 65 | 0  | 0     |
      | 40 | 80 | 1  | 1     |
      | 30 | 60 | 0  | 0     |
      
    • 每一行代表一个患者的信息。
  2. 训练模型

    • 使用这些数据来训练逻辑回归模型。
    from sklearn.linear_model import LogisticRegression
    import pandas as pd
    
    # 假设数据已经被加载到一个DataFrame中
    data = pd.DataFrame({
        'age': [45, 50, 40, 30],
        'weight': [70, 65, 80, 60],
        'smoke': [1, 0, 1, 0],
        'cancer': [1, 0, 1, 0]
    })
    
    X = data[['age', 'weight', 'smoke']]
    y = data['cancer']
    
    model = LogisticRegression()
    model.fit(X, y)
    
  3. 保存模型

    • 训练好模型后,将其保存到文件中,以便后续使用。
    import joblib
    joblib.dump(model, 'cancer_prediction_model.pkl')
    

    加载模型和预测

    • 当有新的患者信息时,可以加载保存的模型并进行预测。
    # 加载模型
    model = joblib.load('cancer_prediction_model.pkl')
    
    # 新患者的信息
    new_patient = [[50, 70, 1]]
    
    # 预测该患者患癌的概率
    cancer_probability = model.predict_proba(new_patient)[0][1]
    print(f'该患者患癌的概率是: {cancer_probability:.2f}')
    

结果解释

  • 输出结果:模型会输出一个概率值,表示患者患癌的可能性。例如,输出值为0.81,表示该患者有81%的可能性患癌。

逻辑回归在癌症预测中的优势

  • 处理概率问题:逻辑回归擅长处理二分类问题,如“是否患癌”这种是或否的问题。
  • 概率输出:模型提供概率值而不是简单的分类,有助于医生根据概率值做进一步判断。
  • 解释性强:逻辑回归的模型参数可以解释每个特征对预测结果的影响,帮助理解哪些因素更容易导致癌症。

小结

通过这个案例,我们可以看到逻辑回归在实际生活中的应用。它通过学习患者的历史数据,构建一个模型,帮助预测新患者是否患有癌症。这种方法不仅高效,而且能够提供概率结果,辅助医生进行决策。

四、逻辑回归总结

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1977798.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【软考】甘特图

目录 1. 说明2. 图示3. 特点4. 例题4.1 例题1 1. 说明 1.Gantt图是一种简单的水平条形图,它以日历为基准描述项目任务。2.水平轴表示日历时间线(如时、天、周、月和年等),每个条形表示一个任务,任务名称垂直地列在左边的列中,图中水平条的起…

猫头虎分享:从零开始掌握ChatGPT的实用技巧与多样应用

猫头虎分享:从零开始掌握ChatGPT的实用技巧与多样应用 ChatGPT使用方法与应用场景分享 大家好,我是猫头虎 🐯,欢迎大家来到这次的分享课程。在这里,我们将深入了解ChatGPT的使用方法和应用场景。本文旨在帮助大家从零…

配置nacos显示nacos registry register finished但是nacos页面看不到服务

在idea配置按以下配置&#xff1a; 父工程&#xff1a; <dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-alibaba-dependencies</artifactId><version>2021.0.1.0</version><type>pom</type&…

内网权限维持——映像劫持CLR劫持

文章目录 一、映像劫持1.1 IFEO简介1.2 利用Shfit后门技术进行劫持1.3 GlobalFlag 二、CLR劫持2.1 CLR简介2.2 利用CLR探查器进行权限维持 攻击机kali IP&#xff1a;192.168.111.0 跳板机win7 IP&#xff1a;192.168.111.128&#xff0c;192.168.52.143 靶机win server 2008 I…

【开端】通过springboot框架创建对象

日常创建对象的方式 UserService userService new UserService() 这中方式创建对象&#xff0c;是程序运行中&#xff0c;才会创建的对象。在web中&#xff0c;我们需要再web服务器启动完成就创建一系列的对象。这是就可以把创建对象的任务交给spring的IOC框架。 例如创建U…

SOMEIP_ETS_003:数组长度过短导致有效载荷被剥离

测试目的&#xff1a; 确保DUT在接收到的SOME/IP消息中数组长度小于实际数组长度时&#xff0c;能够正确地截断负载数据至声明的数组长度。 描述 本测试用例旨在验证DUT在处理一个声明数组长度小于其实际长度的SOME/IP消息时&#xff0c;是否能够将响应消息的负载数据截断至…

国标GB/T28181视频转S3云存储,支持阿里云OSS、腾讯云COS、天翼云存储,视频转云存大大降低运营商项目运营成本

最近在做一个运营商主导的项目&#xff0c;在沟通项目需求的时候&#xff0c;发现从运营商的角度&#xff0c;带宽和存储的成本在内部计费中是能够比市场上的价格低的多的多&#xff0c;以一个100路摄像头的本地存储为例&#xff0c;如果采用NVR本地存储&#xff0c;或者CVR本地…

LabVIEW水下根石监测系统

开发了一种基于LabVIEW平台开发的水下根石监测系统。该系统利用高精度姿态传感器与位移传感器&#xff0c;实现了水下根石状态的实时自动监测&#xff0c;提高了水利工程安全管理的现代化和精细化水平&#xff0c;具有高精度、高稳定性和良好的操作性。 项目背景&#xff1a; …

计算机体系结构和计算机组成原理的区别

如何理解计算机体系结构和计算机的组成&#xff1f;哪个对计算机的性能更重要&#xff1f;说明理由 目录 计算机体系结构 计算机组成 二者区别 哪个对性能更重要 计算机体系结构 计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论…

Linux系统驱动(二)字符设备驱动

文章目录 一、概念&#xff08;一&#xff09;相关概念&#xff08;二&#xff09;字符设备框架结构&#xff08;三&#xff09;用户空间和内核空间数据传输1. 函数的参数对应关系 &#xff08;四&#xff09;字符设备相关的API1. 字符设备驱动&#xff08;1&#xff09;注册字…

stl容器 vector的使用与模拟实现

1.vector构造 1.1默认构造函数 vector<int>是vector类模版类型&#xff0c;尖括号里的类型是指生成什么类型的vector的类&#xff0c;实质上vector可以看做一个数组&#xff0c;vector<int>实质上就是生成了一个存int类型的数组&#xff0c;而tamp是这个数组的名字…

SpringSecurity-2(认证和授权+SpringSecurity入门案例+自定义认证+数据库认证)

SpringSecurity使用自定义认证页面 4 SpringSecurity使用自定义认证页面4.1 在SpringSecurity主配置文件中指定认证页面配置信息4.1.1 配置springSecurity.xml配置文件4.1.2 定义login.jsp 4.2 SpringSecurity的csrf防护机制4.2.1 SpringSecurity中CsrfFilter过滤器说明4.2.2 禁…

苹果iPhone 16 Pro系列有望支持Wi-Fi 7,再也不说苹果信号不好了

苹果公司始终以其创新技术引领智能手机市场的发展。 随着新一代iPhone 16系列的即将发布&#xff0c;特别是iPhone 16 Pro系列&#xff0c;预计将带来一系列令人瞩目的升级和新功能。 其中最引人注目的是Wi-Fi 7技术的应用&#xff0c;这将为用户带来前所未有的无线网络速度。…

计算机毕业设计选题推荐-校园服务系统-Java/Python项目实战

✨作者主页&#xff1a;IT研究室✨ 个人简介&#xff1a;曾从事计算机专业培训教学&#xff0c;擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…

飞书API 2-7:如何将 MySQL 数据库的查询结果写入多维表(下)

一、引入 上一篇&#xff0c;解决了数据持续插入更新的问题。在一些场景下&#xff0c;如果数据量较大&#xff0c;需要跑多个任务调用接口插入&#xff0c;但是逐个跑任务又太久&#xff0c;又该怎么提高执行速度呢&#xff1f;没错&#xff01;就是多线程。 本文就来探讨下…

【Nuxt】服务端渲染 SSR

SSR 概述 服务器端渲染全称是&#xff1a;Server Side Render&#xff0c;在服务器端渲染页面&#xff0c;并将渲染好HTML返回给浏览器呈现。 SSR应用的页面是在服务端渲染的&#xff0c;用户每请求一个SSR页面都会先在服务端进行渲染&#xff0c;然后将渲染好的页面&#xf…

STM32 | ADC+RS485(第十天)

点击上方"蓝字"关注我们 01、ADC概述 ADC, Analog-to-Digital Converter的缩写,指模/数转换器或者模拟/数字转换器。是指将连续变量的模拟信号转换为离散的数字信号的器件。真实世界的模拟信号.例如温度、压力、声音或者图像等,需要转换成更容易储存、处理和发射的…

【公考新手教程】公考新手小白备考规划

公考 公考相关考试国考省考 行测常识判断言语理解与表达数量关系判断推理&#xff08;重中之重&#xff09;图推定义判断类比逻辑判断 资料分析&#xff08;重中之重&#xff09; 申论&#xff08;很重要&#xff0c;提升困难&#xff09;公基推荐考公软件粉笔华图在线bilibili…

零基础开始学习鸿蒙开发-文章推荐栏获取接口数据并展示

目录 1.新建文章列表布局页面&#xff0c;通过静态数据&#xff0c;编写好布局页面。 1.1 通过行ArticleCard布局构建单个文章展示的item项 1.2 使用了ObjectLink装饰器&#xff08;尽管这不是ArkUI标准API的一部分&#xff0c;特定框架或自定义的扩展&#xff09;&#xff0c…

在自定义数据集上训练现有的Detectron2模型

这段内容介绍了将使用一个气球分割数据集&#xff08;仅包含一个类别&#xff1a;气球&#xff09;来训练一个气球分割模型。训练过程将以一个预训练在COCO数据集上的模型为基础&#xff0c;这些模型可以在Detectron2的模型库中获取。需要注意的是&#xff0c;COCO数据集本身并…