<<机器学习实战>>1-9节笔记

news2025/1/23 17:40:47

2.前言与导学

从关注算法的分类与特性到关注算法适合解决哪类问题

很多经典算法不再有效,但特征工程、集成学习越来越有效,和深度学习分别适合于不同领域

3、基本概念

如果预测目标是离散的,则是分类问题,否则回归

机器学习相比统计学算法计算效率更高、对数据质量要求更低

损失函数和模型评估函数:一般不是一个,后续会讲两个不同形式的函数间的关联

9.变量相关性基础

变量相关性数值与强弱关系:

0-0.1不相关

0.1-0.3弱相关

0.3-0.5中等相关

0.5-1.0强相关

plt.subplot() /括号内填一个三位数,前两位表示几行几列,第三位表示这是这些图里的第几个

以下代码验证自己建立的数据集,当线性相关性越弱的时候,是否计算出的相关值也越差,同时画图观察

# In[1]:

import numpy as np

# In[16]:

a=np.array([[1,2,3],[4,5,10]]).T

# In[17]:

np.corrcoef(a[:,0],a[:,1])

# In[20]:

import matplotlib.pyplot as plt

# In[21]:

plt.plot(a[:,0],a[:,1])

# In[22]:

import pandas as pd

# In[23]:

x=np.random.randn(20)

# In[24]:

y=x+1

# In[25]:

np.corrcoef(x,y)

# In[26]:

plt.plot(x,y,'o')

# In[27]:

#再加一个扰动项

a=y.shape

# In[29]:

np.random.normal(size=a)

# In[30]:

ran=np.random.normal(size=y.shape)

# In[31]:

#创建控制扰动项大小的变量

delta=0.5

# In[32]:

r=ran*delta

# In[33]:

r

# In[34]:

y1=y+r

# In[36]:

plt.subplot(121)

plt.plot(x,y,'o')

plt.title('y=x+1')

plt.subplot(122)

plt.plot(x,y1,'o')

plt.title('y=x+1+r')

# In[37]:

#由此可见,加入扰动项后模型线性相关性变弱了

#修改不同参数

d1=[0.5,0.7,1,1.5,2,5]

# In[38]:

y1=[]

c1=[]

# In[39]:

for i in d1:

    yn=x+1+(ran*i)

    c1.append(np.corrcoef(x,yn))

    y1.append(yn)

# In[40]:

c1

# In[41]:

plt.plot(x,y1[0],'o')

# In[43]:

plt.subplot(231)

plt.plot(x,y1[0],'o')

plt.plot(x,y,'r-')

plt.subplot(232)

plt.plot(x,y1[1],'o')

plt.plot(x,y,'r-')

plt.subplot(233)

plt.plot(x,y1[2],'o')

plt.plot(x,y,'r-')

plt.subplot(234)

plt.plot(x,y1[3],'o')

plt.plot(x,y,'r-')

plt.subplot(235)

plt.plot(x,y1[4],'o')

plt.plot(x,y,'r-')

plt.subplot(236)

plt.plot(x,y1[5],'o')

plt.plot(x,y,'r-')

#能够看出,随着delta变大,数据相关性越来越弱

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2188447.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【AIGC】ChatGPT开发者必备:如何获取 OpenAI 的 API Key

博客主页: [小ᶻZ࿆] 本文专栏: AIGC | ChatGPT 文章目录 💯前言💯API Key的重要性💯获取API Key的基本步骤💯定价策略和使用建议💯小结 💯前言 在现代应用开发中,获取OpenAI的…

TCP Analysis Flags 之 TCP ZeroWindowProbe

前言 默认情况下,Wireshark 的 TCP 解析器会跟踪每个 TCP 会话的状态,并在检测到问题或潜在问题时提供额外的信息。在第一次打开捕获文件时,会对每个 TCP 数据包进行一次分析,数据包按照它们在数据包列表中出现的顺序进行处理。可…

什么是沉默成本?超详细+通俗易懂版

沉默成本是一个在会计学、金融学以及经济学中常用的概念,但更常见的表述是沉没成本(Sunk Cost)。沉没成本指的是已经发生且无法收回的成本,这些成本与当前的决策无关,但往往会影响人们的决策过程。以下是对沉没成本的详…

【MySQL】Ubuntu环境下MySQL的安装与卸载

目录 1.MYSQL的安装 2.MYSQL的卸载 1.MYSQL的安装 首先我们要看看我们环境里面有没有已经安装好的MySQL 我们发现是默认是没有的。 我们还可以通过下面这个命令来确认有没有mysql的安装包 首先我们得知道我们当前的系统版本是什么 lsb_release -a 我们在找apt源的时候&a…

vulnhub-unknowndevice64 2靶机

vulnhub:https://www.vulnhub.com/entry/unknowndevice64-2,297/ 导入靶机,放在kali同网段,扫描 靶机在192.168.81.9,扫描端口 啥啊这都是,详细扫描一下 5555是adb,6465是ssh,12345看样子应该是…

Python 工具库每日推荐 【BeautifulSoup】

文章目录 引言Python工具库的重要性今日推荐:BeautifulSoup工具库主要功能:使用场景:安装与配置快速上手示例代码代码解释实际应用案例获取 BeautifulSoup 官网文档首页的标题与所有图片案例分析扩展阅读与资源优缺点分析优点:缺点:总结【 已更新完 TypeScript 设计模式 专栏…

医疗应急三维电子沙盘系统

一、主要硬件功能指标要求: 1.沙盘尺寸≥98寸;分辨率:≥19201080;亮度500cd/m2;对比度4000:1;显示模式16:9;电源:100VAC~240VAC(50/60Hz)&#xf…

如何在 MySQL 中处理大量的 DELETE 操作

在 MySQL 数据库的使用过程中,我们有时会面临需要处理大量 DELETE 操作的情况。如果处理不当,可能会导致数据库性能下降、锁等待甚至系统崩溃。本文将介绍一些在 MySQL 中处理大量 DELETE 操作的方法。 一、问题背景 当需要删除大量数据时,…

手写mybatis之实现映射器的注册和使用

前言 其实对于解决这类复杂的项目问题,核心在于要将主干问题点缩小,具体的手段包括:分治、抽象和知识。运用设计模式和设计原则等相关知识,把问题空间合理切割为若干子问题,问题越小也就越容易理解和处理。就像你可以把…

【论文阅读】Segment Anything Model for Road Network Graph Extraction

【论文阅读】Segment Anything Model for Road Network Graph Extraction (CVPRW 2024) Paper链接:https://openaccess.thecvf.com/content/CVPR2024W/SG2RL/html/Hetang_Segment_Anything_Model_for_Road_Network_Graph_Extraction_CVPRW_2024_paper.html 文章目录…

基于SSM医疗信息管理系统(源码+定制+参考)

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…

vue文件的认识

1.package.json 项目包文件 里面包含许多可以在命令提示符中运行的命令,这里使用vue3创建的项目,所以dev是“vite”。 2.main.js 整个项目的入口文件,createApp创建应用实例 createApp(App).mount(#app) 这句话意思是以App作为参数生成一…

ElasticSearch备考 -- Search scroll

一、题目 Search for all documents in all indices As above, but use the scroll API to return the first 100 results while keeping the search context alive for 2 minutes Use the scroll id included in the response to the previous query and retrieve the next ba…

启用vnc访问Dell 服务器IDRAC 7虚拟控制台

Dell IDRAC 7 版本太老,SSL证书过期,IDRAC的Java和本地远程虚拟机控制台访问不了,怎么办? 可以启用vnc访问IDRAC 虚拟控制台

Vue2如何在网页实现文字的逐个显现

目录 Blue留言: 效果图: 实现思路: 代码: 1、空字符串与需渲染的字符串的定义 2、vue的插值表达式 3、函数 4、mounted()函数调用 结语: Blue留言: 在国庆前夕,突发奇想,我想…

SAP HCM 自定义累计期间

需求是按3月~8月,9月~次年2月,做为累计期间,怎么处理?

微信小程序hbuilderx+uniapp+Android 新农村综合风貌旅游展示平台

目录 项目介绍支持以下技术栈:具体实现截图HBuilderXuniappmysql数据库与主流编程语言java类核心代码部分展示登录的业务流程的顺序是:数据库设计性能分析操作可行性技术可行性系统安全性数据完整性软件测试详细视频演示源码获取方式 项目介绍 小程序端…

5G NR coreset 简介

文章目录 5G 为何引入CORESETCORESET介绍CORESET 分类 5G 为何引入CORESET 在LTE系统中,PDCCH频域占据整个带宽,始于占据每个RB的前1~3个OFDM 符号,这种情况下,UE 只需知道PDCCH 所占据的OFDM 符号数,就可以确定PDCCH…

内存对齐

内存对齐的基本规则是:只能在自己所占字节的整数倍的内存地址上存放(结构体也是如此)。 假如定义一下变量: 对应的存储格式为: 由于变量C占四个字节,所以从12开始。 对于整个结构体而言:结构体…

【Web】portswigger 服务端原型污染 labs 全解

目录 服务端原型污染 为什么服务器端原型污染更难检测? 通过受污染的属性反射检测服务器端原型污染 lab1:通过服务器端原型污染进行权限提升 无需污染属性反射即可检测服务器端原型污染 状态代码覆盖 JSON 空格覆盖 字符集覆盖 lab2:检测没有污染属性反射的…