判别分析2|Bayes判别分析|Fisher判别分析|软件求解

news2024/11/22 21:20:04

Bayes判别分析

引入先验信息

距离判别只要求知道总体的数字特征,不涉及总体的分布函数
当均值和协方差未知时,就用样本的均值和协方差矩阵做估计值。距离判别方法简单实用,但没有考虑到每个总体出现的机会大小,即先验概率,没有考虑到错判的损失。比如医疗诊断中癌症病人和正常人的分辨。贝叶斯判别法正是为了解决这两个问题提出的判别分析方法

Bayes统计的基本思想是:假定对所研究的对象已有一定的认识,常用先验概率分布来描述这种认识,然后我们取得一个样本,用样本来修正已有的认识(先验概率分布),得到后验概率分布,各种统计推断都通过后验概率分布来进行。将Bayes思想用于判别分析,就得到贝叶斯分类器。贝叶斯公式如下:
P ( B i ∣ A ) = P ( A ∣ B i ) P ( B i ) ∑ P ( A ∣ B i ) P ( B i ) P(B_{i}| A)=\frac{P(A| B_{i})P(B_{i})}{\sum P(A| B_{i})P(B_{i})} P(BiA)=P(ABi)P(Bi)P(ABi)P(Bi)

贝叶斯分类器:
判别函数:后验概率计算公式,
判别准则:后验概率最大原则
设有总体 G i ( i = 1 , 2 , … , k ) G_{i}(i=1,2,\dots,k) Gi(i=1,2,,k),具有概率密度函数 f i ( x ) f_{i}(x) fi(x),并且有先验知识
知道 G i G_{i} Gi发生的概率是 P i P_{i} Pi。由贝叶斯公式计算样本 x 0 ∈ G i x_{0}\in G_{i} x0Gi
后验概率为:
P ( G i ∣ x 0 ) = p i f i ( x 0 ) ∑ p j f j ( x 0 ) P(G_{i}| x_{0})= \frac{p_{i}f_{i}(x_{0})}{\sum p_{j}f_{j}(x_{0})} P(Gix0)=pjfj(x0)pifi(x0)
判别规则:若
P ( G l ∣ x 0 ) = p l f l ( x 0 ) ∑ p j f j ( x 0 ) = m a x 1 ≤ i ≤ k p i f i ( x 0 ) ∑ p j f j ( x 0 ) P(G_{l}| x_{0})= \frac{p_{l}f_{l}(x_{0})}{\sum p_{j}f_{j}(x_{0})}=max_{1\le i\le k} \frac{p_{i}f_{i}(x_{0})}{\sum p_{j}f_{j}(x_{0})} P(Glx0)=pjfj(x0)plfl(x0)=max1ikpjfj(x0)pifi(x0)
x 0 x_{0} x0判给 G l G_{l} Gl
若要同时考虑到错判的损失,模型可进一步修正。设C(j/i)表示将第i类错判到第j类所造成的损失。请看下面Bayes判别准则。

定理:若各类总体 G 1 , G 2 , … , G k G_{1},G_{2},\dots,G_{k} G1,G2,,Gk的先验概率为
{ a i , i = 1 , 2 , 3 , … , k } \left\{ a_{i},i=1,2,3,\dots,k\right\} {ai,i=1,2,3,,k}
各类密度函数 { f i ( x ) } \left\{ f_{i}(x)\right\} {fi(x)}。第i类错判到第j类所造成的损失 { C ( j / i ) } \left\{ C(j/i)\right\} {C(j/i)}
构造判别函数
h j ( x ) = ∑ j = 1 k q i C ( j / i ) f i ( x ) h_{j}(x)=\sum_{j=1}^{k} q_{i}C(j/i)f_{i}(x) hj(x)=j=1kqiC(j/i)fi(x)
对任意样本x,判别规则是

h i ( x ) = m i n 1 ≤ j ≤ k h j ( x ) h_{i}(x)=min_{1\le j\le k}h_{j}(x) hi(x)=min1jkhj(x)
x ∈ G i ,   i = 1 , 2 , 3 , … , k x \in G_{i},\ i= 1,2,3,\dots,k xGi, i=1,2,3,,k
{ h j ( x ) } \left\{ h_{j}(x)\right\} {hj(x)}描述了将其他类样本划分到第j类的可能产生的损失。
这个判别规则,理论上使平均错判损失最小。

两类问题时的Bayes判别准则为
x ∈ G 1 ,  若 q 2 C ( 1 / 2 ) f 2 ( x ) − q 1 C ( 2 / 1 ) f 1 ( x ) < 0 x\in G_{1},\ 若q_{2}C(1/2)f_{2}(x)-q_{1}C(2/1)f_{1}(x)<0 xG1, q2C(1/2)f2(x)q1C(2/1)f1(x)<0
f 1 ( x ) f 2 ( x ) > q 2 C ( 2 / 1 ) q 1 C ( 1 / 2 ) \frac{f_{1}(x)}{f_{2}(x)}> \frac{q_{2}C(2/1)}{q_{1}C(1/2)} f2(x)f1(x)>q1C(1/2)q2C(2/1)

v ( x ) = f 1 ( x ) f 2 ( x ) ,   d = q 2 C ( 2 / 1 ) q 1 C ( 1 / 2 ) v(x)=\frac{f_{1}(x)}{f_{2}(x)},\ d=\frac{q_{2}C(2/1)}{q_{1}C(1/2)} v(x)=f2(x)f1(x), d=q1C(1/2)q2C(2/1)
{ x ∈ G 1 若 v ( x ) > d x ∈ G 2 若 v ( x ) < d 待判 若 v ( x ) = d \left\{\begin{matrix} x\in G_{1}\quad 若v(x)>d \\ x\in G_{2}\quad 若v(x)<d \\ 待判\quad 若v(x)=d \end{matrix}\right. xG1v(x)>dxG2v(x)<d待判v(x)=d
当给定不同的分布假设时,判别函数 v ( x ) v(x) v(x)具有更简单形式
当两总体错分损失相等时,两个总体的Bayes判别法则为:
{ x ∈ G 1 : 若 P ( G 1 ∣ x ) ≥ P ( G 2 ∣ x ) x ∈ G 2 : 若 P ( G 1 ∣ x ) < P ( G 2 ∣ x ) \left\{\begin{matrix} x\in G_{1}:若P(G_{1}| x)\ge P(G_{2}|x) \\ x\in G_{2}:若P(G_{1}| x)< P(G_{2}|x) \end{matrix}\right. {xG1:P(G1x)P(G2x)xG2:P(G1x)<P(G2x)
更进一步对正态分布分类总体:
若两总体的协方差矩阵相等,化解上述的判别规则得到等价的线性判别规则
若协方差矩阵不相等,则判别函数为二次函数。
再进一步,当p1=p2时,Bayes判别就是距离判别
Bayes分类器有很高的理论价值,在实际使用时有很多的假设难以满足

Fisher判别分析

首先考虑只有两个属性变量的二分类判别分析问题。
分类思想就寻找一个方向,也就是图上的虚线方向,沿着这个方向朝和这个虚线垂直的一条直线进行投影会使得这两类分得最清楚。可以看出,如果向其他方向投影,判别效果不会比这个好。
![[Pasted image 20240823153937.png]]

投影之后,再用前面讲到的距离判别方法对样本进行分类
费歇(Fisher)判别法是一种线性判别的方法。它的工作思路是对原数据系统进行坐标变换,寻求能将类别总体尽可能分开的投影方向,使得投影后的数据点,同一类别的尽量聚拢,不同类别产生的尽量拉开。
优点:没有做分布假设。

Fisher判别函数或典型判别函数
Y ^ 1 ( x ) = c ^ 11 x 1 + ⋯ + c ^ p 1 x p \hat{Y}_{1}(x)=\hat{c}_{11}x_{1}+\dots+\hat{c}_{p1}x_{p} Y^1(x)=c^11x1++c^p1xp
寻找一个投影方向
( c ^ 11 , c ^ 21 , … , c ^ p 1 , ) T (\hat{c}_{11},\hat{c}_{21},\dots,\hat{c}_{p1},)^{T} (c^11,c^21,,c^p1,)T
样本点投影后的点集
{ c ^ 11 x 1 i + ⋯ + c ^ p 1 x p i } i = 1 n \left\{ \hat{c}_{11}x_{1i}+\dots+\hat{c}_{p1}x_{pi} \right\}_{i=1}^{n} {c^11x1i++c^p1xpi}i=1n
计算该点集的组内离差平方和、组间离差平方和
I = 组间离差平方和 组内方差和 I= \frac{组间离差平方和}{组内方差和} I=组内方差和组间离差平方和
选择方向 ( c ^ 11 , c ^ 21 , … , c ^ p 1 , ) T (\hat{c}_{11},\hat{c}_{21},\dots,\hat{c}_{p1},)^{T} (c^11,c^21,,c^p1,)T应使得I值达到最大。

在这个方向,最大限度地反映不同类的个体之间的差异,在这个方向上产生的变量称之为第一个典型变量
Y ^ 1 ( x ) = c ^ 11 x 1 + ⋯ + c ^ p 1 x p \hat{Y}_{1}(x)=\hat{c}_{11}x_{1}+\dots+\hat{c}_{p1}x_{p} Y^1(x)=c^11x1++c^p1xp
就是第一个典型判别函数。同样通过投影可以找到第二个方向,建立第二个典型变量,和第二个典型判别函数。直到找到t个。 t ≤ k t\le k tk
k是总体的个数。

使用典型判别函数判别×的类

把所有类的各个指标的均值(非标准化数据的均值),代入典型判别函数,得出各类中心典型函数的值
把需要判别的点x的p个指标的值,代入典型判别函数,得出这个点的典型函数值,与哪个类中心的典型函数值最近,就判别这个点属于这个类(投影后最近距离判别)

两类问题时,设有
{ X 1 ( 1 ) , X 2 ( 1 ) , … , X n 1 ( 1 ) } ∈ G 1 ,   { X 1 ( 2 ) , X 2 ( 2 ) , … , X n 2 ( 2 ) } ∈ G 2 ,   \left\{ X_{1}^{(1)},X_{2}^{(1)},\dots,X_{n1}^{(1)} \right\}\in G_{1},\ \left\{ X_{1}^{(2)},X_{2}^{(2)},\dots,X_{n_{2}}^{(2)} \right\}\in G_{2},\ {X1(1),X2(1),,Xn1(1)}G1, {X1(2),X2(2),,Xn2(2)}G2, 
一个投影方向和典型判别函数
U = ( c 1 , c 2 , … , c p ) T ,   Y 1 ( x ) = c 11 x 1 + ⋯ + c p 1 x p U=(c_{1},c_{2},\dots,c_{p})^{T},\ Y_{1}(x)=c_{11}x_{1}+\dots+c_{p1}x_{p} U=(c1,c2,,cp)T, Y1(x)=c11x1++cp1xp
投影后类中心
{ u T X 1 ( 1 ) , u T X 2 ( 1 ) , … , u T X n 1 ( 1 ) } 类中心 G 1 \left\{ u^{T}X_{1}^{(1)},u^{T}X_{2}^{(1)},\dots,u^{T}X_{n1}^{(1)} \right\}\quad 类中心G_{1} {uTX1(1),uTX2(1),,uTXn1(1)}类中心G1
{ u T X 1 ( 2 ) , u T X 2 ( 2 ) , … , u T X n 2 ( 2 ) } 类中心 G 2 \left\{ u^{T}X_{1}^{(2)},u^{T}X_{2}^{(2)},\dots,u^{T}X_{n_{2}}^{(2)} \right\}\quad 类中心G_{2} {uTX1(2),uTX2(2),,uTXn2(2)}类中心G2
待判样品x到某一类G的距离定义为X点与类中心的距离
d ( X , G 1 ) = ∣ ∣ u T X − C 1 ∣ ∣ ,   d ( X , G 2 ) = ∣ ∣ u T X − C 2 ∣ ∣ d(X,G_{1})=| | u^{T}X -C_{1}| |,\ d(X,G_{2})=| | u^{T}X-C_{2} | | d(X,G1)=∣∣uTXC1∣∣, d(X,G2)=∣∣uTXC2∣∣
Fisher分类判别准则为
{ d ( X , G 1 ) < d ( X , H 2 ) ,  则 X ∈ G 1 d ( X , G 2 ) < d ( X , H 1 ) ,  则 X ∈ G 2 d ( X , G 1 ) = d ( X , H 2 ) ,  则 X 待定 \left\{\begin{matrix} d(X,G_{1})<d(X,H_{2}),\ 则X\in G_{1} \\ d(X,G_{2})<d(X,H_{1}),\ 则X\in G_{2} \\ d(X,G_{1})=d(X,H_{2}),\ 则X待定 \end{matrix}\right. d(X,G1)<d(X,H2), XG1d(X,G2)<d(X,H1), XG2d(X,G1)=d(X,H2), X待定

典型函数判别能力检验

当需要多个典型函数时,对典型函数的判别能力要通过显著性检验来取舍。
多元方差分析可以检验所有属性变量是否联合对判别函数的判别能力有显著性意义
在一个判别函数中,每一个属性变量对典型函数的判别能力都有所贡献。贡献的大小可以用多元方差分析来检验。
属性变量的判别能力重要性也各不相同。类似逐步回归,也可选择遂步判别分析法

逐步判别法的基本思想是采用“有进有出”的算法,即遂步引入变量、每引入一个“最重要”的变量进入判别式,同时也考虑较早引入判别式的某些变量,如果其判别能力随新弓入变量而变为不显著了(例如其作用被后引入的某几个变量的组合所代替),应及时从判别式中把它剔除去,直到判别式中没有不重要的变量需要剔除,而剩下来的变量也没有重要的变量可引入判别式时,逐步筛选结束。这个筛选过程实质就是作假设检验,通过检验找出显著性变量,剔除不显著变量。

软件求解

SPSS判别分析求解

IrisDataSet(鸢尾属植物数据集)是被用来介绍线性判别式分析最悠久的数据集。在这个数据集中,包括了三类不同的鸢尾属植物:IrisSetosa,Iris
Versicolour,IrisVirginica。每类收集了50个样本,因此这个数据集一共包含了 150个样本。
该数据集测量了所有150个样本的4个特征,分别是:
sepal length (花萼长度)
sepal width (花萼宽度)
petal length (花瓣长度)
petal width (花瓣宽度)
以上四个特征的单位都是厘米(cm)。属性变量是4个,样本数150.

v1,v2,v3,v4是属性变量。v5是原分类观察变量。
每一类。前40个用来设计,后 10个用于检验,因此令外定义变量V6取值和V5相同,但在每组后十个v6值缺失。用于记录预测值,和v5比较后判别分类效果。看下图
![[Pasted image 20240823161554.png]]

基本判别分析用SPSS实现,简便快捷。

  1. 打开数据文件或新建数据文件
  2. 点击菜单,分析→分类→判别分析,进入判别分析方法框设置
  3. 选择属性变量V1-V4进入自变量列表框
  4. 选择V6进入分组变量,并定义范围
    ![[Pasted image 20240823162027.png]]

设置统计量按钮:若要输出Fisher典型判别函数则勾选未标准化复选框。
若要输出每一类Bayes判别函数则勾选Fisher框。SPSS输出的这个函数是在假设总体是正态总体且方差相同的条件下的等效的判别函数,是一个线性函数,不是后验概率的计算公式。
本例中有两个典型判别函数通过了显著性检验
右图是每一类的基于Bayes理论线性判别函数。
![[Pasted image 20240823162155.png]]
![[Pasted image 20240823162208.png]]

典型函数的重要性是和特征值的贡献率有关。
下表说明第一个函数的贡献率已经是99.3%,而第二个只有0.7%。这两个典型判别函数并不是平等的。但两个都通过了显著性检验。同时给出的各类质心得分。对于一个未知样本,计算其判别得分到各类质心的距离来预测其类别
![[Pasted image 20240823162223.png]]
![[Pasted image 20240823162230.png]]

该表给出了三个线性分类函数的系数。把每个观测点带入三个函数,就可以得到分别代表三类的三个值,哪个值最大,该点就属于相应的那一类,称之为模型预测值。当然,我们一开始就知道这些训练数据的类别取值,即训练样本的观测值。比较预测值和观察值,找到错分的样本。SPSS用**‘标注。这里84号样本被错分。 91,92,93测试样本都被正确分到第二类。
![[Pasted image 20240824020551.png]]
![[Pasted image 20240824020609.png]]

继续,设置保存按钮:
若要保存典型函数的敢值,则勾选判别得分。
若要观察模型的预测分类值,勾选预测组成员。属于各类的后验概率在组成员概率中给出。
所有数值追加在当前数据表之后。比较V5和预测组成员的取值,可以看到每组未分类的10个测试点都被正确分类。
![[Pasted image 20240824020733.png]]

继续,设置分类按钮:
勾选摘要表,输出判别分析的准确率判别得分。
勾选合并组:得到典型函数得分散点图。
勾选输出个案结果,可看到模型预测值,找到错分的个案。
![[Pasted image 20240824020828.png]]
![[Pasted image 20240824020859.png]]

Matlab判别分析命令CLASSIFY

两种Af和Apf已由生物学家W.L.Grogna和W.W.Wirth于1981年根据它们的触角长和翼长加以区分,下面是9只Af和6只Apf的触角长和翼长数据

Apf = [1.14, 1.78; 1.18, 1.96; 1.20, 1.86; 1.26, 2.00; 1.28, 2.00; 1.30, 1.96]; 

6行两列

Af =[1.24, 1.72; 1.36, 1.74; 1.38, 1.64; 1.38, 1.82; 1.38, 1.90; 1.40, 1.70; 1.48, 1.82; 1.54, 1.82; 1.56, 2.08];

9行两列
给定触角长和翼长分别为(1.24,1.80),(1.28,1.84),(1.40,2.04)三个标本判别他们的类别

MATLAB统计工具箱提供的classify函数,可用来对未知类别的样品进行距离判别和先验分布为正态分布的Bayes判别。

Training = [Apf; Af]  %训练样本的属性变量值 
X = [1.24, 1.8; 1.28, 1.84; 1.4, 2.04] %待判样本
Group = [ones(6, 1) * 1; ones(9,1) * 2] %前6个样本第一类,后9个第二类
[class, err] = Classify(x, Training, Group)  %距离判别
[class, err] = classify(x, training,Group,'linear')%线性判别函数
[class, err] = classify(x, training, Group, 'quadratic')%二次判别函数

命令格式:

[class, err] = classify(sample, training, group, type, prior)
  • Sample:待分样本属性矩阵
  • Training:训练样本属性矩阵,同类放一起
  • Group:与训练样本相对应的分类变量值
  • Type:可指定判别函数的类型
  • Prior:制定各类样本的先验概率
  • Class:输出待判样本的类别敢值
  • Error:误判概率的估计值
    ![[Pasted image 20240824022147.png]]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2069576.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据结构(邓俊辉)学习笔记】优先级队列 09——左式堆:合并算法

文章目录 1. LeftHeap模板类2. 算法3. 实现4. 实例 1. LeftHeap模板类 接下来这节&#xff0c;来讨论左式堆的合并算法。再给出具体算法之前&#xff0c;首先要给出左式堆模板类的定义。 比如这就是一种可能的实现方式&#xff0c;可以看到&#xff0c;我们这里再次利用了 C…

srm供应商一体化招采系统解决方案,需求功能清单以及源码实现(JAVA)

1. 供应商管理 2. 采购需求管理 3. 采购寻源管理 4. 采购合同管理 5. 采购订单管理 6. 采购协同管理 7. 外部商城采购管理 8. 报表查询管理 9. 系统管理 10. 集成管理 资料获取&#xff1a;本文末个人名片。

在Activity中使用Menu

在Activity中使用Menu 手机毕竟和电脑不同&#xff0c;它的屏幕空间非常有限&#xff0c;因此充分地利用屏幕空间在手机界面设计中就显得非常重要了。如果你的活动中有大量的菜单需要显示&#xff0c;这个时候界面设计就会比较尴尬&#xff0c;因为仅这些菜单就可能占用屏幕将…

构建高效的串行任务执行器:SerialExecutor深度解析

本文主要介绍怎么去实现一个支持串行执行任务的SerialExecutor执行器 摘要 在复杂的异步编程中&#xff0c;有时我们需要确保任务以串行的方式执行&#xff0c;以维护任务间的依赖关系或顺序。SerialExecutor 是一个自定义的执行器&#xff0c;它封装了 Java 的 Executor 接口…

Linux磁盘分区,增加磁盘应用实例,磁盘情况查询

目录 linux磁盘分区机制 原理介绍 示意图 硬盘说明 查看所有设备挂载情况 挂载的经典案例 给虚拟机添加硬盘 分区 删除挂载 永久挂载 磁盘情况查询 查询系统整体磁盘使用情况 查询指定目录的磁盘占用情况 linux磁盘分区机制 原理介绍 载入可以将一个分区和一个目录…

【精选】基于微信小程序的地铁站点查询系统(全网独一无二,阿龙原创设计)

博主介绍&#xff1a; ✌我是阿龙&#xff0c;一名专注于Java技术领域的程序员&#xff0c;全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师&#xff0c;我在计算机毕业设计开发方面积累了丰富的经验。同时&#xff0c;我也是掘金、华为云、阿里云、InfoQ等平台…

C#入门篇3

目录 一、练习 二、显示类型转换&#xff08;强制类型转换&#xff09; 三、Convert的转换工厂转换 四、算数运算符号之&#xff08; /--&#xff09; 五、关系运算符&#xff08;比较运算&#xff09; 六、逻辑运算符 七、复合运算符 一、练习 计算半径为5的圆的面积和周…

Windows平台SDKMAN工具使用

为方便jvm生态的软件版本管理&#xff0c;可以使用sdkman工具来安装和管理诸如java、gradle等软件的当前使用版本。尤其是大多数程序员都是在windows平台开发&#xff0c;团队开发通常都需要统一的jvm相关软件的版本。这里给大家演示下windows平台如何安装和使用sdkman来实现这…

普元EOS-自定义SDO代码生成模板

1 前言 普元EOS的数据实体生成SDO接口和实现类的代码&#xff0c;可以通过自定义代码生成模板&#xff0c;实现代码自定义。 2 模板存放位置 模板存放位置如下&#xff1a;安装目录/dropins/eostools/com.primeton.studio.entity.ui-x.x.x.x.jar里面&#xff0c;SDO模版都在/…

揭秘CAAC、AOPA、ALPA、ASFC和UTC无人机执照的差别及实用价值

CAAC、AOPA、ALPA、ASFC和UTC无人机执照各有其独特的差别及实用价值&#xff0c;以下是针对这些执照的详细解析&#xff1a; 一、CAAC无人机执照 颁发机构&#xff1a;中国民用航空局&#xff08;CAAC&#xff09; 差别&#xff1a; - 权威性&#xff1a;CAAC无人机执照是目…

Go机器学习框架之火重燃,Google前研究员开源期望媲美Jax的GoMLX

Go作为一门兼具高性能与简洁性的编程语言&#xff0c;近年来在各种领域得到广泛应用。然而&#xff0c;在机器学习领域&#xff0c;Go相比Python、C、Julia等语言&#xff0c;生态仍然较为薄弱。目前的Go机器学习框架无论在功能全面性上&#xff0c;还是在社区生态支持上都难以…

2024升级zblog小程序开源源码/基于uniapp开发的(支持微信小程序、百度小程序、安卓APP)

源码简介&#xff1a; 2024最新zblog多端小程序开源源码&#xff0c;它是基于uniapp开发的&#xff0c;它是针对和支持微信小程序、百度小程序和安卓APP哦&#xff01;百度百科小程序源码下载。 这个基于uniapp开发的zblog多端小程序开源源码&#xff0c;听说对收录和SEO都有…

Android 添加系统服务的实现

和你一起终身学习&#xff0c;这里是程序员Android 本篇文章主要介绍 Android 开发中的部分知识点&#xff0c;通过阅读本篇文章&#xff0c;您将收获以下内容: 一、前言二、编写AIDL文件三、编写Manager类四、 编写系统服务五、 注册系统服务六、注册Manager七、App调用八、添…

设计模式 -- 七大原则(五)-- 开闭原则

1 基本介绍 开闭原则&#xff08;Open Closed Principle&#xff0c;简称OCP&#xff09;是编程中最基础、最重要的设计原则 一个软件实体如类&#xff0c;模块和函数应该对扩展开放(对提供方)&#xff0c;对修改关闭(对使用方)。用抽象构建框架&#xff0c;用实现扩展细节。 …

伯努利朴素贝叶斯解析:面向初学者的带代码示例的视觉指南

通过二进制简单性释放预测能力&#xff0c;欢迎来到雲闪世界。 添加图片注释&#xff0c;不超过 140 字&#xff08;可选&#xff09; 与虚拟分类器的基线方法或基于相似性的 KNN 推理不同&#xff0c;朴素贝叶斯利用了概率论。它结合了每个“线索”&#xff08;或特征&#xf…

宿舍管理系统设计与分析

第一章 管理信息系统概述 在人类进入21世纪之际&#xff0c;随着社会的组织化程度以及企业生产的社会化程度越来越高&#xff0c;信息作为一种资源已经和材料、能源并称为现代社会化发展的三大支柱之一。管理信息系统是融科学、信息科学、系统工程以及现代通讯技术、计算机技术…

阿里HPN-大型语言模型训练的数据中心网络架构

阿里巴巴HPN:用于大型语言模型训练的数据中心网络 摘要 本文介绍了阿里云用于大型语言模型(LLM)训练的数据中心网络HPN。由于LLM和一般云计算之间的差异(例如&#xff0c;在流量模式和容错性方面)&#xff0c;传统的数据中心网络不太适合LLM训练。这就要求我们专门为LLM培训设…

【NetTopologySuite类库】多边形的五种包围盒(AABB、OBB、包围圆、八边形、凸包)

示例 用的是NetTopologySuite1.5.3版本。 var r new WKTReader(); var wkt "polygon((0 0,0 0.5,1 2,5 0,4 -2,3 -1, 0 0))"; var rawGeo r.Read(wkt); var b1 rawGeo.Envelope;//AABB var b2 new MinimumBoundingCircle(rawGeo).GetCircle();//包围圆 var b3…

基于GeoToolKit实现三维断面的绘制研究

GeoToolkit默认自带PillarSurfaceData的三维断面绘制要求断棱(有时叫断柱)必须是单调的,否则组件底层就会自动优化,导致断面出现回弯,相当于出现重叠,无法实现最终的效果。因此,本文主要在之前文章的基础上,拓展了GeoToolKit的三维断面显示功能。本文主要基于GeoToolKi…

计算机毕业设计hadoop+spark+hive漫画推荐系统 动漫视频推荐系统 漫画分析可视化大屏 漫画爬虫 漫画推荐系统 漫画爬虫 知识图谱 大数据

流程&#xff1a;1.DrissionPageSelenium自动爬虫工具采集漫画视频、详情、标签等约200万条漫画数据存入mysql数据库&#xff1b; 2.Mapreduce对采集的动漫数据进行数据清洗、拆分数据项等&#xff0c;转为.csv文件上传hadoop的hdfs集群&#xff1b; 3.hive建库建表导入.csv动漫…