1.什么是模式?监督模式识别和非监督模式识别的典型过程分别是什么?
模式:指需要识别且可测量的对象的描述
监督模式识别:分析问题→原始特征提取→特征提取与选择→分类器设计
非监督模式识别:分析问题→原始特征提取→特征提取与选择→聚类分析→结果解释
2.基本的基于最小错误率的贝叶斯决策规则是什么?
3.最小错误率的贝叶斯决策规则的等价形式有哪些?
4.多类问题中基于最小错误率的贝叶斯决策规则是什么?
决策原则:将样本决策为后验概率最大的类别
5.基于最小风险的贝叶斯决策规则是什么?
6. 基于最小错误率的贝叶斯决策与最小风险的贝叶斯决策是什么关系?
7.在正态分布概率模型下,当各类的协方差矩阵相等,并且都是对角阵时,各类的判别函数形式是什么?其分类面有什么特点?各类别的先验概率是否相等对分类面有什么影响?
(1)判别函数形式:X的线性函数
(2)分类面
(3)先验概率的影响
8.在正态分布概率模型下,当各类的协方差矩阵相等,均值任意,各类的判别函数形式是什么?其分类面有什么特点?各类别的先验概率是否相等对分类面有什么影响?
(1)判别函数
(2)分类面
(3)先验概率的影响
各类的先验概率相等
(2)各类的先验概率不等
10.参数估计的主要工作是什么?
参数估计,统计推断的一种。根据从总体中抽取的随机样本来估计总体分布中未知参数的过程。
11.最大似然估计的基本思想是什么?
12.什么是似然函数?对数似然函数的形式是什么?
13.贝叶斯估计的基本思想是什么?
14.非参数概率密度估计的原理是什么?
15.最大似然估计和贝叶斯估计的区别是什么?
16.非参数的概率密度估计的方法有哪些?如何实现?
17.如何根据训练样本直接设计分类器?思想是什么?
18. 线性判别函数的一般表达式是什么?各个参数有什么含义?
19.Fisher线性判别的基本思想是什么?
20. D维的样本经过投影后得到的是一个什么矢量还是一个标量?为什么?
21.Fisher线性判别准则里的两个重要参数是什么?
22.按照Fisher线性判别准则得到的投影方向和决策面是什么关系?
23.决策面的位置由什么决定?
24.什么是样本的增广化和规范化?
25. 在解空间中的解向量应该满足什么条件?
26.感知器准则函数的形式是什么?有什么含义?
27. 梯度下降法求解感知器准则函数的原理是什么?
28.批处理的感知器算法是怎么实现的?
29单样本修正中的固定增量法和变增量法指的是什么?用变增量法有什么好处?
30 最小平方误差判别的准则函数是什么?
31.widrow-hoff算法的思想是什么?
32.什么是最优分类超平面?
33.什么是支持向量?
34.支持向量机的工作原理?
35.分段线性判别函数的基本思想是什么?
36. 当各类数据是多峰分布时,如何用基于最小距离的分类方法进行分类?
37.在样本每一类的子类数目已知,但是子类具体的划分情况未知的情况下,如何设计分段线性分类器?
38.当样本每一类的子类数量也无法确定时,如何设计分段线性分类器?
39.在设计二分树线性分类器时,初始权值对结果是否有影响?一般如何确定初始权值?
40.二次判别函数确定的决策面是什么曲面?
41.当两类样本符合正态分布时,
1)如何定义每一类的判别函数?
2)如何确定判别函数中的相关参数?
3)如果是两类问题,其决策面是什么?
4)如果出现错误时,可以采用什么调节方法来减少错误率?
42.如果一类样本呈现团状分布,另外一类样本均匀分布在其周围时,如何进行决策?决策面是什么形状?
43.使用Parzen窗法进行概率密度函数估计时的方法是什么?
44. 非监督模式识别与监督模式识别的区别是什么?
45.非监督模式识别的基本思想是什么?非监督模式识别的方法分为哪两类?
46 聚类的基本思想是什么?
47 .动态聚类方法的三个要点是什么?
48.C均值算法的准则函数是什么?
49.C均值算法中确定初始代表点的方法有哪些?
50.C均值算法中如何对样本进行初始分类?
51. C均值算法有什么缺点?
52.K-L变换是如何应用于人脸识别的?
53.近邻法的基本思想是什么?
54.最近邻法和k近邻法有什么不同?K的选取有什么要求?
55. 为提高近邻法的时间效率和空间效率,有什么改进措施?
56.快速搜索近邻法的思想是什么?
57.剪辑近邻法的基本思想是什么?
58. 剪辑近邻法的算法的具体做法是什么?
59.压缩近邻法的基本思想是什么?
60.压缩近邻法的算法的具体做法是什么?
61.决策树的分类原理是什么?
62.建立决策树时特征选取的原则是什么?
63.ID3算法选择特征的方法是什么?
64随机森林进行分类的思想是什么?
65.C4.5算法在哪方面有改进?
66.C4.5算法如何对连续特征进行离散化处理?
67.cart算法建立的决策树的形式是什么?依据什么选择特征?
68.GIni指数怎么计算?
69.为什么要对决策树进行剪枝?
70.决策树有哪些剪枝的方法?
71.什么是特征的选择?什么是特征的提取?二者的区别是什么?
72. 常用的特征评价判据有哪些?
73.基于类内类间距离的可分性判据的基本思想是什么?
74基于概率分布的可分性判据的基本思想是什么?
75 .基于熵的可分性判据的思想是什么?
76.特征选择的最优算法有哪些?
77.分支定界法的基本思想是什么?
78.特征选择的次优算法有什么?
79.特征提取的方法有哪两种?
80.主成分分析的基本方法是什么?主成分指的是什么?
81.在主成分分析方法中新特征的选择标准是什么?
82.如何确定主成分的数量?
83.主成分分析的步骤有哪些?
84.K-L变换的原理是什么?
85.K-L变换所使用的准则函数是什么?
86.K-L变换的产生矩阵可以是什么形式?
87.K-L变换与PCA有什么区别和联系?