【文献阅读】Collective Decision for Open Set Recognition

news2025/4/8 6:35:57

基本信息

文献名称:Collective Decision for Open Set Recognition
出版期刊:IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
发表日期:04 March 2020
作者:Chuanxing Geng and Songcan Chen

摘要

在开集识别(OSR)中,几乎所有现有的方法都是专门为识别单个实例而设计的,即使这些实例是集体地成批出现的。识别者在决策中要么拒绝它们,要么使用经验设定的阈值将它们归类到某个已知的类。因此,决策阈值起着关键作用。然而,其选择往往依赖于已知类的知识,不可避免地会因缺乏未知类的可用信息而带来风险。另一方面,一个更现实的OSR系统不应该仅仅依赖于拒绝决策,而应该更进一步,特别是在发现拒绝实例中隐藏的未知类方面,而现有的OSR方法没有特别注意。提出了一种新的集体/批量决策策略,扩展了已有的OSR算法,并考虑了测试实例之间的相关性,实现了新类的发现.通过对层次狄利克雷过程(HDP)的改进,提出了一种基于集体决策的OSR框架(CD-OSR)。由于HDP的存在,我们的CD-OSR不需要定义判决阈值,可以同时实现开集识别和新类发现。最后,在基准数据集上的实验验证了CDOSR算法的有效性。

现在主要的方法

1.1-vs-Set Machine

核心思想:
基于支持向量机(SVM),通过引入“开放空间风险”(Open Space Risk)概念,限制已知类在特征空间的覆盖范围。
实现方式:
1.对每个已知类训练一个二元SVM,生成两个平行超平面(“A”和“B”),形成一个有限的“板层”(slab)区域。
2.测试实例若位于板层内,则分类为已知类;若位于板层外,则被拒绝为未知类。

在训练1-vs-Set机器之后,出现在两个超平面之间的测试实例将被标记为适当的类。否则,它将被视为非目标类或被拒绝,具体取决于它位于板的哪一侧。如第1节所述,1-vs-Set机器在一定程度上降低了开放空间风险。然而,它仍然占据着无限的空间,这意味着开放空间的风险仍然存在。

传统OSR方法的共同局限

阈值依赖:
分类边界依赖经验设定的阈值,缺乏对未知类分布的适应能力。
孤立决策:
逐个处理测试实例,忽略批次数据中的相关性信息。
无法发现新类:
仅能拒绝未知类,需额外步骤(如人工标注或后处理)才能发现新类。
静态模型:
训练后模型固定,无法动态适应新出现的类别。

COLLECTIVE DECISION FOR OPEN SET RECOGNITION(CD-OSR)

大概介绍

如前所述,当前现有的OSR方法是专门为识别单个实例而设计的,即使这些实例都是成批到达的。因此,决策中的识别器要么拒绝它们,要么使用预先设置的阈值将它们分类到某个已知的类实例中,其中这样的决策阈值起着关键作用。然而,它的选择通常是基于已知类的知识,不可避免地会产生风险,因为没有可用的信息从未知类。另一方面,一个更现实的OSR系统不应该仅仅停留在拒绝决策上,而应该更进一步,特别是在发现拒绝实例中隐藏的未知类方面。遗憾的是,现有的OSR方法没有给予太多关注。

为了克服这些局限性,我们引入了一种新的集体决策策略OSR问题的目的是扩展现有的开集识别新的类发现。具体地说,一个集体决策为基础的OSR框架(CD-OSR)提出了略有修改HDP。由于HDP的特性,我们的CD-OSR不需要定义决策阈值,可以自动为测试中的未知类预留空间,自然导致新的类发现功能。有趣的是,这也使得它能够同时处理OSR和新类发现。此外,对测试实例进行批量处理,使得CD-OSR考虑了现有方法明显忽略的实例之间的相关性。请注意,CD-OSR实际上可以处理批实例和单个实例。

接下来,我们首先简要回顾HDP,它广泛用于通过在组之间共享混合成分来对多组数据进行联合聚类。在HDP中,常用的术语是“组”或“组件”。然而,我们在这里适应HDP与轻微的修改OSR问题。在OSR场景下,“class”实际上对应于“group”,而“subclass”对应于“component”。

分层狄利克雷过程(HDP)的原理与公式推导

1.HDP的生成模型

HDP是一种层次化的贝叶斯非参数模型,用于建模多个组(groups)之间的共享结构。其核心思想是通过两个层次的Dirichlet过程(DP)实现组间子类的共享:
x j i x_{ji} xji的含义是观测数据,从参数 θ j i \theta _{ji} θji对应的分布 F ( θ j i ) F(\theta_{ji}) F(θji)中采样,然后,HDP框架完成如下:
G 0 G_0 G0是全局基分布(Global Base Distribution),由Dirichlet过程(DP)生成,参数为浓度参数 γ \gamma γ和基分布 H H H
G 0 ∣ γ , H ∼ D P ( γ , H ) G_0\mid \gamma ,H\sim \mathrm{DP(}\gamma ,H) G0γ,HDP(γ,H)
其作用是所有组(如不同类别)共享的全局子类分布。 G 0 G_0 G0是所有组中子类的“母版菜单”。

G j G_j Gj是组内分布,每个组 j j j的分布 G j G_j Gj由另一个Dirichlet过程生成,参数为浓度参数 α 0 \alpha_0 α0和基分布 G 0 G_0 G0
G j ∣ α 0 , G 0 ∼ D P ( α 0 , G 0 ) G_j\mid \alpha _0,G_0\sim \mathrm{DP(}\alpha _0,G_0) Gjα0,G0DP(α0,G0)
G j G_j Gj决定了组 j j j中子类的分布。 G j G_j Gj可以看做是从 G 0 G_0 G0中“继承”子类,但允许组内子类的个性化调整。

实例生成:
j j j中的实例 x j i x_{ji} xji的参数 θ j i \theta_{ji} θji G j G_j Gj中采样,数据 x j i x_{ji} xji由分布 F ( θ j i ) F(\theta_{ji}) F(θji)生成
θ j i ∣ G j ∼ G j , x j i ∣ θ j i ∼ F ( θ j i ) \theta _{ji}\mid G_j\sim G_j,\quad x_{ji}\mid \theta _{ji}\sim F(\theta _{ji}) θjiGjGj,xjiθjiF(θji)
下图是其图示结构
在这里插入图片描述

在这里插入图片描述

2. 中国餐馆特许经营Chinese Restaurant Franchise(CRF)

CRF实际上是在中国餐馆流程(CRP)的基础上扩展的,允许多个餐馆共享一套菜肴。
HDP的生成过程可以通过CRF直观解释:

  • 餐馆(组):每个组对应一个餐馆 j j j
  • 桌子(子类):每个餐馆中的桌子对应组内的子类 t j i t_{ji} tji
  • 菜品(全局子类参数):所有餐馆共享一个全局菜单,菜品对应全局子类的参数 ϕ k ∼ H \phi _k\sim H ϕkH
    顾客(实例 x j i x_{ji} xji)进入餐馆 j j j,选择一个桌子 t j i t_{ji} tji,桌子上提供菜品 ϕ k j t \phi _{kjt} ϕkjt。若桌子是新创建的,则从全局菜单中选择新菜品。

3.条件分布的推导

组内子类分布:
通过积分掉 G j G_j Gj G 0 G_0 G0,可以得到实例分配的条件分布:
θ j i ∣ θ j 1 , . . . , θ j , i − 1 , α 0 , G 0 ∼ ∑ t = 1 m j . n j t i − 1 + α 0 δ ψ j t + α 0 i − 1 + α 0 G 0 \theta _{ji}\mid \theta _{j1},...,\theta _{j,i-1},\alpha _0,G_0\sim \sum_{t=1}^{m_j.}{\frac{n_{jt}}{i-1+\alpha _0}\delta _{\psi _{jt}}}+\frac{\alpha _0}{i-1+\alpha _0}G_0 θjiθj1,...,θj,i1,α0,G0t=1mj.i1+α0njtδψjt+i1+α0α0G0
其中 n j t n_{jt} njt是组 j j j中桌子 t t t的顾客数, ψ j t \psi _{jt} ψjt是桌子的参数。
公式含义:实例 x j t x_{jt} xjt以概率 n j t i − 1 + α 0 \frac{njt}{i-1+\alpha _0} i1+α0njt分配到已有桌子,或以概率 α 0 i − 1 + α 0 \frac{\alpha _0}{i-1+\alpha _0} i1+α0α0创建新桌子。
全局子类分布:
ψ j t ∣ ψ 11 , . . . , ψ j − 1 , γ , H ∼ ∑ k = 1 K m . k m . . + γ δ ϕ k + γ m . . + γ H \psi _{jt}\mid \psi _{11},...,\psi _{j-1},\gamma ,H\sim \sum_{k=1}^K{\frac{m_{.k}}{m_{..}+\gamma}\delta _{\phi _k}}+\frac{\gamma}{m_{..}+\gamma}H ψjtψ11,...,ψj1,γ,Hk=1Km..+γm.kδϕk+m..+γγH

其中 m . k m_{.k} m.k是所有组中分配到菜品 ϕ k \phi _k ϕk的桌子数, m . . = ∑ k m . k m..=\sum_k{m._k} m..=km.k δ ϕ k \delta_{\phi _k} δϕk表示 ϕ k \phi _k ϕk处的狄拉克测度。
其表达的含义是,新桌子以概率 m ⋅ k m . . + γ \frac{m\cdot k}{m..+\gamma} m..+γmk选择已有菜品,或以概率 γ m . . . + γ \frac{\gamma}{m...+\gamma} m...+γγ生成新菜品 ϕ K + 1 ∼ H \phi _{K+1}\sim H ϕK+1H

Gibbs Sampling

在CD-OSR框架中,公式(10)和(11)是Gibbs采样过程的核心
在这里插入图片描述

论文中公式(10)的物理意义
在这里插入图片描述
物理意义:
分配到已有桌子:
概率与当前桌子的“人气”(顾客数 n j t n_{jt} njt)和生成该实例的似然成正比。
举例:若桌子 t t t上已有许多相似实例(高 n j t n_{jt} njt和高似然),新实例更可能加入该桌子。

(10)的第2行的公式表达的是,等号右边第一项是新的餐桌,点已有顾客点过的菜的概率之和。第二项是该新的餐桌点一道新的菜的概率。

公式(11)的物理意义
在这里插入图片描述

在这里插入图片描述
物理意义:
选择已有菜品:
概率与全局中该菜品的“流行度”(被选次数 m . k m_{.k} m.k)和生成数据的似然成正比。
举例:若菜品 k k k已被多个组使用(高 m . k m_{.k} m.k),新桌子更可能选择它。
在实际应用中:
在这里插入图片描述
由于上述分层狄利克雷过程(HDP)的性质适合我们的问题,我们在这里调整HDP略有修改,以解决OSR问题。因此,一个集体决策为基础的OSR框架(CD-OSR)的建议作为一个初步的解决方案,对集体决策的开集识别。具体地,CD-OSR如下工作。

中国餐馆特许经营(CRF)模型与HDP符号的对应关系

(1) 餐馆(Restaurant) ↔ 组(Group)

  • 每个餐馆对应HDP中的一个组(Group),例如一个已知类(如“猫”)或测试集。
  • j j j的分布 G j ∼ D P ( α 0 , G 0 ) G_j\sim \mathrm{DP(}\alpha _0,G_0) GjDP(α0,G0)

(2) 顾客(Customer) ↔ 实例 x j i x_{ji} xji

  • 顾客是进入餐馆的个体,对应数据实例 x j i x_{ji} xji(组 j j j中的第 i i i个实例)。
  • x j i ∼ F ( θ j i ) x_{ji}\sim F(\theta _{ji}) xjiF(θji),其中 θ j i \theta_{ji} θji是子参数。

(3) 桌子(Table) ↔ 子类分配 t j i t_{ji} tji

  • 桌子是组内的子类(Component),实例 x j i x_{ji} xji​被分配到某个桌子 t j i t_{ji} tji,对应子类归属。
  • θ j i = ψ j t j i \theta _{ji}=\psi _{jt_{ji}} θji=ψjtji(桌子参数)。

(4) 菜品(Dish) ↔ 全局子类参数 ϕ k \phi_k ϕk

  • 菜品是全局共享的子类参数 ϕ k \phi_k ϕk ,所有餐馆的桌子从同一份菜单选择菜品。
  • ψ j t = ϕ k j t \psi _{jt}=\phi _{kjt} ψjt=ϕkjt(桌子 t t t的菜品参数)。

(5) 菜单(Menu) ↔ 全局基分布 G 0 G_0 G0

  • 菜单是所有餐馆共享的全局子类分布 G 0 G_0 G0 ,由基分布 H H H生成。
  • G 0 ∼ D P ( γ , H ) G_0\sim \mathrm{DP(}\gamma ,H) G0DP(γ,H),菜单中的菜品是 ϕ 1 , ϕ 2 , . . . . \phi_1,\phi_2,.... ϕ1ϕ2,....

(6) 厨师长(Chef) ↔ 基分布 H H H

  • 厨师长决定菜品的生成规则,对应基分布 H H H ,由基分布 H H H(如高斯-威沙特分布)。
  • ϕ k ∼ H \phi _k\sim H ϕkH,每个菜品参数从 H H H中采样。

在这里插入图片描述

CD-OSR的实现与公式推导

CD-OSR原理

CD-OSR通过改进的HDP框架,将开放集识别转化为动态聚类问题,具体原理如下:

层次化子类共享

全局基分布 G 0 G_0 G0
所有组(已知类和测试集)共享一个全局子类分布 G 0 G_0 G0,由Dirichlet过程生成:
G 0 ∣ γ , H ∼ D P ( γ , H ) G_0\mid \gamma ,H\sim \mathrm{DP(}\gamma ,H) G0γ,HDP(γ,H)
其中 H H H是基分布(如高斯-威沙特分布), γ \gamma γ控制全局子类数量。
全局子类数量 G j G_j Gj
每个组 j j j已知类或测试集)的子类分布由 G 0 G_0 G0继承
G j ∣ α 0 , G 0 ∼ D P ( α 0 , G 0 ) G_j\mid \alpha _0,G_0\sim \mathrm{DP(}\alpha _0,G_0) Gjα0,G0DP(α0,G0)
α 0 \alpha_0 α0控制组内子类的生成频率,值越大,组内子类越多。

动态子类分配

通过Gibbs采样迭代更新以下变量:
1.测试实例的桌子分配 t j i t_{ji} tji:
决定实例属于已有子类还是新子类(公式10)。
2.桌子的菜品分配 k j t k_{jt} kjt
决定子类继承全局参数还是生成新参数(公式11)。

无需阈值的开放集识别

已知类判定:若测试实例分配到已知类的子类(对应某个 ϕ k \phi _k ϕk),则分类为已知类。
新类发现:若分配到新子类(从 H H H生成 ϕ K + 1 \phi _{K+1} ϕK+1),则标记为未知类,并扩展全局子类集合。

1.CD-OSR的核心

CD-OSR将HDP适配到开放集识别场景,主要修改如下:
组定义:每个已知类是一个组,测试集整体作为另一个组。
子类过滤:剔除占比过低的子类,防止过拟合。
分类规则:测试实例分配到已知类的子类则分类为已知类,否则标记为未知类。

2. 训练阶段

1.数据划分:
训练集分为拟合集 F \mathcal{F} F和验证集 V \mathcal{V} V,用于参数调优。
训练集:
已知类别的实例集合,每个类别单独分组。 X t r = { X 1 , X 2 , . . . , X J } X_{\mathrm{tr}}=\{X_1,X_2,...,X_J\} Xtr={X1,X2,...,XJ},其中 X j X_j Xj表示第 j j j个已知类的实例集。
测试集:
待分类的实例集合,可能包含已知类和未知类。
X t s = { x 1 , x 2 , . . . , x N } X_{\mathrm{ts}}=\{x_1,x_2,...,x_N\} Xts={x1,x2,...,xN}
超参数:
HDP的浓度参数: α 0 \alpha_0 α0(控制组内子类数量), γ \gamma γ(控制全局子类共享程度)。
基分布 H H H的参数(如高斯-威沙特分布的 μ 0 , Σ 0 , β , ν ) \mu _0,\Sigma _0,\beta ,\nu) μ0,Σ0,β,ν)
子类过滤阈值 ϵ \epsilon ϵ(如 ϵ = 0.01 \epsilon=0.01 ϵ=0.01,过滤占比过低的子类)

2.参数初始化:
基分布 H H H设为高斯-威沙特分布:
H = N ( μ ∣ μ 0 , ( β Σ ) − 1 ) ⋅ W ( Σ ∣ Σ 0 , ν ) H=\mathcal{N} (\mu \mid \mu _0,(\beta \Sigma )^{-1})\cdot \mathcal{W} (\Sigma \mid \Sigma _0,\nu ) H=N(μμ0,(βΣ)1)W(ΣΣ0,ν)

3.测试阶段

1.测试集作为新组输入
输入形式:
测试集整体被视为一个新的组(称为“Testing-set组”),与训练集的已知类组(如Class 1-4)共同参与共聚类。
作用:
将测试实例的分布与已知类分布对齐,利用全局子类共享机制实现分类。
2.共聚类(Co-clustering)
过程:
使用Gibbs采样对测试集和已知类组进行联合建模,动态分配实例到子类。具体操作包括:
更新桌子分配(公式10):测试实例可能分配到已知类的子类(已有桌子)或创建新子类(新桌子)。
更新菜品分配(公式11):新子类继承全局参数或生成新参数。
输出:
测试实例的子类归属,以及全局子类参数的更新。
3.分类决策
规则:
若测试实例分配到已知类组的子类,则分类为该已知类。
若分配到测试集组的新子类(从基分布 H H H生成),则标记为未知类
4.新类发现
统计新子类数目:
测试集中新子类的数量反映潜在未知类的存在。例如,若测试集组有5个新子类,可能对应1个未知类(假设每个类有多个子类)。
估计公式:
Δ = ⌈ ∣ S u n k n o w n ∣ ∣ S k n o w n ∣ / ( J − 1 ) ⌉ \left. \Delta =\left. \lceil \frac{|S_{\mathrm{unknown}}|}{|S_{\mathrm{known}}|/(J-1)} \right. \right. \rceil Δ=Sknown∣/(J1)Sunknown
其中 ∣ S u n k n o w n ∣ |S_{\mathrm{unknown}}| Sunknown是测试集的新子类数, ∣ S k n o w n ∣ |S_{\mathrm{known}}| Sknown是已知类的子类总数, J − 1 J-1 J1是已知类数量。
在这里插入图片描述
图2直观展示了CD-OSR框架在测试阶段的共聚类过程,具体元素如下:

组(Groups):
已知类组:如Class 1-4,每个类作为独立组,内部包含若干子类(如Class 1有子类A、B)。
测试集组(Testing-set):作为新组参与聚类,其子类可能部分与已知类共享,部分为新生成。
子类(Subclasses):
已知子类(Known subclasses):用实心圆表示,颜色与已知类对应(如Class 1为蓝色)。
新子类(New subclasses):用不同颜色的圆表示,属于测试集组独有的子类。
共享关系:
无连线的新子类:表示测试集中的未知类(如子类D仅属于Testing-set)。
分类结果示例:
测试实例分配到子类A(属于Class 1)→ 分类为已知类。
测试实例分配到子类D(新子类)→ 标记为未知类。

CD-OSR的伪代码

在这里插入图片描述
1.首先对参数进行初始化

1. 输入训练集 X_tr 和测试集 X_ts,按实验协议划分(如Section 4.1.1)。
2. 按类别标签将训练集 X_tr 划分为组:X_tr = [X_tr1, X_tr2, ...](每个组对应一个已知类)。
3. 初始化参数:
   - 基分布 H 的参数:μ0(训练集均值),Σ0(缩放后的协方差矩阵,公式13),β=1,ν通过网格搜索选择。
   - 浓度参数:α0 ~ Gamma(10,1),γ ~ Gamma(100,1)- 迭代次数 T = 30,初始子类数 InS = 30- 子类过滤阈值 ε = 0.01

2.然后进行共聚类

 - 将训练集和测试集合并为输入数据:Data = [X_tr; X_ts]
 - 调用HDP软件包(如Teh的代码)进行共聚类:
   Results = HDP(Data, α0, γ, H, InS, T)
   其中:
 - HDP框架对每个组(已知类和测试集)建模。
 - 迭代T次Gibbs采样,更新子类分配。

Gibbs采样迭代:

  • 对每个实例 x j i x_{ji} xji,按公式(10)更新桌子分配 t j i t_{ji} tji
  • 对每个新桌子 t n e w t^{new} tnew,按公式(11)更新菜品分配。
  • 更新全局子类参数 ϕ k \phi _{k} ϕk (如高斯分布的均值和协方差)。

作用:
训练集和测试集共同参与聚类,动态分配子类。

测试集的新子类反映潜在未知类。
3.确定子类(Determining the Subclasses)

6. 后处理共聚类结果:
   for 每个组 j 的每个子类 s:
      计算子类 s 在组 j 中的占比 ρ = (子类s的实例数) / (组j的总实例数)
      if ρ < ε:
          移除该子类 s

作用:
过滤掉占比过低的子类(如噪声或离群点),提升模型鲁棒性。

例如,若某子类仅占0.5%的实例(ε=0.01),则被剔除。
4.预测

7. 对新实例 x_new 进行分类:
   a. 将 x_new 加入测试集组,重新运行共聚类(仅更新局部分配)。
   b. 根据分配结果:
      if x_new 的子类属于某个已知类 j 的子类 s:
          标记为类 j
      else:
          标记为未知类,并记录新子类参数
8. 估计未知类数目 Δ(公式14):
   Δ = ceil(|S_unknown| / (|S_known| / (J-1)))

作用:

新实例的分类基于其子类归属,无需人工设定阈值。

新子类的数量通过全局子类比例估计未知类数目。
在这里插入图片描述

结论

本文的主要贡献是提出了一种集体/分批决策的开集识别策略,旨在将现有的开集识别扩展到新的类发现中,同时考虑测试实例之间的相关性。为了实现这一目标,我们将HDP稍作修改以解决OSR问题,从而为OSR中的集体决策提供了初步解决方案。需要强调的是,我们的CD-OSR并不过分依赖于训练数据,并且能够随着数据的变化而实现自适应变化。更准确地说,CD-OSR可以为测试中出现的未知类提供显式建模。这自然会导致新的类发现功能,即使它只是在子类级别。此外,与现有方法从判别模型的角度处理OSR问题不同,CD-OSR实际上是从生成模型的角度来解决这一问题的,这是由于使用了HDP。最后,在一组标准数据集上的实验结果表明了该学习框架的有效性.

此外,应该注意的是,建模未知类只在我们的CD-OSR的测试阶段进行,而在训练阶段没有利用未知类的可用知识。这在某种程度上似乎带有懒惰的味道。因此,克服这一局限性将是未来一个很有前途的研究方向。此外,由于CDOSR目前没有充分利用来自已知类别标签的判别信息,因此更有效地嵌入此类信息也值得进一步探索。此外,用可扩展的确定性推理技术取代Gibbs采样器也是未来工作的一个很有前途的方向。总之,CDOSR只是目前对开集识别向集体决策发展的一个概念性证明。因此,更有效的OSR集体决策方法值得在未来的工作中进一步探索。

后续思考

相比于传统的HDP,本文章改进并非对HDP/CRF的数学框架进行颠覆,而是针对开放集识别的需求,调整模型的应用逻辑和训练策略:

1.问题驱动:将HDP从无监督聚类任务转向开放集分类任务。

2.结构适配:通过组间隔离、子类过滤、动态扩展等策略,使模型能区分已知类与未知类。

3.目标融合:联合实现分类(已知类)与发现(未知类),而非单纯聚类。

这种改进类似于“用已有的乐高积木搭建一座新房子”——积木本身不变,但组合方式和目标用途完全不同。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2308920.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

力扣刷题DAY2(链表/简单)

一、回文链表 回文链表 方法一&#xff1a;双指针 /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode() : val(0), next(nullptr) {}* ListNode(int x) : val(x), next(nullptr) {}* ListNode(int x, L…

ansible自动化运维工具学习笔记

目录 ansible环境部署 控制端准备 被控制端准备 ansible批量管理主机的方式主要有两种 配置准备&#xff1a; ssh密码认证方式管理机器 密码登录&#xff0c;需要各主机密码相同 配置免密登录 ssh密钥方式批量管理主机 ansible实现批量化主机管理的模式 ansible-doc命令 comman…

网络空间安全(4)web应用程序安全要点

前言 Web应用程序安全是确保Web应用程序、服务和服务器免受网络攻击和威胁的关键环节。 一、编写安全的代码 输入验证与过滤&#xff1a;确保所有的用户输入都被正确验证和过滤&#xff0c;以防止注入攻击等安全漏洞。开发者应对URL、查询关键字、HTTP头、POST数据等进行严格的…

【word】保存重开题注/交叉引用消失,全局更新域问题

目录 一、更新域是什么二、更新域常见问题及解决方法&#xff08;一&#xff09;更新域后内容未变化&#xff08;二&#xff09;域代码显示异常&#xff08;三&#xff09;交叉引用无法更新&#xff08;四&#xff09;全选更新域出现错误 三、交叉引用与题注的关系及操作&#…

DeepSeek的无限可能

DeepSeek的无限可能 DeepSeek简介DeepSeek定义DeepSeek的发展历程DeepSeek的核心功能 如何使用DeepSeek注册与安装模型使用原则提示语的使用 人机共生 DeepSeek简介 DeepSeek定义 DeepSeek&#xff08;中文名&#xff1a;深度求索&#xff09;是一款由杭州深度求索人工智能基…

【wordpress】服务器已有LNMP环境(已运行WordPress),如何配置文档访问功能?

效果如图步骤确定文件存放目录404.html修改配置文件重启nginx服务 接下来是从win向linux云服务器上传文件使用Samba服务&#xff08;没成功&#xff09;使用xshell上传文件&#xff08;大文件上传一堆乱码&#xff09;winscp&#xff08;好用&#xff09; 效果如图 如果url不对…

Hadoop之01:HDFS分布式文件系统

HDFS分布式文件系统 1.目标 理解分布式思想学会使用HDFS的常用命令掌握如何使用java api操作HDFS能独立描述HDFS三大组件namenode、secondarynamenode、datanode的作用理解并独立描述HDFS读写流程HDFS如何解决大量小文件存储问题 2. HDFS 2.1 HDFS是什么 HDFS是Hadoop中的一…

Redis学习笔记系列(一)——Redis简介及安装

1. Redis介绍 Redis是完全开源的&#xff0c;遵守 BSD 协议&#xff0c;是一个高性能的 key-value 数据库。 Redis与其他key-value缓存产品有以下三个特点&#xff1a; Redis支持数据的持久化&#xff0c;可以将内存中的数据保存在磁盘中&#xff0c;重启的时候可以再次加载进行…

【考试大纲】初级信息处理技术员考试大纲

目录 引言一、考试说明1.考试要求2.考试目标二、考试范围科目一:信息处理基础知识科目二:信息处理应用技术引言 最新的信息处理技术员考试大纲出版于 2018 年 6 月,本考试大纲基于此版本整理。 一、考试说明 1.考试要求 (1)了解信息技术的基本概念; (2)熟悉计…

LabVIEW正弦信号处理:FFT与最小二乘拟合的参数提取

问题一&#xff1a;LabVIEW能否对采集的正弦力信号进行快速傅里叶变换&#xff08;FFT&#xff09;&#xff0c;并得到幅值和相位结果&#xff1f; 答案&#xff1a; 可以。LabVIEW通过内置信号处理工具包提供完整的FFT分析功能&#xff0c;具体实现如下&#xff1a; FFT分析流…

【计算机网络入门】初学计算机网络(五)

目录 1.编码&解码、调制&解调 2.常用编码方法 2.1 不归零编码&#xff08;NRZ&#xff09; 2.2 归零编码(RZ) 2.3 反向非归零编码(NRZI) 2.4 曼彻斯特编码 2.5 差分曼彻斯特编码 3. 各种编码的特点 4.调制 5.有线传输介质 5.1 双绞线 5.2 同轴电缆 5.3 光…

YOLO在PiscTrace上检测到数据分析

在现代计算机视觉领域&#xff0c;实时视频数据的检测与分析对于安全监控、交通管理以及智能制造等领域具有重要意义。YOLO&#xff08;You Only Look Once&#xff09;作为一种高效的目标检测算法&#xff0c;能够在保持高精度的同时实现实时检测。而PiscTrace作为一款集成了O…

【漫话机器学习系列】112.逻辑回归(Logistic Regression)

逻辑回归&#xff08;Logistic Regression&#xff09;详解 1. 逻辑回归简介 逻辑回归&#xff08;Logistic Regression&#xff09;是一种广泛用于二分类任务的统计和机器学习方法&#xff0c;尽管它的名字中带有“回归”&#xff0c;但它实际上是一种分类算法。 在逻辑回归…

【计算机网络入门】初学计算机网络(六)

目录 1.回忆数据链路层作用 2. 组帧 2.1 四种组帧方法 2.1.1 字符计数法 2.1.2 字节填充法 2.1.3 零比特填充法 2.1.4 违规编码法 3. 差错控制 3.1 检错编码 3.1.1 奇偶校验码 3.1.2 CRC&#xff08;循环冗余校验&#xff09;校验码 3.2 纠错编码 3.2.1 海明校验码…

DeepSeek 与云原生后端:AI 赋能现代应用架构

&#x1f4dd;个人主页&#x1f339;&#xff1a;一ge科研小菜鸡-CSDN博客 &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339; 1. 引言 在当今快速发展的互联网时代&#xff0c;云原生&#xff08;Cloud Native&#xff09;架构已成为后端开发的主流趋势。云…

leetcode第17题求电话号码组合

原题出于leetcode第17题https://leetcode.cn/problems/letter-combinations-of-a-phone-number/description/题目如下&#xff1a; 题目稍微有点复杂&#xff0c;初看会感觉特别复杂&#xff0c;首先我们需要理清思路&#xff1a; 最后的结果是字母组合&#xff0c;因此遍历的是…

DeepSeek-R1 论文笔记:通过强化学习提升大语言模型的推理能力

论文标题&#xff1a;DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning 作者团队&#xff1a;DeepSeek-AI 发表时间&#xff1a;2025 前置知识 & 术语 模型蒸馏 语言模型蒸馏的目标是将大型教师模型的知识&#xff08;如语义理解、上…

PDF文档中表格以及形状解析

我们在做PDF文档解析时有时需要解析PDF文档中的表格、形状等数据。跟解析文本类似的常见的解决方案也是两种。文档解析跟ocr技术处理。下面我们来看看使用文档解析的方案来做PDF文档中的表格、图形解析&#xff08;使用pdfium库&#xff09;。 表格解析&#xff1a; 在pdfium库…

深入理解并实现自定义 unordered_map 和 unordered_set

亲爱的读者朋友们&#x1f603;&#xff0c;此文开启知识盛宴与思想碰撞&#x1f389;。 快来参与讨论&#x1f4ac;&#xff0c;点赞&#x1f44d;、收藏⭐、分享&#x1f4e4;&#xff0c;共创活力社区。 在 C 的标准模板库&#xff08;STL&#xff09;中&#xff0c;unorder…

228页PPT丨制造业核心业务流程优化咨询全案(战略营销计划生产研发质量),附核心系统集成架构技术支撑体系,2月26日资料已更新

一、订单全生命周期管理优化 1. 智能订单承诺&#xff08;CTP&#xff09;系统 ●集成ERP/APS/MES数据&#xff0c;实时计算产能可视性 ●应用蒙特卡洛模拟评估订单交付风险 ●建立动态插单评估模型&#xff08;基于边际贡献与产能占用系数&#xff09; 2. 跨部门协同机制…