传统神经网络、CNN与RNN

news2025/4/2 7:19:29

在网络上找了很多关于深度学习的资料,也总结了一点小心得,于是就有了下面这篇文章。这里内容较为简单,适合初学者查看,所以大佬看到这里就可以走了。

话不多说,上图

传统神经网络
卷积神经网络 CNN
循环神经网络 RNN
ResNet
Inception
LSTM
GRU
图像生成
机器翻译

从上图可以看出,传统神经网络算是另外两个神经网络的母体,所以这三者之间真要比较也一般都是拿CNN与RNN进行比较,很少看到拿三者一起比较的,很多初学者在这里就有所误解,以为三个神经网络是同时期的不同网络架构。

为了让大家更容易理解,这里整理了一组思维导图,解析三者神经网络的区别:
在这里插入图片描述

一、传统神经网络

传统神经网络(Traditional Neural Network)是指没有采用现代深度学习技术(如残差连接、批归一化、注意力机制等)的早期人工神经网络。它们通常由简单的全连接层或卷积层堆叠而成,其结构和训练方法相对基础。以下是传统神经网络的详细解释:

传统神经网络是一种基于生物学神经元模型的计算模型,通过多层非线性变换处理输入数据。其核心思想是通过“逐层传递”的方式将输入数据映射到输出结果,每一层的神经元通过权重和激活函数进行计算。

1.1 典型结构

传统神经网络的结构通常包括以下部分:

(1) 输入层
  • 功能:接收原始数据(如像素值、文本特征)。
  • 示例:MNIST 手写数字识别的输入层是 784 维向量(28×28 像素)。
(2) 隐藏层
  • 全连接层(Dense Layer)
    • 每个神经元与前一层的所有神经元相连。
    • 计算公式: z = W ⋅ x + b , a = σ ( z ) z=W\cdot x+b, a=\sigma (z) z=Wx+b,a=σ(z),( σ \sigma σ为激活函数)。
  • 激活函数
    • Sigmoid:将输出压缩到 [0,1],但存在梯度消失问题。
    • Tanh:输出范围 [-1,1],缓解梯度消失但未彻底解决。
    • ReLU:早期传统网络较少使用,因其可能导致神经元死亡。
(3) 输出层
  • 多分类任务:使用 Softmax 激活函数,输出类别概率。
  • 回归任务:使用线性激活函数(无激活函数)。

1.2 典型网络

传统神经网络算是人工智能领域的奠基性模型,典型结构包含输入层、隐藏层和输出层,通过非线性激活函数和权重连接实现特征映射。根据连接方式,可分为三大类:

  1. 前馈神经网络

    • 结构:单向传递信息,无反馈连接(如感知机、BP神经网络)。
    • 应用:简单分类、回归问题(如手写数字识别)。
    • 局限性:无法捕捉数据中的时序依赖或空间相关性。
  2. 反馈神经网络

    • 结构:包含循环连接(如Hopfield网络、Elman网络)。
    • 应用:联想记忆、动态系统建模。
    • 局限性:梯度消失/爆炸问题显著,难以处理长序列。
  3. 自组织神经网络

    • 结构:无监督学习,自动聚类输入数据(如Kohonen网络)。
    • 应用:数据降维、模式发现。

代码示例:

from keras.models import Sequential
from keras.layers import Dense

# MNIST手写数字识别示例
dnn_model = Sequential([
    Dense(512, activation='relu', input_shape=(784,)),
    Dense(256, activation='relu'),
    Dense(10, activation='softmax')
])
dnn_model.compile(optimizer='adam', loss='categorical_crossentropy')

1.3 训练问题

传统神经网络在训练中面临以下挑战:

(1) 梯度消失/爆炸
  • 原因:链式求导导致梯度在反向传播中指数级衰减(消失)或增长(爆炸)。
  • 影响:深层网络无法有效更新权重,训练停滞。
(2) 过拟合
  • 原因:网络容量过大,记忆噪声数据。
  • 解决方案
    • 正则化(如 L2 正则化)。
    • Dropout(早期传统网络较少使用)。
(3) 优化困难
  • 问题:梯度方向不准确,陷入局部最优。
  • 改进:使用更优的优化器(如 Adam),但传统网络通常依赖 SGD。

1.4 局限性

虽然对当时的来说传统神经网络以及很优秀,但是我们现在来看,传统神经网络还是有很大的缺点,其中最为限制其性能的就是以下三点:

  • 深度限制:难以训练超过 20 层的网络。
  • 特征提取能力:依赖手工特征(如 SIFT、HOG),而非端到端学习。
  • 计算效率:全连接层参数量巨大,如 1000 层的网络可能包含数亿参数。

1.5 典型应用

在了解了上面的这些之后我们再来了解一下它的发展历史,传统神经网络的应用总共有以下在节点:

  • 图像识别:LeNet-5(1998 年,手写数字识别)。
  • 语音识别:深度信念网络(DBNs)。
  • 自然语言处理:循环神经网络(RNNs)的早期应用。

1.6 与现代网络的对比

将传统神经网络拿到现在来对比,可以看出传统神经网络架构还是较为单一:

特性传统神经网络现代神经网络(如 ResNet)
残差连接有(解决梯度消失)
激活函数Sigmoid/Tanh 为主ReLU/Swish/GELU 为主
归一化批归一化(BatchNorm)
深度浅(通常 <20 层)深(如 ResNet-152 有 152 层)
特征学习依赖手工特征端到端学习

总结:从上述的介绍我们可以看出,传统神经网络是深度学习的基础,但受限于梯度消失、过拟合和计算效率等问题,难以构建更深层、更复杂的模型。现代网络(如 ResNet、Transformer)通过引入残差连接、批归一化、注意力机制等创新,突破了这些限制,推动了 AI 技术的革命性发展。

二、卷积神经网络(CNN):空间特征的提取专家

卷积神经网络(Convolutional Neural Network, CNN)是一种专门设计用于处理网格状数据(如图像、音频、视频)的深度学习模型。它通过卷积层、池化层和全连接层的组合,能够自动提取数据的层次化特征,在计算机视觉领域取得了革命性突破。其核心优势在于局部连接权重共享,大幅减少参数数量并提升平移不变性。

输入图像
卷积层
池化层
卷积层
池化层
全连接层
分类结果

2.1 CNN的核心思想

  • 局部连接:每个神经元仅连接输入的局部区域(如图像的一个小窗口),而非全部像素。
  • 参数共享:同一卷积核的参数在整个输入中共享,大幅减少参数量。
  • 层级特征提取:浅层学习边缘、纹理等低级特征,深层学习形状、物体部件等高级特征。

2.2 典型结构

CNN的结构通常包含以下模块:

(1) 输入层
  • 图像输入:形状为 (高度, 宽度, 通道数),如RGB图像为 (224, 224, 3)
  • 预处理:归一化(如像素值缩放到 [0,1])和标准化(均值为0,方差为1)。
(2) 卷积层(Convolutional Layer)
  • 功能:通过滑动窗口(卷积核)提取局部特征。
  • 关键参数
    • 核大小:如 3x35x5,决定感受野大小。
    • 步长(Stride):窗口滑动的步幅,步长为2时特征图尺寸减半。
    • 填充(Padding):在输入边缘填充0,保持特征图尺寸。
  • 输出形状
    输出尺寸 = 输入尺寸 − 核大小 + 2 × 填充 步长 + 1 \text{输出尺寸} = \frac{\text{输入尺寸} - \text{核大小} + 2 \times \text{填充}}{\text{步长}} + 1 输出尺寸=步长输入尺寸核大小+2×填充+1
(3) 激活函数
  • ReLU:最常用激活函数,公式为 ( f(x) = \max(0, x) ),解决梯度消失问题。
  • Swish/GELU:更平滑的激活函数,提升深层网络性能。
(4) 池化层(Pooling Layer)
  • 功能:降低特征图尺寸,减少计算量,增强平移不变性。
  • 类型
    • 最大池化(Max Pooling):取窗口内最大值。
    • 平均池化(Average Pooling):取窗口内平均值。
  • 示例MaxPool2D(pool_size=(2,2)) 将特征图尺寸减半。
(5) 全连接层(Fully Connected Layer)
  • 功能:将提取的特征映射到最终分类结果。
  • 结构:每个神经元与前一层所有神经元相连。
  • 输出层
    • 多分类任务:使用 Softmax 激活函数,输出类别概率。
    • 回归任务:使用线性激活函数。
(6) 正则化技术
  • 批量归一化(BatchNorm):标准化特征分布,加速训练。
  • Dropout:随机丢弃神经元,防止过拟合。

2.3 CNN的优势

特性传统神经网络CNN
局部连接全连接,参数量爆炸局部连接,参数大幅减少
平移不变性需手动设计特征自动学习平移不变特征
层级特征依赖手工特征端到端学习层次化特征
计算效率高(全连接层参数量大)低(卷积层参数共享)

2.4 经典CNN模型

模型特点应用场景
LeNet-5首个成功的CNN(1998),用于手写数字识别MNIST、OCR
AlexNet现代CNN的奠基模型(2012),引入ReLU和DropoutImageNet分类
VGGNet加深网络(16-19层),验证深度重要性图像分类、特征提取
ResNet引入残差连接,解决梯度消失问题图像分类、目标检测
YOLO实时目标检测模型,融合CNN与回归自动驾驶、安防监控

2.5 工作流程示例(MNIST识别)

在这里插入图片描述

  1. 卷积层:提取边缘、曲线等低级特征。
  2. 池化层:降低特征图尺寸,保留关键信息。
  3. 全连接层:整合全局特征,输出数字概率。

代码示例:

from keras.layers import Conv2D, MaxPooling2D, Flatten

# CIFAR-10图像分类
cnn_model = Sequential([
    Conv2D(32, (3,3), activation='relu', input_shape=(32,32,3)),
    MaxPooling2D((2,2)),
    Conv2D(64, (3,3), activation='relu'),
    MaxPooling2D((2,2)),
    Flatten(),
    Dense(128, activation='relu'),
    Dense(10, activation='softmax')
])

6. 应用领域

  • 图像分类:识别物体类别(如ImageNet挑战赛)。
  • 目标检测:定位并分类图像中的多个物体(如COCO数据集)。
  • 语义分割:像素级分类(如医学影像分析)。
  • 视频分析:动作识别、异常检测(如UCF101数据集)。
  • 自然语言处理:文本分类、情感分析(如TextCNN)。

总结: CNN通过局部连接、参数共享和层级特征提取,成为处理图像和视频数据的首选模型。其成功推动了计算机视觉的革命,并为后续模型(如Transformer)奠定了基础。理解CNN的结构和原理是深入学习深度学习的关键一步。

三、循环神经网络(RNN)

RNN(循环神经网络,Recurrent Neural Network)是一种专门处理序列数据(如文本、语音、时间序列等)的神经网络架构。与传统前馈神经网络(如CNN)不同,RNN通过循环连接(Recurrent Connection)引入了时间维度上的记忆能力,允许信息在网络中传递和保留。

其通过隐藏状态传递机制捕捉长期依赖。经典公式如下:
h t = tanh ⁡ ( W x h x t + W h h h t − 1 + b h ) h_t = \tanh(W_{xh}x_t + W_{hh}h_{t-1} + b_h) ht=tanh(Wxhxt+Whhht1+bh)
y t = softmax ( W h y h t + b y ) y_t = \text{softmax}(W_{hy}h_t + b_y) yt=softmax(Whyht+by)

3.1 核心特点

  1. 循环结构
    RNN的隐藏层不仅接收当前输入,还接收上一时刻的隐藏状态,形成“循环”信息流。公式表示为:
    h t = σ ( W x h x t + W h h h t − 1 + b h ) h_t = \sigma(W_{xh}x_t + W_{hh}h_{t-1} + b_h) ht=σ(Wxhxt+Whhht1+bh)
    其中, h t h_t ht是当前时刻的隐藏状态, x t x_t xt是输入, σ \sigma σ是激活函数(如tanh)。

  2. 时间依赖性
    能够捕捉序列中的长期依赖关系(如句子中的上下文关联),但传统RNN存在梯度消失/爆炸问题,导致难以学习长期依赖。

  3. 变体改进

    • LSTM(长短期记忆网络):通过门控机制(输入门、遗忘门、输出门)解决长期依赖问题。
    • GRU(门控循环单元):简化版LSTM,参数更少,训练效率更高。

核心挑战:梯度消失/爆炸

  • 解决方案
    • 使用ReLU激活函数
      -引入门控机制(LSTM、GRU)
      -梯度裁剪

LSTM结构解析

  • 遗忘门:决定保留多少历史信息
  • 输入门:控制新信息的流入
  • 输出门:调节隐藏状态的输出

3.2 与CNN的对比

特性CNNRNN
结构前馈,空间局部连接循环,时间序列连接
适用数据图像、网格数据文本、语音、时间序列
记忆能力有(短期依赖为主)
典型应用图像分类、目标检测语言模型、语音识别

3.3 应用领域

  1. 自然语言处理(NLP)
    • 语言模型(如GPT系列)
    • 机器翻译、情感分析、文本生成
  2. 时间序列预测
    • 股票走势预测、天气预测
  3. 语音处理
    • 语音识别、说话人识别
  4. 视频分析
    • 动作识别、视频描述生成

优缺点

  • 优点
    • 擅长处理序列数据中的时间依赖关系。
    • 结构灵活,可根据任务调整层数和单元类型(LSTM/GRU)。
  • 缺点
    • 传统RNN存在梯度消失问题,难以捕捉长期依赖。
    • 并行计算能力差,训练速度较慢(LSTM/GRU有所改善)。

代码示例(文本生成):

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense

model = Sequential([
    LSTM(128, input_shape=(seq_length, vocab_size)),
    Dense(vocab_size, activation='softmax')
])
model.compile(optimizer='adam', loss='categorical_crossentropy')

总结:RNN是处理序列数据的核心模型,其循环结构赋予了对时间信息的建模能力。尽管存在一些局限性,但其变体(如LSTM、GRU)在实际任务中表现出色,是自然语言处理和时间序列分析的基石。

四、三者对比

4. 1 特征提取方式对比

# 可视化中间层输出
from keras.models import Model

# CNN特征可视化
conv_layer = Model(inputs=cnn_model.input, 
                  outputs=cnn_model.layers[2].output)
feature_maps = conv_layer.predict(img_array)

# RNN隐藏状态可视化
lstm_layer = Model(inputs=rnn_model.input,
                  outputs=rnn_model.layers[2].output)
hidden_states = lstm_layer.predict(text_sequence)

4.2 各自特点对比

特征传统神经网络(DNN)卷积神经网络(CNN)循环神经网络(RNN)
连接方式全连接局部连接+参数共享时序递归连接
核心优势简单快速空间特征提取时序依赖捕捉
参数数量O(n²)级增长O(k²×c)级增长(k为卷积核尺寸)O(n×h)级增长(h为隐藏单元)
特征提取全局特征空间局部特征时序特征
典型应用简单分类/回归图像处理自然语言处理
并行计算能力极高
记忆能力有时序记忆
处理序列能力需展开为向量需转换为图像格式原生支持
训练难度容易过拟合中等梯度消失/爆炸问题严重

4.3 计算效率提升方案

网络类型优化策略效果提升幅度
DNN参数剪枝+量化50-70%
CNN深度可分离卷积3-5倍加速
RNN使用GRU代替LSTM30%提速
混合架构层间融合+知识蒸馏2-3倍加速

4.4 内存优化代码示例

# 混合精度训练
from keras.mixed_precision import set_global_policy
set_global_policy('mixed_float16')

# 梯度累积
optimizer = Adam(learning_rate=1e-4, gradient_accumulation_steps=4)

# 内存映射数据集
dataset = tf.data.Dataset.from_generator(data_gen, output_types=(tf.float32, tf.int32))

4.5 参数共享机制对比

  • DNN:无共享机制
  • CNN:卷积核滑动共享
  • RNN:时间步参数共享
# 参数数量计算示例
def print_params(model):
    trainable_params = np.sum([K.count_params(w) for w in model.trainable_weights])
    print(f"可训练参数数量: {trainable_params:,}")

print_params(dnn_model)  # 约 669,706 参数
print_params(cnn_model)  # 约 121,866 参数 
print_params(rnn_model)  # 约 1,313,793 参数

五、组合应用:CNN+RNN的协同效应

  1. 图像描述生成
    • CNN提取图像特征 → RNN生成自然语言描述
  2. 视频分类
    • CNN处理空间信息 → RNN分析时间序列动态
  3. 对话系统
    • CNN编码视觉输入 → RNN生成回复

示例架构

# CNN特征提取
image_input = Input(shape=(224,224,3))
cnn_features = VGG16(weights='imagenet', include_top=False)(image_input)
cnn_features = GlobalAveragePooling2D()(cnn_features)

# RNN文本生成
text_input = Input(shape=(max_length,))
embedding = Embedding(vocab_size, 128)(text_input)
lstm_output = LSTM(256)(embedding)

# 合并输出
concat = Concatenate()([cnn_features, lstm_output])
output = Dense(1000, activation='softmax')(concat)
model = Model(inputs=[image_input, text_input], outputs=output)

六、写在最后(小结一下)

6.1 行业应用风向标

  • 传统DNN:适合小规模、结构化数据,已逐步被CNN/RNN替代
  • CNN:计算机视觉领域的绝对主力,向轻量化(MobileNet)和3D扩展
  • RNN:LSTM/GRU仍是序列建模的主流,但Transformer架构在长距离依赖上表现更优

6.2 行业应用风向标

45% 35% 15% 5% 各领域主流网络架构占比 计算机视觉(CNN) 自然语言处理(Transformer) 时序预测(RNN) 其他(DNN)

相信读完这篇文章,你对与三大网络架构有了一个大体的了解,掌握三大神经网络的本质差异,犹如获得打开深度学习世界的三把钥匙。无论是处理空间信息、时序序列还是简单结构化数据,选择合适的网络架构往往能事半功倍。如果有任何问题欢迎留言,也期待各位的批评指正!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2325377.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

无人机,雷达定点飞行时,位置发散,位置很飘,原因分析

参考&#xff1a; 无人车传感器 IMU与GPS数据融合进行定位机制_gps imu 组合定位原始数-CSDN博客 我的无人机使用雷达定位&#xff0c;位置模式很飘 雷达的更新频率也是10HZ&#xff0c; 而px飞控的频率是100HZ&#xff0c;没有对两者之间的频率差异做出处理 所以才导致无人…

【Linux探索学习】第二十九弹——线程概念:Linux线程的基本概念与线程控制详解

Linux学习笔记&#xff1a; https://blog.csdn.net/2301_80220607/category_12805278.html?spm1001.2014.3001.5482 前言&#xff1a; 在现代操作系统中&#xff0c;线程是程序执行流的最小单元。与进程相比&#xff0c;线程更加轻量级&#xff0c;创建和销毁的开销更小&…

深入探索 iOS 卡顿优化

认识卡顿 一些概念 FPS&#xff1a;Frames Per Second&#xff0c;表示每秒渲染的帧数&#xff0c;通过用于衡量画面的流畅度&#xff0c;数值越高则表示画面越流畅。CPU&#xff1a;负责对象的创建和销毁、对象属性的调整、布局计算、文本的计算和排版、图片的格式转换和解码…

# 基于 OpenCV 的选择题自动批改系统实现

在教育领域&#xff0c;选择题的批改工作通常较为繁琐且重复性高。为了提高批改效率&#xff0c;我们可以利用计算机视觉技术&#xff0c;通过 OpenCV 实现选择题的自动批改。本文将详细介绍如何使用 Python 和 OpenCV 实现一个简单的选择题自动批改系统。 1. 项目背景 选择题…

身份验证:区块链如何让用户掌控一切

在网上证明你自称的身份变得越来越复杂。由于日常生活的很多方面现在都在网上进行&#xff0c;保护你的数字身份比以往任何时候都更加重要。 我们可能都接受过安全培训&#xff0c;这些培训鼓励我们选择安全的密码、启用双因素身份验证或回答安全问题&#xff0c;例如“你祖母…

嵌入式硬件: GPIO与二极管基础知识详解

1. 前言 在嵌入式系统和硬件开发中&#xff0c;GPIO&#xff08;通用输入输出&#xff09;是至关重要的控制方式&#xff0c;而二极管作为基础电子元件&#xff0c;广泛应用于信号整流、保护电路等。本文将从基础原理出发&#xff0c;深入解析GPIO的输入输出模式&#xff0c;包…

游戏引擎学习第194天

为当天的活动做铺垫 正在进行游戏开发中的调试和视图功能开发。目标是增加一些新功能&#xff0c;使得在开发过程中能够有效地检查游戏行为。今天的重点是推进用户界面&#xff08;UI&#xff09;的开发&#xff0c;并且尝试在调试变量的管理上找到一个折中的解决方案。计划探…

js文字两端对齐

目录 一、问题 二、原因及解决方法 三、总结 一、问题 1.text-align: justify; 不就可以了吗&#xff1f;但是实际测试无效 二、原因及解决方法 1.原因&#xff1a;text-align只对非最后一行文字有效。只有一行文字时&#xff0c;text-align无效&#xff0c;要用text-alig…

HarmonyOS 介绍

HarmonyOS简介 随着万物互联时代的开启&#xff0c;应用的设备底座将从几十亿手机扩展到数百亿IoT设备。全新的全场景设备体验&#xff0c;正深入改变消费者的使用习惯。 同时应用开发者也面临设备底座从手机单设备到全场景多设备的转变&#xff0c;全场景多设备的全新底座&am…

每天一篇目标检测文献(六)——Part One

今天看的是《Object Detection with Deep Learning: A Review》 目录 一、摘要 1.1 原文 1.2 翻译 二、介绍 2.1 信息区域选择 2.2 特征提取 2.3 分类 三、深度学习的简要回顾 3.1 历史、诞生、衰落和繁荣 3.2 CNN架构和优势 一、摘要 1.1 原文 Due to object dete…

ESXI 安装及封装第三方驱动和在ESXI系统下安装驱动

ESXI 安装及封装第三方驱动和在ESXI系统下安装驱动 准备工作在线安装 Windows PowerShell离线安装 Windows PowerShell更新在线更新离线更新 下载 ESXi-Customizer-PS-v2.6.0.ps1安装Python安装pip安装相关插件 下载离线捆绑包下载对应的网卡驱动&#xff08;如果纯净版可以进去…

【12】Ajax的原理和解析

一、前言 二、什么是Ajax 三、Ajax的基本原理 3.1 发送请求 3.2 解析内容 3.3 渲染网页 3.4 总结 四、Ajax 分析 五、过滤请求-筛选所有Ajax请求 一、前言 当我们在用 requests 抓取页面的时候&#xff0c;得到的结果可能会和在浏览器中看到的不一样&a…

双塔模型2之如何选择正确的正负样本

双塔模型&#xff1a;正负样本 选对正负样本的作用 > 改进模型的结构 正样本 什么是正样本&#xff1f;答&#xff1a;曝光且有点击的 “用户-物品” 二元组 存在的问题&#xff1a;存在28法则&#xff0c;即少部分物品&#xff08;比如热门物品&#xff09;占大部分点击…

《八大排序算法》

相关概念 排序&#xff1a;使一串记录&#xff0c;按照其中某个或某些关键字的大小&#xff0c;递增或递减的排列起来。稳定性&#xff1a;它描述了在排序过程中&#xff0c;相等元素的相对顺序是否保持不变。假设在待排序的序列中&#xff0c;有两个元素a和b&#xff0c;它们…

零基础使用AI从0到1开发一个微信小程序

零基础使用AI从&#xff10;到&#xff11;开发一个微信小程序 准备操作记录 准备 想多尝试一些新的交互方式&#xff0c;但我没有相关的开发经验&#xff0c;html&#xff0c;JavaScript 等都不了解&#xff0c;看了一些使用AI做微信小程序的视频教程&#xff0c;觉得自己也行…

基于Spring Boot的社区互助平台的设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导&#xff0c;欢迎高校老师/同行前辈交流合作✌。 技术范围&#xff1a;SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容&#xff1a;…

【Elasticsearch入门到落地】10、初始化RestClient

接上篇《9、hotel数据结构分析》 上一篇我们讲解了导入的宾馆数据库tb_hotel表结构的具体含义&#xff0c;并分析如何建立其索引库。本篇我们来正式进入链接Elasticsearch的Java代码的编写阶段&#xff0c;先进行RestClient的初始化。 RestClient的初始化分为三步&#xff0c;…

【AI大模型系列】DeepSeek V3的混合专家模型机制-MoE架构(八)

一、什么是MoE架构 MoE架构的核心思想是将输入数据分配给不同的专家子模型&#xff0c;然后将所有子模型的输出进行合并&#xff0c;以生成最终结果。这种分配可以根据输入数据的特征进行动态调整&#xff0c;确保每个专家处理其最擅长的数据类型或任务方面&#xff0c;从而实…

HTML5贪吃蛇游戏开发经验分享

HTML5贪吃蛇游戏开发经验分享 这里写目录标题 HTML5贪吃蛇游戏开发经验分享项目介绍技术栈核心功能实现1. 游戏初始化2. 蛇的移动控制3. 碰撞检测4. 食物生成 开发心得项目收获后续优化方向结语 项目介绍 在这个项目中&#xff0c;我使用HTML5 Canvas和原生JavaScript实现了一…

QSettings用法实战(相机配置文件的写入和读取)

很多情况&#xff0c;在做项目开发的时候&#xff0c;将参数独立出来是比较好的方法 例如&#xff1a;相机的曝光次数、曝光时长等参数&#xff0c;独立成ini文件&#xff0c;用户可以在外面修改即可生效&#xff0c;无需在动代码重新编译等工作 QSettings便可以实现该功能 内…