【神经网络——最易懂最清晰的一篇文章 - CSDN App】https://blog.csdn.net/illikang/article/details/82019945?type=blog&rId=82019945&refer=APP&source=weixin_45387165
参考以上资料,可对神经网络有初步了解。接下来可参考书籍等投身实际项目中使用。
书籍可参考《控制之美》神经网络及其MATLAB实现。
机器学习:以设定规则+数据喂养驱动算法自成长
机器学习(machine learning)>神经网络>深度学习≈深度神经网络。
机器学习用于解决由人工基于if-else 等规则开发算法而导致成本过高的问题,想要通过帮助机器“发现”它们“自己”解决问题的算法来解决;
机器学习可以分为有监督学习(supervised learning)、无监督学习(unsupervised learning)和强化学习(reinforcement learning)等三类。
深度学习是基于深度神经网络的,而神经网络算法是机器学习模型的一个分支,包括卷积神经网络CNN/循环神经网络RNN等等,自注意机制(Transformer)则是基于全连接神经网络和循环神经网络的衍生。
深度学习使用多层神经网络,从原始输入中逐步提取更高层次更抽象的特征用于后续算法识别,处理大规模数据是其核心优势。当前,深度学习已经应用到包括图像识别、自然语言处理、语言识别等各领域。
AI大模型是指具有超大规模参数(通常在十亿个以上)、超强计算资源的机器学习模型,其目标是通过增加模型的参数数量来提高模型的表现能力,它们能够处理海量数据,完成各种复杂任务。
AI大模型的原理是基于神经网络和大量数据的训练,模型通过模拟人脑的神经元结构,对输入数据进行多层抽象和处理,从而实现对复杂任务的学习和预测。AI大模型的训练主要分为:数据预处理、模型构建、模型训练、模型评估等步骤:
数据预处理:首先,需要对原始数据进行清洗,整理和标注,以便为模型提供合适的输入。这一阶段可能包括去除噪声、填充缺失值、归一化等。
构建神经网络:根据任务需求设计并搭建一个神经网络,其通常由多个层级组成,每个层级包含若干个神经元。神经元之间通过权重连接,用于表示输入数据和输出数据之间的关系。
前向传播:将经过预处理的数 据输入到神经网络中, 按照权重计算得出各层 神经元的输出。这个过 程称为前向传播。