大语言模型是通用人工智能的实现路径吗?【文末有福利】

news2024/11/20 12:31:42

相关说明

这篇文章的大部分内容参考自我的新书《解构大语言模型:从线性回归到通用人工智能》,欢迎有兴趣的读者多多支持。

关于大语言模型的内容,推荐参考这个专栏。

内容大纲

  • 相关说明
  • 一、哲学与人工智能
  • 二、内容简介
  • 三、书籍简介与福利
    • 粉丝福利

一、哲学与人工智能

让计算机达到人类的智能水平,从而胜任各类复杂任务,一直是计算机科学家梦寐以求的目标。这个追求从计算机诞生伊始就被提出,逐渐演变为如今备受瞩目的人工智能学科。为了完成这个追求,正确的做法是首先弄清楚人类的智能来源于哪里。这其实是思辨的心灵最感兴趣的一个问题。传统的神学答案——人的智能来源于上帝将生气吹在人的鼻孔——已经逐渐失去了它在过去几个世纪里占据的统治地位。另外,显然这个问题超出了科学的范畴,因为人类并没有确切的知识可以回答这个问题。

根据英国哲学家罗素在《西方哲学史》里的主张“一切确切的知识——我是这样主张的——都属于科学;一切涉及超乎确切知识之外的教条都属于神学。但是介乎于神学与科学之间还有一片受到双方攻击的无人之域;这片无人之域就是哲学”。因此,对于这个问题,我们似乎只能在哲学的范畴里进行探索。哲学家马丁·海德格尔可能给出了最接近真理的答案“语言是存在之家。在它的居所里,人类栖息其中。” 语言不但是人类日常交流的工具,而且几乎所有的知识都以文字的形式进行呈现和存储。如果计算机能够理解人类的语言,不仅可以使人与机器之间的交流更加顺畅,还能让机器学会存储在语言中的知识。而这一过程将推动人工智能实现质的飞跃——从单一的人工智能逐渐演进成为通用人工智能。

上面的讨论可能会给人一种读完好像明白了又好像什么都没明白的惆怅感。的确如此,人工智能学科中的这一部分——如何能让机器获得智能——已经站在了人类思想的最前沿,正如李约瑟在《中国科技史》里所述“当思想清晰时,科学写作通常也是清晰的。当思想在知识的前沿徘徊时,隐喻、类比和非常一般的术语取代了精确的术语和清晰的概念。” 但幸运的是,人工智能的技术部分已经是很清晰的科学了。从技术上来说,自然语言处理(让计算机学习人类语言)汇集了人工智能最尖端的技术和最巧妙的设计。通过深入研究自然语言处理,我们可以迅速了解人工智能的最新技术和发展趋势。此外,自然语言处理的相关技术和建模思维也能轻松应用于其他领域。这就是为什么学习人工智能最好的方式是学习如何进行自然语言处理。

二、内容简介

考虑到像ChatGPT这样的大语言模型代表了自然语言处理的最新成果,因此,一个更具体的学习方法是从零开始理解并构建ChatGPT。接下来,我们来看看实现这一目标所需的知识体系,如下图所示。

图1

图1

在结构层面上,大语言模型的核心要素是注意力机制和深度学习优化技术。注意力机制源于循环神经网络的发展。为了深刻理解循环神经网络,必须先了解神经网络的基础模型——多层感知器。多层感知器的基础可以进一步分为3个部分:首先是作为模型骨架的线性回归;其次是作为模型灵魂的激活函数,激活函数演进自逻辑回归;最后是作为工程基础的反向传播算法和建立在其之上的最优化算法。深度学习的起点是卷积神经网络,大语言模型从中吸取了大量经验:如何加速模型学习和进化。当然,理解卷积神经网络的基础也是多层感知器。

模型结构固然是学习的关键,但除此之外,我们还需要了解大语言模型的物质基础,即数据。对数据的学习主要聚焦于模型的训练方式、模型解释和特征工程三个方面。大语言模型的训练涉及到迁移学习和强化学习,这两者又源自监督学习。模型解释与特征工程则需要吸取计量经济学和其他经典模型的经验。

无论是模型结构还是数据基础,进行技术讨论都离不开数学基础,具体而言,主要包括张量、概率和微积分等内容。

上述内容正是《解构大语言模型:从线性回归到通用人工智能》所覆盖的范围。通过这本书,读者可以了解到搭建像ChatGPT这样的系统的每个细节,并通过这样的方式精通人工智能领域的绝大部分内容。

三、书籍简介与福利

在这里插入图片描述

粉丝福利

参与方式:评论区评论:“解构大语言模型”(切记要点赞+收藏,否则抽奖无效,每个人最多评论三次!)
本次送书数量不少于3本,【阅读量越多,送得越多】
活动结束后,会私信中奖粉丝,请各位注意查看私信哦~

活动截止时间:2024-05-25 24:00:00

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1686916.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

飞睿智能超宽带UWB标签模组,简化设备开发流程,实时高速率数传交互应用

在科技飞速发展的今天,UWB超宽带技术因其高精度、低功耗和高安全性的特点,正逐渐成为智能设备定位和数据传输的新宠。 UWB技术是一种无线通信技术,它通过使用非常宽的频带进行数据传输,从而实现高数据传输速率和高精度定位。 飞…

「51媒体」线下活动媒体同步直播,云分发,分流直播

传媒如春雨,润物细无声,大家好,我是51媒体网胡老师。 线下活动除了邀请嘉宾,邀请媒体,邀请行业大咖KOL,来为活动站台,背书外,我们也可以将线下的活动同步在线上进行直播&#xff0c…

构建 Elastic Cloud Serverless

作者:来自 Elastic Jason Tedor Elastic Cloud Serverless 架构 2022 年 10 月,我们引入了 Elasticsearch 的无状态架构。 我们该计划的主要目标是发展 Elasticsearch,以利用云原生服务提供的操作、性能和成本效率。 该计划成为我们最近宣…

解决Ubuntu无法使用root登录的问题

1、登录普通用户 2、使用vi编辑器打开/etc/pam.d/gdm-autologin并注释掉auth required pam_succeed_if.so user ! root quiet_success 3、使用vi编辑器打开/etc/pam.d/gdm-password并注释掉auth required pam_succeed_if.so user ! root quiet_success 4、注销用户重新用roo…

【Linux安全】Firewalld防火墙

目录 一.Firewalld概述 二.Firewalld和iptables的关系 1.firewalld和iptables的联系 2.firewalld和iptables的区别 三.Firewalld区域 1.概念 2.九个区域 3.区域介绍 4.Firewalld数据处理流程 四.Firewalld-cmd命令行操作 1.查看 2.增加 3.删除 4.修改 五.Firewa…

最新FinalShell专业版激活

支持的版本 可以激活任意版本的FinalShell为专业版,包括最新版4.3.10 激活方式 打开FinalShell,点击左下角 激活/升级。 账号密码任意输入几个字符,点离线激活。 复制机器码,将机器码发送给微信公众号【小白学算法】,即可获…

数据结构学习/复习15--排序部分复习总结

一、学过的排序 1.插入排序 2.希尔排序 3.直接选择排序 4.堆排序 5.冒泡排序 6.快速排序 7.归并排序 8.计数排序 二、各项排序的思想及改进(无特殊说明均以升序为例) 1.插入排序及其改进希尔排序 (1)插入排序的思想及具体操作细节 将一个数字按顺…

pytorch使用gpu训练模型

前言 仅记录学习过程,有问题欢迎讨论 因为网上博客参差不齐,我也踩了很多坑,留下我自己成功的经验哈哈。 1.安装CUDA和CUDNN 参考这个博客: https://blog.csdn.net/shdabai/article/details/131248257 2.安装gpu版本 pytorch …

【openlayers系统学习】3.6-3.7添加可视化选择器,手动选择可视化的图像源

六、添加可视化选择器(选择可视化的图像类型) 在前面的示例中,我们已经看到了同一Sentinel-2图像的真彩色合成、假彩色合成和NDVI渲染。如果能让用户从这些可视化中选择一个或更多,而不必每次都更改我们的代码,那就太…

【热门话题】一文带你读懂公司是如何知道张三在脉脉上发了“一句话”的

按理说呢,A公司和脉脉属于不同的平台,而且脉脉上大家可以匿名发言,所以,即便我坐在你边上,我发了一句话上去,你也不知道是谁发的。但通过一些技术,我们却可以分析出,公司是如何知道张…

Git远程控制

文章目录 1. 创建仓库1.1 Readme1.2 Issue1.3 Pull request 2. 远程仓库克隆3. 推送远程仓库4. 拉取远程仓库5. 配置Git.gitignore配置别名 使用GitHub可以,采用Gitee也行 1. 创建仓库 1.1 Readme Readme文件相当于这个仓库的说明书,gitee会初始化2两份…

docker容器安装nexus3以及nexus3备份迁移仓库数据

一、安装步骤 1.搜索nexus3镜像 docker search nexus3 2.拉取镜像 docker pull sonatype/nexus3或者指定版本 docker pull sonatype/nexus3:3.68.0 3.查看拉取的镜像 docker images | grep "nexus3" 4.启动nexus服务 直接启动 docker run -d --name nexus3 -…

基于Django框架深度学习口罩检测系统

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 一、项目背景与意义 随着全球疫情的蔓延,口罩成为了重要的防护工具。然而,在实际场景中&am…

MySQL —— 复合查询

一、基本的查询回顾练习 前面两章节整理了许多关于查询用到的语句和关键字,以及MySQL的内置函数,我们先用一些简单的查询练习去回顾之前的知识 1. 前提准备 同样是前面用到的用于测试的表格和数据,一张学生表和三张关于雇员信息表 雇员信息…

qt 布局学习笔记

目录 管理信息列表源码 c版: pro文件: qt 设置水平布局,里面有两个按钮,每个按钮就变的很宽,怎么设置按钮的精确位置 设置固定大小: 使用弹性空间(Spacer) 使用布局比例&…

Apache Doris 基础(一) -- Getting Started

Apache Doris 开源、实时数据仓库 Apache Doris是一个用于实时分析的现代数据仓库。 它提供大规模闪电般的实时数据分析。 实时获取和存储 在一秒钟内基于推的微批处理和基于拉的流数据获取。实时更新,追加和预聚合的存储引擎闪电般的查询 使用列式存储引擎、MPP架构…

vue3封装ElementUI plus Dialog弹窗

因为ElementuiPlus的dialog弹框的初始样式不太好看,而公司要求又要好看,本来是已经实现了,但是后来想想了发现封装完dialog的其他功能也要,所以特此记录一下 方案一 思路:封装一个组件,将所有新增的参数引入el-dialog 参数中,实现参数共用 新建一个组件,将官网暴露的属性全部引…

达梦数据库详解

达梦认证是指针对中国数据库管理系统(DBMS)厂商达梦公司所推出的数据库产品,即达梦数据库(DMDB),进行的一种官方认证体系。达梦认证旨在验证数据库管理人员对达梦数据库产品的掌握程度,及其在数…

【AD936X】 SDR 版图 欣赏

DIE : 4336x4730 um 的 65 nm 芯片 在顶部金属上,您可以看到 PLL 的电感器和日期代码 - 芯片在推出前两年就已准备就绪: 右下角是主数字块,应该是 128 抽头 FIR 滤波器。在最大放大倍率下,我们可以看到一排排标准单元。它们的放置…

[深度学习]基于yolov8+bytetrack+pyqt5实现车辆进出流量统计+车辆实时测速实现

以前使用过yolov5deepsort实现过车辆进出流量统计车辆实时测速,可以看我往期视频,这回改成yolov8bytetrack实现,实时性更好,原理和原来一样。车流量进出统计车速测量优点: 使用目标检测算法考虑bbox抖动,解…