从古板到智能:机器程序的华丽转身

news2025/1/4 19:22:04

因为 ChatGPT 的热潮,目前在恶补人工智能方面的知识。在某一篇文章的评论中,我看到了一个问题:“为什么 ChatGPT 能这么厉害,基本什么问题都能回答,如何做到的”

这也是我想问的问题,在初学编程的时候,我的计算机潘老师就在尝试用机器创作小说,我当时就在想,这玩意怎么可能呢?

现在 ChatGPT 出来了,我信了,只是希望老潘不要被打击到。

程序的古板

我们都知道,历来不管是程序员还是程序,基本都是死板的代名词。程序它是按照人类编写的指令来执行的,只会按照事先设定好的代码一步一步地执行。

我来举个例子:假如你有一台机器人可以听懂你的指令。你对它说:“帮我去桌子上拿个手机,如果你看到牛奶的话,也给我拿一杯。” 那么很有可能它只会按照指令,拿给我们手机或者牛奶。用简单的伪代码来描述,大概率就是:

if(在桌子上找到手机){
  拿起手机;
  返回手机;
} else if(在桌子上找到牛奶){
  拿起牛奶;
  把牛奶放在托盘上;
  给用户拿一杯牛奶;
} else {
  返回找不到物品信息;
}

通过上面的例子,我们可以看出来,机器人或者说程序是很难真正理解我们人类的语义的。那么为什么现在的人工智能语言大模型,比如文心一言、通义千问,却显得比人类更聪明呢?

这些语言大模型具有广博的知识储备,熟悉各种领域,精通逻辑思考、推理分析,简直可以说是可上九天揽月、下五洋捉鳖,基本没有什么是不会的。那么人工智能是如何实现的?

神经网络

在1948年,冯·诺依曼这个大佬提出了神经网络这个概念。他研究人脑结构和计算机存储的区别,提出了使用存储器计算,模拟人类的神经元,从而实现计算机的“自动思考”

既然神经网络模仿的是人类神经元,那么我们不妨先了解一下神经元是什么。通俗来说,神经元就像是一个由许多树枝组成的“爪子”,最终汇聚成一个结构。

这种结构的作用是通过多个输入,最终产生一个输出。就像当你去淘宝买商品时,通过该商品的价格、评价、外形等多个方面进行综合考虑,最终会产生一个决策,即是否进行购买

计算机所模拟的,就是这种结构,可以用数学模型来描述,如下图所示:

所以基于这种结构,通过数据投喂进行机器程序的学习,就能把这个程序转变成人工智能。等等,什么是训练学习

训练学习

你有没有想过一个问题,在你小时候,明明听不懂任何语言,也看不懂任何图片。但随着时间的流逝,你渐渐的可以听懂了,点头 Yes 摇头No,来是 Come 去是 Go,这其实就是训练学习了。

我再举一个例子,假设我有个儿子哈,只是假设。我拿了张卡片,就是下面的图片了。

我把卡片给他看,告诉他这是一只小猫。他记下了,这种样子的就叫做猫。后面有一天,我带他去小区花园里散步,结果有一只猫窜了出来,他指着喊猫猫。

你不觉得很奇怪吗,我是教过他认识卡片上的猫猫。但是窜出来的那只猫,他是第一次见,他是怎么分辨的出来的。这说明,她肯定是找到了猫身上的某些特征。具体是哪些特征呢?比如眼睛,皮肤或者鼻子。

想到了吗,人工智能的神经网络,起初全都是乱猜的。所以我们得不停的给这个算法程序提供样本数据,然后算法程序通过这些数据去训练,去学习,从已知的输入去计算结果的输出,最后得出结论。

那么它具体是怎么训练学习的呢?比如我们有一只铅笔,通过铅笔的长度和铅笔和材质硬度,就能判断这只铅笔是否合格。然后,我就建立一个数学模型公式:是否合格= (长度×10+材质硬度×5 > 30)

之后所有的铅笔进入合格程序检测的时候,首先先拿到每支铅笔长度和材质硬度这两个参数,然后按照上面的这个公式,计算出哪些铅笔是合格的,哪些是不合格的。

你有没有发现,这里有一个上帝视角的问题。因为我提前已经把这个公式的参数值列好了,计算机按照这个公式去判断就行。但是,计算机面对的是一组组混乱的数据,它不知道长度应该是 ×10 还是×100。

所以,计算机会首先随机生成这几个值,然后把训练的数据带进去,如果不对的话,再把这些值进行修改重试,直到找到合适的参数值。这也有点像算法程序员中的调参工程师了。

因为计算机的运行速度很快,如果是简单点的模型,很快就能训练好。但是像 ChatGPT 这样的模型,就不是一朝一夕能够完成的,需要依赖优秀的算法,海量的数据和算力了。这个具体下期讲。

到这里,我觉得我还是讲的挺明白了,人工智能通过神经网络,进行不停地学习,然后再利用数据的喂养进行不断矫正那几个参数值,最终实现了智慧。

图灵测试

你觉得人工智能产生了,你说了算吗?在程序测试中,有单元测试,集成测试等等。对于人工智能来说, 有图灵测试。

最早可追溯到20世纪30年代,当时的计算机科学家们就开始思考如何利用机器来模拟人类的思维过程。

直到1950年,艾伦·图灵提出了一种名为图灵测试的测验方法。就像我们要测试人是否聪明,可以考试或者面试一样,计算机也需要被测试。这个测试的目标是让计算机像人一样,能够回答一些问题并产生类似人类的交互。

想象一下,如果你和一台计算机同时进入了一个房间,然后还有一个评测员,他们不能看见你和计算机,只能通过和你们对话来判断谁是人类,谁是计算机。如果评测员认为计算机也能和人一样聊天,那么计算机就通过了图灵测试,证明它具有智能。

虽然图灵测试看起来简单,但是它背后涉及到了很多复杂的人工智能算法和自然语言处理技术。很多科学家都在不断地研究,希望让计算机更好地通过这个测试,不断地接近甚至超越人类的智能。

为什么现在才快速发展

这个问题其实从上面的介绍中已经说了。人工智能的发展离不开三个因素:算法、算力、数据。其中的算法其实很早就已经产生了,但是算力和数据不是你想有就有的。

就比如说人工智能训练的海量数据吧,拿GPT3.5来说,根据开发公司 OpenAI 的说法,GPT-3模型使用了数千亿个单词级别和字符级别的参数进行训练,而更恐怖的 GPT4 据说达到了3.5万亿。这些数据在早期基本提供不了。

另外再说算力,这就需要购买训练设备和机器,并且使用昂贵的 GPU 进行持续运算。大家都知道,GPU价格很高。

之前,国外某个大佬疯狂抢购了1万个GPU,耗资数亿人民币。但这些 GPU 还不一定足够使用。有些人问:“我不需要快速运算,不需要进行并行运算,我可以排个队吗?”

可以的!但是设备不足的情况下,会发生等待的情况。那需要等多久呢?比如说,用一块三五千元的普通GPU 训练 Dolly 2.0,每轮需要7.5个小时。10,000轮训练需要3125天,也就是8年半的时间。到最后,工程师们会说:“哎呦,不好意思,我们忘记加一个参数了,需要重新开始。”

如果企业这样持续下去,还能继续生存吗?不过,如果你使用集群的英伟达 A100,只需要几天就可以完成训练。不过价格有点小贵,一块A100,需要十万元,目前国内还买不到。

除了 GPU,你还得考虑资源问题,就跟当年比特币挖矿一样。你知道当初挖矿那帮人,用了四川多少电吗,

参考:https://juejin.cn/post/7230819482012663845

总结

通过上面的介绍,你应该知道为什么 ChatGPT 有这么牛逼了吧。优秀的算法,海量的数据和算力,才有了现在的 ChatGPT。所以有些不知道真相的国人,不要动不动就喷国内为什么没有 ChatGPT 这样的软件,这又不是小孩子过家家,再加上国内大厂的产品线太多,一时半会做不到 GPT 这么优秀很正常。

其实国内很早就在发展这方面的内容了,本来估计要过个几年才出的,现在因为 ChatGPT 的横空出世,发现了人工智能的可落地性,不得已加快了这方面的进程,才有了现在的通义千问,讯飞星火,给国内厂商一些时间吧。你看今天的 C919 不也民用首航成功了嘛。

关注《车辙的编程学习圈》,免费领取视频教程、电子书、面试攻略等海量资源。

image.png

关注《一纸匿名信》,在右侧菜单栏体验 ChatGPT,公众号私信【免费】,赠送一个月会员。

点赞、在看,下篇文章更精彩

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/582882.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Packet Tracer - 配置区域策略防火墙

Packet Tracer - 配置区域策略防火墙 拓扑 地址表 设备 接口 IP地址 子网掩码 默认网关 交换机端口 R1 F0/1 192.168.1.1 255.255.255.0 N/A S1 F0/2 S0/3/0 (DCE) 10.1.1.1 255.255.255.252 N/A N/A R2 S0/3/0 10.1.1.2 255.255.255.252 N/A N/A S0/3…

Unity 反射探针

反射射探针 是用来模拟反射周边物体的光照信息的一种解决方案让物体,受周围物体的光照或材质进行影响的一种模拟光照效果。如下图效果: 反射探针属性截图 反射探针类型 Baked 烘焙模式,此种模式需要反射的物体是静态的不能移动,但…

如何高效提问,准确搜索,开发小白不会百度?

How-To-Ask-Question ?其实我也是小白,这个问题没有太多发言权。目前来说,我暂时也没有找到一个通法,但整体上来说也不是无迹可寻(是有一定技巧和经验在里面的)。我之前也经常遇到了一些这方面问题&#x…

1.5. 流程控制(分支与循环)

流程控制是编程中的基本概念,用于控制程序的执行顺序。在 Java 中,流程控制主要分为两类:分支结构(Branching)和循环结构(Looping)。 1.5.1. 分支结构 分支结构是根据条件判断来选择执行不同的…

【*1900 DP+Tree】CF9D

Problem - 9D - Codeforces 题意: 思路: 计数问题,考虑计数DP 因为它是二叉树,比较特殊,所以可以考虑一下线性DP 按照题目最后要算的答案,状态可以这样设计: 设dp[i][j]表示树高为i&#x…

Linux设备驱动程序(二)——建立和运行模块

文章目录 前言一、设置测试系统二、Hello World 模块1、代码详解2、执行效果 三、内核模块相比于应用程序1、用户空间和内核空间2、内核的并发3、当前进程4、几个别的细节 四、编译和加载1、编译模块2、加载和卸载模块3、版本依赖 五、内核符号表六、预备知识七、初始化和关停1…

旗鱼优化(SFO)算法(含MATLAB代码)

先做一个声明:文章是由我的个人公众号中的推送直接复制粘贴而来,因此对智能优化算法感兴趣的朋友,可关注我的个人公众号:启发式算法讨论。我会不定期在公众号里分享不同的智能优化算法,经典的,或者是近几年…

Thread.sleep( )线程休眠的优化写法

TimeUnit.SECONDS.sleep(10)和Thread.sleep(10 * 1000)都可以用于线程休眠 代码如下: import java.time.LocalDateTime; import java.time.format.DateTimeFormatter; import java.util.concurrent.TimeUnit; /*** program: moon-cloud-car* author: 阿水* create…

MT6765 处理器参数 MTK6765芯片性能配置|详细参数

MT6765处理器,也被称为Helio P35,是联发科(MediaTek)推出的高性能智能芯片。作为目前市场上受欢迎的低成本智能芯片之一,MT6765以其卓越的性能和创新技术为用户提供了更加顺畅和高效的使用体验。 MT6765作为一款八核芯片,MT6765的…

最佳实践:基于vite3的monorepo前端工程搭建 | 京东云技术团队

一、技术栈选择 1.代码库管理方式-Monorepo: 将多个项目存放在同一个代码库中 ▪选择理由1:多个应用(可以按业务线产品粒度划分)在同一个repo管理,便于统一管理代码规范、共享工作流 ▪选择理由2:解决跨项…

Homeassistant --openwrt docker 安装

openwrt homeassistant安装教程 前提:在N1盒子上面烧录 f大的openwrt系统 (安装81o 或者82o都可以) 一.进入openwrt系统 通常为192.168.1.1 打开网络配置 点击网络点击接口然后修改 这样网络是属于旁路由上网了 可以联通网络了 主要需要填写正确 二.点击docker …

南大通用数据库-Gbase-8a-报错集锦-02-metadata is incomplete on localhost

一、版本信息 名称值CPUIntel(R) Core(TM) i5-1035G1 CPU 1.00GHz操作系统CentOS Linux release 7.9.2009 (Core)内存3G逻辑核数2Gbase8a版本8.6.2-R43 二、问题原因 由于gbase.table_distribution存储了所有引擎为express的表元数据信息,如果此表出现数据损坏&a…

Linux使用PowerShell模块管理MsSql-Server

1.安装PowserShell 更新包列表 sudo apt-get update 安装依赖: sudo apt-get install -y wget apt-transport-https software-properties-common 下载 key: wget -q "https://packages.microsoft.com/config/ubuntu/$(lsb_release -rs)/packages-microsoft-prod.deb&…

第三方apple pencil哪个好?好用的电容笔排行榜

由于Apple Pencil的推出,让iPad变成了一个轻量化的办公室工具,它的优点就是可以让画家在iPad上作画,能够适用于各种各样的绘画,并且非常适合一些上班族。今天就来为大家推荐几支适合画画的电容笔! 第一部分、电容笔选…

「实在RPA·服装制造数字员工」助力服装「智」造数字升级

服装制造业作为衣食住行的重要组成部分,除了在百姓生活中扮演者着重要角色之外,同时在经济发展中具有重要的地位和作用。它不仅提供了大量就业机会,促进国际贸易和经济发展,同时也推动了技术创新和消费需求的满足。为顺应数字经济…

Vue组件化、通过自定义指令子组件向父组件传递

1.如何安装Vue脚手架? 第一步(仅第一次执行):全局安装vue/clinpm install -g vue/cli 第二步:切换到你要创建项目的目录,然后使用命令创建项目vue create xxxx 第三步:启动项目npm run serve 2…

C语言中二维数组和二维数组分析

问题 最近有个同事发现一个问题:一个二维数组,想把它传给一个函数,具体代码如下: char array[3][128]; void fun(char** array) {strcpy(array[0],"confirm"); }当我试图直接把二维数组名传给函数的时候,f…

接入淘宝API接口,获取店铺详情轻松迈入大数据时代

随着电商行业的飞速发展,API接口已经成为了一种不可或缺的技术。作为中国最大的电商平台,淘宝也拥有着自己的API接口。本文将重点讲解淘宝API接口技术,包括其基本原理、使用方法、优缺点等方面,帮助大家进一步了解淘宝API接口的奥…

年度发布 | MeterSphere一站式开源持续测试平台发布v2.10 LTS版本

2023年5月25日,MeterSphere一站式开源持续测试平台正式发布v2.10 LTS版本。这是继2022年5月发布v1.20 LTS版本后,MeterSphere开源项目发布的第三个LTS(Long Term Support)版本。MeterSphere开源项目组将对MeterSphere v2.10 LTS版…

一个完整的APP定制开发流程是怎样的?

随着移动互联网的发展,越来越多的 APP应用软件进入人们的生活,让我们的生活更便捷、更舒适。而随着互联网技术的进步,移动互联网应用软件开发行业也越来越成熟,为了适应市场需求,各种功能强大、性能良好的 APP应用软件…