Stephen Wolfram:类似人类任务的模型

news2024/11/15 15:44:57

Models for Human-Like Tasks 

类似人类任务的模型

The example we gave above involves making a model for numerical data that essentially comes from simple physics—where we’ve known for several centuries that “simple mathematics applies”. But for ChatGPT we have to make a model of human-language text of the kind produced by a human brain. And for something like that we don’t (at least yet) have anything like “simple mathematics”. So what might a model of it be like?

我们上面给出的例子涉及到为数值数据建立一个模型,这些数据基本上来自于简单的物理学——几个世纪以来我们一直知道“简单的数学适用”。但对于 ChatGPT,我们必须建立一个人类大脑产生的人类语言文本的模型。对于这样的任务,我们(至少目前)没有任何类似于“简单的数学”。那么它的模型可能是什么样子的?

Before we talk about language, let’s talk about another human-like task: recognizing images. And as a simple example of this, let’s consider images of digits (and, yes, this is a classic machine learning example):

在我们讨论语言之前,让我们来谈谈另一个类似于人类的任务:图像识别。作为这方面的一个简单示例,我们考虑一下数字的图像(是的,这是一个经典的机器学习示例):

9601cbe6b6e6a87c880dccf542e64d46.png

One thing we could do is get a bunch of sample images for each digit:

我们可以做的一件事是为每个数字获取一批样本图像:

add4b8f1fb58089ce06fe4dcfdf4cd74.png

Then to find out if an image we’re given as input corresponds to a particular digit we could just do an explicit pixel-by-pixel comparison with the samples we have. But as humans we certainly seem to do something better—because we can still recognize digits, even when they’re for example handwritten, and have all sorts of modifications and distortions:

然后,为了确定给定输入图像是否对应于特定数字,我们可以将其与我们拥有的样本进行像素对比。但是作为人类,我们肯定在做得更好——因为我们仍然可以识别数字,即使它们是手写的,还有各种修改和扭曲:

94c928ab27299364b73afa0b598371c9.png

When we made a model for our numerical data above, we were able to take a numerical value x that we were given, and just compute a + b x for particular a and b. So if we treat the gray-level value of each pixel here as some variable xi is there some function of all those variables that—when evaluated—tells us what digit the image is of? It turns out that it’s possible to construct such a function. Not surprisingly, it’s not particularly simple, though. And a typical example might involve perhaps half a million mathematical operations.

当我们为上面的数值数据建立模型时,我们能够将给定的数值 x,并计算特定的 a 和 b 的 a + b x。因此,如果我们将每个像素的灰度值视为某些变量 xi,则是否存在某个涉及所有这些变量的函数,当我们进行评估时,告诉我们图像是哪个数字的?事实证明,是可能构造出这样的函数的。毫不奇怪,这并不特别简单。而一个典型的示例可能涉及大约五十万次数学运算。

But the end result is that if we feed the collection of pixel values for an image into this function, out will come the number specifying which digit we have an image of. Later, we’ll talk about how such a function can be constructed, and the idea of neural nets. But for now let’s treat the function as black box, where we feed in images of, say, handwritten digits (as arrays of pixel values) and we get out the numbers these correspond to:

但最终的结果是,如果我们将图像的像素值集合输入到这个函数中,输出的结果将是指定我们所拥有的图像的数字。稍后,我们将讨论如何构建这样的函数,以及神经网络的概念。但现在让我们将这个函数视为黑盒子,我们将手写数字的图像(作为像素值数组)输入,然后得到对应的数字:

25fb41d5fb4bfdce13cb03002e2ebe2e.png

But what’s really going on here? Let’s say we progressively blur a digit. For a little while our function still “recognizes” it, here as a “2”. But soon it “loses it”, and starts giving the “wrong” result:

但是这里真正发生了什么?假设我们逐渐模糊一个数字。一开始,我们的函数仍然“识别”它,比如“2”。但很快它就“失去了识别”,并开始给出“错误”的结果:

909ed6e110477351a539d8519df23ee7.png

But why do we say it’s the “wrong” result? In this case, we know we got all the images by blurring a “2”. But if our goal is to produce a model of what humans can do in recognizing images, the real question to ask is what a human would have done if presented with one of those blurred images, without knowing where it came from.

但我们为什么说这是“错误”的结果?在这种情况下,我们知道我们得到的所有图像都是通过模糊“2”而获得的。但是,如果我们的目标是为人类在识别图像方面的能力建立一个模型,那么真正需要问的问题是:如果人类被呈现了这些模糊的图像,而不知道它们来自哪里,他们会做什么?

And we have a “good model” if the results we get from our function typically agree with what a human would say. And the nontrivial scientific fact is that for an image-recognition task like this we now basically know how to construct functions that do this.

如果我们的函数产生的结果通常与人类的判断相符,那么我们就拥有了一个“好的模型”。而这个重要的科学事实是,在像这样的图像识别任务中,我们现在基本上知道如何构建能够实现这一点的函数。

Can we “mathematically prove” that they work? Well, no. Because to do that we’d have to have a mathematical theory of what we humans are doing. Take the “2” image and change a few pixels. We might imagine that with only a few pixels “out of place” we should still consider the image a “2”. But how far should that go? It’s a question of human visual perception. And, yes, the answer would no doubt be different for bees or octopuses—and potentially utterly different for putative aliens.

我们是否可以“数学上证明”它们有效?嗯,不行。因为为此我们必须对人类的所作所为拥有一个数学理论。拿“2”的图像并改变几个像素。我们可以想象,只有几个像素“有点偏离”,我们仍然应该将图像视为“2”。但是应该偏离多远?这是一个关于人类视觉感知的问题。是的,对于蜜蜂或章鱼,答案无疑会不同——对于假定的外星人来说可能完全不同。

edf9717d4fccde72e0abe728d3bebeec.jpeg

“点赞有美意,赞赏是鼓励”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/801277.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SSTI学习的笔记(橙子)

放心,我会一直陪着你 一.在终端的一些指令1.虚拟环境2.docker容器 二.SSTI相关知识介绍1.魔术方法2.python如何执行cmd命令3.SSTI常用注入模块(1)文件读取(2)内建函数eval执行命令(3)os模块执行命令(4)importlib类执行命令(5)linecache函数执行命令(6)subprocess.Po…

暖手宝UL认证 亚马逊UL测试报告 UL499测试项目

UL499测试内容:1、 漏电流测试 2、 输入测试 3、 潮态下漏电流测试4、正常温升测试 5、 耐高压测试 6、 稳定性测试7、异常测试(DRY)8、 异常测试  9、 静压及强度测试10、 烧熔断器测试、 电源线拉力测试11、 电源线推力测试12、 塑件变…

二、前端高德地图、渲染标记(Marker)引入自定义icon,手动设置zoom

要实现这个效果,我们先看一下目前的页面展示: 左边有一个图例,我们可以方法缩小地图,右边是动态的marker标记,到时候肯定时候是后端将对应的颜色标识、文字展示、坐标点给咱们返回、我们肯定可以拿到一个list&#xf…

怎么清空电脑回收站?教您这三招(附上清空的回收站数据怎么恢复教程)

电脑回收站是一个临时存放被删除文件的地方,如果不清空回收站,这些文件仍然占用磁盘空间。清空回收站可以释放这些空间,提高磁盘的可用空间。那么,怎么清空电脑回收站的东西呢?清空的回收站数据怎么恢复呢?…

ICMP隐蔽隧道攻击分析与检测

• ICMP隧道攻击工具特征分析 一、原理 由于ICMP报文自身可以携带数据,而且ICMP报文是由系统内核处理的,不占用任何端口,因此具有很高的隐蔽性。 通过改变操作系统默认填充的Data,替换成自己构造的数据,这就是ICMP隐…

测试开发第一章、软件测试介绍

一、什么是软件测试 最常见的理解是:软件测试就是找BUG,发现缺陷。 软件测试就是验证软件产品特性是否满足用户的需求。 从这话我们可以看出以下两点: 测试试图验证软件是“工作的”,也就是验证软件功能执行的正确性测试的活动是以测试人员“预期的结果”为依据,这里的…

centos7 部署 k8s 1m2n

1 系统环境准备 1.1 安装所需工具 yum -y install vim yum -y install wget# 设置yum源 mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup wget -O /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun.com/repo/Centos-7.repo1.2 修改…

【性能优化篇】.ttf字体包过大引起的网页加载过慢 font-spider 压缩字体包 适用于任何前端项目

背景 项目使用的是阿里巴巴普惠2.0字体,型号分别是 35-thin 和 45-light 这两个字体包 都是 8mb 左右 本地加载的时候可能速度不会收影响,发到生产和测试环境下,速度会很慢,尤其是测试环境,字体包加载了一分钟&#…

详细分析Python中运算符“==“和“is“的区别

目录 Python中运算符"" Python中运算符"is" ""和"is"的区别 总结 Python中运算符"" 在Python中,双等号运算符"" 用于比较两个值是否相等。它返回一个布尔值,即True或False,…

自动完成网页局部区域截图的方法

一般网页包含标题、导航、正文、图片、广告、外链等内容,但只有正文内容对我们才有价值,或者我们只关心其中的数据分析图表。希望把网页有价值的区域截图下来,在手工截图时,可以利用截图工具选择截图区域,那么能自动截…

如何评估自动化测试脚本的编写时间和维护工作量?

一、如何评估自动化测试脚本的编写时间和维护工作量? 评估自动化测试脚本的编写时间和维护工作量是一个复杂的过程,需要综合考虑以下因素: 脚本复杂性:评估脚本的复杂性,包括测试需求的复杂程度、涉及的功能和模块的复…

简单认识Redis 数据库的高可用

文章目录 一、Redis 高可用:1.简介:2、在Redis中实现高可用的技术 二、Redis持久化:1.持久化的功能:2.Redis 提供两种方式进行持久化: 三、RDB 持久化:1.简介:2.触发条件:4.启动时加…

LeetCode 2050. 并行课程 III:DFS

【LetMeFly】2050.并行课程 III:DFS 力扣题目链接:https://leetcode.cn/problems/parallel-courses-iii/ 给你一个整数 n ,表示有 n 节课,课程编号从 1 到 n 。同时给你一个二维整数数组 relations ,其中 relations[…

jpa生成实体类,jpa根据数据库表生成实体类

jpa生成实体类,jpa根据数据库表生成实体类jpa根据数据库表结构生成实体idea下SpringbootJPA从数据库自动生成实体类JPA用数据库表直接生成实体类Spring boot整合jpa(一),根据表生成实体IDEA下SpringData-JPA根据数据库表生成实体类idea怎么根据数据库表自动生成JPA实…

为什么你在用 ChatGPT 的提示词 Prompt 似乎效果不如人意?

“ 在使用ChatGPT的神奇提示词Prompt时,或许你会发现它的效果并不总是如人所愿。让我们看看其中的原因,以及如何避免这类问题。” 01 — 最近继续在研究以大模型人工智能LLM为大脑的专属知识库的开发技术。偶然看到这么一个智力游戏题目,让大…

HummerRisk V1.3.0 发布

HummerRisk V1.3.0发布: 大家好,HummerRisk 1.3.0和大家见面了,在这个版本中我们继续在多云接入管理、多云检测方式、云资源态势方面提供新的能力,并增加了新的镜像仓库支持类型,并优化了云的区域选择、优化规则组内容…

如何提高单测覆盖率

相关工具推荐: TestMe:用于快速生成测试类 一、抽象一个公共类,将TestMe的配置内容该类MockTest import lombok.extern.slf4j.Slf4j; import org.junit.Before; import org.junit.runner.RunWith; import org.mockito.junit.MockitoJUnitRunner;impor…

基于SpringBoot+Vue的4S店车辆管理系统设计与实现(源码+LW+部署文档等)

博主介绍: 大家好,我是一名在Java圈混迹十余年的程序员,精通Java编程语言,同时也熟练掌握微信小程序、Python和Android等技术,能够为大家提供全方位的技术支持和交流。 我擅长在JavaWeb、SSH、SSM、SpringBoot等框架…

浅浅了解线程池

线程池 1.线程池基本概念(了解)1.1 什么是线程池1.2 为什么使用线程池1.3 线程池的优势 2.创建池的方式3.线程池的工作原理(重点)3.1 线程池的七大参数3.2 线程池的四种拒绝策略AbortPolicyCallerRunsPolicyDiscardPolicyDiscardOldestPolicy 3.3 任务队列 4. 自定义线程池(代码…

提供实习证明和奖学金!面向本科生、研究生的 AI 夏令营!第二期开放报名

无论你是新手还是有AI基础 只要你对AI方向感兴趣,有热情 欢迎你加入Datawhale AI 夏令营 联合科大讯飞、阿里云天池 面向在校本科生、研究生 提供暑期实践学习机会 第二期正式开放报名 线上活动,全程免费 报名时间:2023/7/26 - 2023/8/1 1 关…