AI大模型基石:文字与数字的起源与演变

news2024/12/23 8:33:33

AI大模型基石:文字与数字的起源与演变


1、文字

1.1、起源

  我们的祖先在还没有发明文字和语言之前就已经开始使用“咿咿呀呀”的声音来传播信息了,比如在野外活动遇到危险,然后发出“咿咿呀呀”的声音来提醒同伴小心,同伴在接收到信息后首先要做的就是解码,从“咿咿呀呀”中解读想要传递的信息。
  对发明并掌握文字的现代人来说,只是将祖先的“咿咿呀呀”替换成了象形文字和楔形文字,但是其本质都是为了传递信息。之所以会诱导我们的祖先发明文字,是因为其掌握的信息越来越多、语言越来越丰富和越来越抽象,人类大脑已经很难记住这么多的词汇,最终我们的祖先为了高效的记录信息,便走上发明文字的道路。
image.png
  约在公元前3400年左右,苏美尔人发展出了楔形文字,这是目前已知的最早的完整文字系统之一。楔形文字最初是以图画为基础,但很快就发展成为一种表意和表音的混合系统。这种文字系统在美索不达米亚地区(伊拉克境内)广泛使用,并由腓尼基人传播到其他地区。
  在甲骨文(公元前14世纪)出现的前约两千年(公元前24世纪左右),古埃及文明已开始使用图形表示事物,形成了最早的象形文字。无论是甲骨文还是古埃及的象形文字早期文字的数量都是和想要记录的信息相关,由于人类掌握的信息越来越多,象形文字就从刚开始的几百个,渐渐发展成几个千。此时的先祖们又一次站在的推动历史进程的拐点,开始了第一次对象形文字的归纳总结,从而就出现了一词多义的多义词、一词多音的多音词等等。
  高度概括又带来了难理解和歧义,不同的人接收到同一段文字可能会做出不同的解读。为了解决这样的问题就只能依靠上下文,其可以解决大多数歧义(除非估计捣乱)。我们阅读古籍看见的下面的标注,其实就是后人结合上下文按照自己理解进行去歧义的过程。

1.2、本质

  从文明古国文字起源不难看出都是因为随着对世界的认识越来越丰富,带来的信息也越来越多,原有记录信息和传播信息的方式已经不能满足当下需求不得不做出的演进。各文明古国在历史上相互隔绝,在没有交流沟通的前提下形成了不同的文字,但是其文字背后的本质都是为了记录所见所谓、所思所想的信息。
  我们把时间线拉到秦始皇统一六国之前春秋战国时期,在秦始皇还没有统一六国之前各国都有自己的文字和语言,各国之间商贸之所以能正常进行,正是因为在文字的本质是信息这个大前提下产生了翻译。当下翻译很常见,中英互翻和中法互翻等等,同样也没有逃过文字只是信息的载体,而非信息本身的底层本质。

2、数字

2.1、起源

  文字的出现是因为我们祖先掌握越来越多的信息导致大脑不能有效的记住这些信息,那么数字的出现也是因为我们祖先掌握的东西越来越多,只是这里的东西换成了财产。在远古时期我们的祖先拥有的财产可能就只有身上的几片树叶,根本没有到需要数一数的地步,所以就用不上数字,但是随着生产力的提高和部落的出现个人拥有的财产也随之增长,此时就到了需要数一数才能搞清楚自己有多少财产的时候了。
  正如一则小故事,两个部落首领要比一比谁说的数字大,A首领想了想说3,B首领因为家境贫寒想了半天没能想出比3大的数字,并说你赢了。由此数字的发明就是为了记录财产等需要数一数才能清楚有多少的东西。
  我们的祖先早期就是通过掰手指来数数,刚学加减法时候的我们也是如此,恰好人类双手有十根手指,便有了我们日常使用的十进制,如果人类手指不是十根,那么我们现在可能使用的就是其它进制的计数系统了。但是玛雅文明并没有使用十进制,而是将脚趾的十根也加了进来形成了二十进制,从而玛雅文明的计数法就和其他文明在本质上就有了区别,这可能也是玛雅文明如此神秘的原因之一吧。十多年前关于2012年世界末日的传说也是对玛雅文明技术系统的误解和夸大,玛雅人使用二十进制那么他们的日历系统也是基于二十进制的“长计数历”,并从公元前3114年8月11日玛雅文明的创世日期开始计算,正好到2012年12月21日为一个长计数历结束,所以这个日期只是表示一个周期结束和新周期的开始,而不是世界的终结。

2.2、发展

  约在35000年前人类就有了计数系统,但是所有古文明的计数系统在1、2、3的记录方式都是采用简单书写的几横(中国)、几竖(罗马)或者几点(美索不达米亚)。因为我们的祖先使用十进制的计算系统,那么在记录大数字的时候就又有编码的过程,如中国使用个十百千万亿兆来表示进位,罗马则使用相对复杂的系统来表示进位。
  同样是逢十进一中国使用十百千万亿兆来进行编码,然后使用乘法的规则进行解码,如一百万写法的含义就是110010000。而罗马使用“I代表1、V代表5、X代表10、L代表50、C代表100、D代表500、M代表1000”的系统来进行编码,然后使用加减法的规则进行解码(小数字出现在大数字左边为减、右边为加),如IV表示5-1=4,VI表示5+1=6,二者一比较高下立判。
  虽然中国和罗马在数字都有自己的独特发明,但是最高效的还是印度人发明由阿拉伯人传播包含0在内的10个阿拉伯数字,因为其便利性进而推过为全世界通用的数字计数系统。阿拉伯数字具有高度的抽象性,它很好的将文字和数字进行了分离,而不是像中国和罗马那么在文字上创造数字使得二者高度耦合。


一键三连,让我的信心像气球一样膨胀!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1579706.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

物联网数据服务平台

随着物联网技术的迅猛发展,海量数据的产生和应用成为推动工业数字化转型的核心动力。在这个数据为王的时代,如何高效地收集、处理、分析并应用这些数据,成为了企业关注的焦点。物联网数据服务平台应运而生,为企业提供了全面、高效…

20240403-算法复习打卡day43||● 1049. 最后一块石头的重量 II ● 494. 目标和 ● 474.一和零

1049. 最后一块石头的重量 II class Solution { public:int lastStoneWeightII(vector<int>& stones) {vector<int> dp(15001, 0);int sum 0;for (int i 0; i < stones.size(); i) sum stones[i];int target sum / 2;for (int i 0; i < stones.siz…

群晖NAS使用Docker部署Potopea在线图片编辑工具并实现公网访问

文章目录 1. 部署Photopea2. 运行Photopea3. 群晖安装Cpolar4. 配置公网地址5. 公网访问测试6. 固定公网地址 本文主要介绍如何在群晖NAS使用Docker部署Potopea在线图片编辑工具&#xff0c;并结合cpolar内网穿透实现公网环境可以远程访问本地部署的Potopea. Photopea是一款强大…

鸿蒙OS实战开发:【多设备自适应服务卡片】

介绍 服务卡片的布局和使用&#xff0c;其中卡片内容显示使用了一次开发&#xff0c;多端部署的能力实现多设备自适应。 用到了卡片扩展模块接口&#xff0c;[ohos.app.form.FormExtensionAbility] 。 卡片信息和状态等相关类型和枚举接口&#xff0c;[ohos.app.form.formInf…

设计模式 -- 发布订阅模式

发布订阅模式&#xff1a; 订阅者把自己想订阅的事件注册到调度中心&#xff0c;当发布者发布该事件到调度中心&#xff0c;也就是该事件触发时&#xff0c;由调度者统一调度订阅者注册到调度中心的处理代码。 在javaScript 中我们一般使用事件模型来代替传统的发布订阅模式。 …

最长上升子序列(线性dp)-java

主要是解决最长上升子序列问题&#xff0c;推出状态转移方程。 文章目录 前言 一、最长上升子序列问题 二、算法思路 1.最长上升子序列思路 三、代码如下 1.代码如下&#xff08;示例&#xff09;&#xff1a; 2.读入数据 3.代码运行结果 总结 前言 主要是解决最长上升子序列问…

三相交流电子负载的基础认识

三相交流电子负载主要用于电源、电机、逆变器等产品的测试和老化&#xff0c;它能够精确地模拟各种负载的工作状态&#xff0c;如阻性、感性、容性等&#xff0c;以满足不同产品的测试需求。三相交流电子负载具有响应速度快、精度高、稳定性好等特点&#xff0c;是现代电力电子…

6款超好用AI写作神器,写作效率秒拔高! #经验分享#人工智能#知识分享

在当今信息爆炸的时代&#xff0c;写作成为了人们表达思想、分享知识和传递情感的重要方式之一。对于很多人来说&#xff0c;写作并非易事。我们会陷入困境&#xff0c;无法找到灵感&#xff0c;我们会苦恼于语言表达的准确性&#xff0c;还有时候我们可能遭遇到了创作瓶颈&…

功耗低、触控灵敏度高、抗干扰能力强等众多优势,输出方式多样的单键电容式触控芯片TS223B介绍

•应用领域• 适用于小家电、电子玩具、智能物联网等各种触控产品方案。 •功能介绍• 单键电容式触控芯片TS223B具有功耗低、触控灵敏度高、抗干扰能力强等众多优势&#xff0c;输出方式包括直接输出、电平翻转输出&#xff0c;并且输出的初始状态可以配置&#xff0c;能灵活满…

UVA12538 Version Controlled IDE 题解 crope

Version Controlled IDE 传送门 题面翻译 维护一种数据结构&#xff0c;资磁三种操作。 1.在p位置插入一个字符串s 2.从p位置开始删除长度为c的字符串 3.输出第v个历史版本中从p位置开始的长度为c的字符串 1 ≤ n ≤ 50000 1 \leq n \leq 50000 1≤n≤50000&#xff0c;所…

Spring声明式事务(Spring学习笔记十三)

不推荐使用编程式事务 在Spring-dao.xml中配置声明式事务 <!--配置声明式事务 --><!--获得transactionManager然后把他丢给他的构造器 constructor-arg --><bean id"transactionManager" class"org.springframework.jdbc.datasource.Data…

网站压力测试和Locust

一、压力测试介绍 网站压力测试是一种评估网站性能、可靠性和稳定性的方法。它通过模拟大量用户同时访问网站,来测试网站的响应时间、吞吐量、资源利用率等指标,从而发现网站的潜在问题和瓶颈。下面我将从几个方面详细介绍网站压力测试: 1、压力测试的目的 评估网站在高并发…

Midjourney该怎么用?从零基础到落地实践

前言 从注册登录到基本的操作界面&#xff0c;提示词组成后缀介绍&#xff0c;到主流的生成图片的方式&#xff0c;以及最重要的提示词咒语分享&#xff0c;还有一些我的使用心得&#xff0c;希望对大家有帮助&#xff01; 喜欢的话欢迎关注我&#xff0c;欢迎点赞收藏评论&am…

如何运用工业智能网关将数据上传到设备数字化平台

在数字化浪潮的推动下&#xff0c;工业领域正迎来前所未有的变革。工业智能网关作为连接物理世界与数字世界的桥梁&#xff0c;其在数据采集、传输和处理方面发挥着不可或缺的作用。而HiWoo Cloud平台&#xff0c;正是利用工业智能网关&#xff0c;实现设备数据数字化管理的强大…

RTThread studio 驱动开发

rtthread 驱动开发的两种情况 rtthread studio 自动生成 由 RT Thread Studio 自动生成&#xff0c;无需修改任何文件或者简单定义几个宏即可直接使用的驱动&#xff0c;如 GPIO&#xff0c;UART&#xff0c;I2C&#xff0c;SPI&#xff0c;SDIO 和 ETH 等。 使用 RT-Thread S…

Flowise AI工作流本地部署实战教程

&#x1f9d9;‍♂️ 诸位好&#xff0c;吾乃斜杠君&#xff0c;编程界之翘楚&#xff0c;代码之大师。算法如流水&#xff0c;逻辑如棋局。 &#x1f4dc; 吾之笔记&#xff0c;内含诸般技术之秘诀。吾欲以此笔记&#xff0c;传授编程之道&#xff0c;助汝解技术难题。 &#…

axure谷歌插件(直接下载)

axure谷歌插件 在网上找一个谷歌的axure&#xff0c;不是登陆就是收费&#xff0c;离谱。找了好久才找到这个&#xff0c;我下载保存到网盘了&#xff0c;直接下载就ok&#xff0c;永久无提取码。 下载插件文件&#xff0c;打开开发者模式&#xff0c;直接拖进来就ok。 网盘…

网络安全行业现在还能入吗?

这几年随着我国《国家网络空间安全战略》《网络安全法》《网络安全等级保护2.0》等一系列政策/法规/标准的持续落地&#xff0c;网络安全行业地位、薪资随之水涨船高。 未来3-5年&#xff0c;是安全行业的黄金发展期&#xff0c;提前踏入行业&#xff0c;能享受行业发展红利。…

【Linux 命令】内核、驱动调试手段总结

文章目录 1. printk2. strace3. Itrace4. ptrace5. ftrace6. 动态打印7. perf8. devmem9. demsg参考&#xff1a; 1. printk **printk()**是 Linux 内核中最广为人知的函数之一。它是我们打印消息的标准工具&#xff0c;通常也是追踪和调试的最基本方法。 虽然 printk() 是基…

【网站项目】新冠疫苗预约小程序

&#x1f64a;作者简介&#xff1a;拥有多年开发工作经验&#xff0c;分享技术代码帮助学生学习&#xff0c;独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。&#x1f339;赠送计算机毕业设计600个选题excel文件&#xff0c;帮助大学选题。赠送开题报告模板&#xff…