读书笔记--读数学之美有感

读书笔记--读数学之美有感

news2026/2/7 23:26:28

大概是在10年前，无意间读到吴军老师撰写得数学之美，感觉吴老师对数学与信息论的结合讲述的太好了，吴老师结合自身的多年工作经历将信息技术中用到的数学，特别是数学里面的很多概率论、线性代数、模型算法、编解码规则等，用非常通俗易懂的语言阐述给大家，比如我们天天用到的搜索引擎、商品推荐、语言识别、自然语言处理、文章分类、人脸识别等问题的底层数学原理，如果大家能够在上初高中或者大学期间能够读到这本书，我想应该会让好多觉得数学学习枯燥的人获得启发和价值引导灵感，同样也让我们非常直观的了解到为什么大家要从小学1年级到大学都在学习数学，数据的价值在哪里，数学是一种逻辑思维，一种解决问题和描述问题本质的方式方法，很多科学、工程问题或物理学的问题最终都要借助数学来解决。以下是一些关键细节，供参考。

一、文字和语言，数字和信息

信息：最早是声音传播，方便人类交流通信，促使语言的产生，语言和通信的联系是天然的，详见下图。大学期间学过信号处理课程的同学一定非常熟悉这个模型，以及工作中从事后端数据传输处理（比如电子邮件的发送接收设计等）的小伙伴一定非常熟悉，原来，这些技能其实早在人类祖先的交流中就拥有了，只是没有一个相对规范的称呼，通信模型。

文字（包括数字）是高效记录信息的方式，但文字需要上下文，否则会产生歧义，比如日表示太阳，也表示一天。文字最早是象形文字，后来是拼音文字，汉字笔画其实也是一种字母表示，也是拼音文字。

数字进制的概念描述是不同位置的数字表示不同的量，中国用个十百千万千万亿兆，罗马人用I：1，V：5，X:10，L:50，C:100，D:500，M:1000。单200万的数字，用罗马编码估计得一黑板，现在我们用的阿拉伯数字（0~9）其实是印度人发明的，经过阿拉伯人传到欧洲。

文字的编码也是常用字笔画短，生僻字笔画多。符合信息论的最短编码原理

通信原理和信息传播模型

信源编码和最短编码

解码的规则和语法

聚类

校验位

双语对照文本，语料库和机器翻译

多义性和利用上下文消除歧义性

二、自然语言处理（NLP）--从规则到统计

经过多年的自然语言的研究，科学家发现，要让机器具有智能，不是让机器理解自然语言，而是靠数学，准确的说是靠统计学。发明飞机的怀特兄弟靠的是空气动力学研究，也是工程和数学的结合，不是仿生学（理解鸟怎么飞的）

基于规则的自然语言处理：是早期对自然语言处理的理解，需要进行句法分析和语义分析

基于统计的自然语言处理方法，在数学模型上和通信是相通的，甚至就是相同的；在数学意义上，自然语言处理又和语言的初衷（即上面的通信原理）联系在了一起。

三、统计语言模型

科学家要让计算机处理自然语言，需要为自然语言这种上下文相关的特性建立数学模型，简称统计语言模型

IBM的贾里尼克认为：一个句子是否合理，是否出现，就看他的可能性大小如何。概率

整句话出现的概率P(S)，w1表示第一个词，wn表示第n个词

P(S)=P(w1,w2,w3,...,wn)=P(w1)*P(w2|w1)*P(w3|w1,w2)*P(w4|w1,w2,w3)...*P(wn|w1,w2,w3,...,wn-1).

马尔可夫提出来一种偷懒但有效的方法：假设任意一个词wi出现的概率只与它前面一个词(wi-1)有关，于是上面的公式就变为

P(S)=P(w1)*P(w2|w1)*P(w3|w2)*P(w4|w3)...*P(wn|wn-1).

事实证明：统计语言模型比任何已知的借助某种规则的解决方法更有效。数学的精彩之处就在于利用简单的模型可以干大事。

马尔可夫模型其实和俄罗斯的数学家马尔可夫没关系，是美国数学家鲍姆.韦尔奇发现的。后来不断变化，又出现了隐含马尔可夫模型。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/545236.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

gunicorn常用参数命令

gunicorn常用参数命令

Gunicorn 是一个 Python 的 WSGI HTTP 服务器。具有实现简单,轻量级,高性能等特点。更多介绍内容参考官网，这里介绍几个常用参数。安装 pip3 install gunicorn通过输入gunicorn -v查看版本。最简洁的启动。首先进入到项目目录，例如django项目和mana…

阅读更多...

Vue中通过集成Quill富文本编辑器实现公告的发布。Vue项目中vue-quill-editor的安装与使用【实战开发应用】

Vue中通过集成Quill富文本编辑器实现公告的发布。Vue项目中vue-quill-editor的安装与使用【实战开发应用】

前言闲的无聊、给原有的系统添加一个公告的功能。就是后台可以写一些公告信息，然后前台可以看到发布的信息。一般来说一个公告就是一些文字描述图片视频等。还有排版样式啥的。使用文本编辑器就可以实现。然后正好用到了Quill，通过Quill富文本编辑器集成…

阅读更多...

JS逆向 -- 某视频vurl值的加密分析

JS逆向 -- 某视频vurl值的加密分析

接上节课内容 JS逆向 -- 某视频vid值的加密分析 JS逆向 -- 某视频val值和pid值的加密分析一、在上节课中有个vurl的值需要分析，具体内容如下 vurl: https://mp4play-hs-cdn.ysp.cctv.cn/o000017kuww.jbZe10002.mp4? sdtfrom4330701& guidlhsuf6ia_0rieucp…

阅读更多...

进程性能分析工具 pidstat 和用 python 的 matplotlib 库输出分析图表

进程性能分析工具 pidstat 和用 python 的 matplotlib 库输出分析图表

文章目录前情提要效果展示pidstat 简介matplotlib 简介认识 figure 和 axes绘制曲线图绘制柱形图创建两个轴，将上面两种图形放到一个 figure 中Backends of matplotlib如何使用 WebAgg注意事项前情提要这段时间在忙服务器压测的工作，虽然我们程序里面…

阅读更多...

五种高效的原型设计工具推荐

五种高效的原型设计工具推荐

软件产品的诞生注定要经历一个过程：需求分析、设计、开发、测试和在线。在设计阶段，原型设计是软件设计和开发的重要保证。与其他工作一样，高效的原型设计需要相应工具的帮助来完成原型设计。在许多原型设计工具中，这里推荐了五种…

阅读更多...

洛谷P1420-最长连号

洛谷P1420-最长连号

洛谷P1420-最长连号这个题目很入门，但是我第一次做怎么做都做不出来，看了几个代码，方法各式各样，这个我是我觉得最通俗易懂的一个, 循环外面的两个输入第一个cin是个数第二个是输入的第一个数，所以下面for循环的条件…

阅读更多...

毕业论文之转化为三线表格（wps）

毕业论文之转化为三线表格（wps）

目录一、前言 1.修改之前的表格 2. 修改完成后（三线表格式） 二、操作步骤一、前言在论文里面的表格要求是三线表格式的时候，就需要我们去把这个表格修改成三线表格式。 1.修改之前的表格 2. 修改完成后（三线表格式&…

阅读更多...

Vulnhub靶机渗透：Raven1（超级详细）

Vulnhub靶机渗透：Raven1（超级详细）

Raven1 https://www.vulnhub.com/entry/raven-1,256/ kali:192.168.54.128 raven1:192.168.54.15 nmap扫描端口扫描 # Nmap 7.93 scan initiated Thu May 18 16:41:33 2023 as: nmap --min-rate 20000 -p- -oN nmap/ports 192.168.54.15 Nmap scan report for 192.168.54.…

阅读更多...

PPT / Powerpoint中利用LaTeX输入公式

PPT / Powerpoint中利用LaTeX输入公式

新版的Word（Office 2016后？）是支持LaTeX公式输入的，但是Powerpoint并不支持。下面介绍如何利用latex-ppt插件实现PPT中输入LaTeX公式： 1 安装latex-ppt插件 1.1 下载插件插件开源仓库：latex-ppt&#x…

阅读更多...

Linux【Ubuntu】安装Docker配置docker-compose 编排工具

Linux【Ubuntu】安装Docker配置docker-compose 编排工具

一：Docker具体安装传送门: 亲测有效 https://www.runoob.com/docker/ubuntu-docker-install.html 二：配置Docker编排工具docker-compose 1，下载Docker-compose 下载Docker-Compose（下载完毕就是一个文件docker-compose-Linux-x…

阅读更多...

实验10 超市订单管理系统综合实验

实验10 超市订单管理系统综合实验

实验10 超市订单管理系统综合实验应粉丝要求，本博主帮助实现基本效果！ 未避免产生版权问题，本项目博主不公开源码，如果您遇到相关问题可私聊博主！ 一、实验目的及任务通过该实验，掌握利用SSM框架进行系…

阅读更多...

生成式AI热潮：一场“添饭碗”的科技革命

生成式AI热潮：一场“添饭碗”的科技革命

今年以来，人工智能（AI）热潮席卷全球，被认为将掀起新的科技革命。 5月18日的2023天津世界智能大会，以“智行天下能动未来”为主题，重点关注人工智能发展的新趋势、新技术、新业态。大会开幕式结束之后&…

阅读更多...

lidar camera calibration

lidar camera calibration

1 Automatic Extrinsic Calibration Method for LiDAR and Camera Sensor Setups 2022 vel2cam git 2 A Novel Method for LiDARCamera Calibration by PlaneFitting 本文介绍了一种使用带ArUco标记的立方体的3D-3D对应特征来校准LiDAR和相机的新方法。在LiDAR坐标系中&…

阅读更多...

安全响应中心 — 垃圾邮件事件报告（5.16）

安全响应中心 — 垃圾邮件事件报告（5.16）

2023年5月第二周一. 样本概况 ✅ 类型1：二维码钓鱼(QRPhish) 利用二维码进行的钓鱼、投毒，成为目前常见的邮件攻击手段之一，该类二维码主要存在于网络链接图片、邮件内容图片、附件图片中。近日，安全团队捕获到一类基于员工…

阅读更多...

什么是DevOps?如何理解DevOps思想？

什么是DevOps?如何理解DevOps思想？

博文参考总结自：https://www.kuangstudy.com/course/play/1573900157572333569 仅供学习使用，若侵权，请联系我删除！ 1、什么是DevOps? DevOps是一种思想或方法论，它涵盖开发、测试、运维的整个过程。DevOps强调软件开…

阅读更多...

三阶段项目相关内容

三阶段项目相关内容

当虚拟网关和真实物理网关相同的时候，默认优先级是255 vrrp角色： 主路由器备份路由器虚拟路由器计时器：发送hello报文的时间, 主网关：每隔1s会向备份发一次vrrp报文备份网关：监听vrrp报文，主网…

阅读更多...

【UE4】从零开始制作战斗机（上：准备模型、定义函数和变量）

【UE4】从零开始制作战斗机（上：准备模型、定义函数和变量）

资源连接：（链接） 步骤： 1. 下载完资源并解压，资源内容如下： 2. 将上图中所有的.fbx文件导入ue 使用默认的导入设置就行，直接点击导入所有导入后内容如下： 将资源中的textures也导…

阅读更多...

程序员必备的免费自然语言转SQL (摸鱼)工具，人手必备

程序员必备的免费自然语言转SQL (摸鱼)工具，人手必备

程序员必备的免费自然语言转SQL (摸鱼)工具，人手必备 1、SQL查询中添加过滤请对附加的SQL查询添加筛选条件，仅显示在加州居住且消费总额排名前10位的客户。 “SELECT customer_name, SUM(order_total) AS total_spent FROM orders GROUP BY customer…

阅读更多...

web缓存—Squid代理服务

web缓存—Squid代理服务

1.squid的相关知识 1.1 squid的概念 Squid服务器缓存频繁要求网页、媒体文件和其它加速回答时间并减少带宽堵塞的内容。 Squid代理服务器（Squid proxy server）一般和原始文件一起安装在单独服务器而不是网络服务器上。Squid通过追踪网络中的对象运用起…

阅读更多...

一文搞懂Golang中的接口

一文搞懂Golang中的接口

目录接口接口介绍接口定义实现接口空接口实现空接口类型断言使用类型断言结构体实现多接口接口嵌套结构体值接收者和指针接收者实现接口的区别代码案例接口接口介绍 Go语言中的接口（interface）是一组方法签名的集合&#xf…

阅读更多...

推荐文章

最新文章