读天才与算法:人脑与AI的数学思维笔记24_预测性文本生成器

news2024/11/18 15:45:47

1. 起源

1.1. 人类讲故事可能起源于“假如……”这种问答结构

1.2. 讲故事是人类做安全试验的一种方式

1.2.1. 如果你问一个人“假如……”,其实是在探索你的行为对他可能带来的影响

1.3. 最早出现的故事极有可能就源自我们对在周遭混乱的环境中寻找某种秩序的渴望,想要在这个残酷无情的宇宙中找到自身存在的意义

1.3.1. 围坐在火堆旁分享当天的狩猎故事,可以帮助部落在第二天能获取更多的猎物

1.3.2. 智人力量上的短板,在部落的集体智慧中得到了弥补

1.3.3. 这种智慧的力量随着社交和分享的增加而增强

1.3.4. 营地的篝火点燃了人类创造力的火种

1.3.5. 这是一种早期的科学形式

1.4. 算法能不能构想出其他有趣的动物以便推动故事情节的发展?

1.4.1. 就像那些长有头、躯干和腿的动物一样,将不同事物的组成部分解构,然后再通过混合进行重构,就可以创造出千奇百怪的新事物

1.4.2. 这些具有奇技异能的新生物是促使新故事诞生的极佳催化剂

2. 预测性文本生成器

2.1. 到目前为止,大多数例子都基于自上而下的编程思想

2.1.1. 按照明确的规则,可随机填充单词的诗歌模

2.1.2. 将经典作品转换为新作品的代码

2.1.3. 通过编程获取数据并将其转化为故事的算法

2.1.4. 这些程序实际上并没有太多自由发挥的空间

2.2. 机器学习正在改变这一切

2.2.1. 算法可以从小说作者的所有作品中学习,探索他们的写作方式

2.2.2. 如果他们喜欢使用某个特定的词,这个词后面很可能会跟着其他出现频次高的词

2.2.3. 通过构建作者使用单词的概率图,算法可以生成该作者作品的续篇

2.2.4. 这就是预测性文本生成器的工作原理,其产出的文学作品既发人深省又引人入胜

3. Botnik

3.1. 一个名为“Botnik”的公司倡导使用机器学习来创造新文学

3.1.1. 一家研发人工智能自然语言技术的公司

3.1.2. 其致力于开发能与人协作的内容创作工具,即用人工智能挖掘人类的创造潜能

3.2. 该公司由作家杰米·布鲁(Jamie Brew)和《纽约客》(The New Yorker)前漫画编辑鲍勃·曼考夫(Bob Mankoff)于2016年创立

3.3. 算法有时会输出出人意料的超现实主义作品

3.3.1. Botnik为《宋飞正传》写出了精彩的剧本

3.3.2. Botnik还制作了一份感恩节食谱,并在YouTube上发布了一段视频,让人们了解如果把烹饪这件事交给算法

3.4. Botnik在学习了《哈利·波特》七卷丛书之后,生成了三页几乎可以以假乱真的续集

3.4.1. 有些时候,算法才是最纯粹的“天才”

3.5. Botnik确实可以从构建句子的方式中学习、辨认、识记,但其所捕捉到的只是这样一个事实存在:作者的写作风格

3.5.1. 只捕捉到了这一点:文本的局部,却没有从整体上考虑叙事结构

3.5.2. 就像爵士乐的“续作者”一样,它可以生成一些以假乱真的乐句,但最终还是难逃走向乏味、无聊和枯竭,因为算法不知道该继续向何处发展音乐

3.5.3. 小说家们很快就会失业是不大可能的

4. Scheherazade-IF

4.1. 2012年,乔治亚理工学院的马克·里德尔(Mark Riedl)和他的同事开发了一个会讲故事的算法“Scheherazade-IF”

4.1.1. 这个算法名字中的“Scheherazade”来源于王后山鲁佐德为暴虐的国王讲故事来安抚他的传说,她是一位优秀的故事讲述者

4.1.2. “IF”取自“Interactive Fiction”,意为交互式小说

4.2. 目标是在故事发展可能性的迷宫中找到一条更加连贯畅通的路径

4.3. 由于人类具备许多现实世界的知识,所以他们都是天生的、优秀的故事讲述者

4.4. 如果你要求Scheherazade-IF构建一个关于某个特定主题或情境的故事,而这个主题或情境它之前从未遇到过,那么它就会通过搜集和消化之前的故事来进行学习

4.5. Scheherazade-IF从由一大群人构成的大规模知识库中汲取新的信息并充分消化,再将这些范例汇总形成一个树状图,图中列出故事发展的各种可能方向

4.5.1. 好的故事讲述者,会在故事发展树状图中找到最佳的路径

4.5.2. 在很多故事情节会随玩家的选择而走向不同结局的开放性电脑游戏中,这种方法非常奏效

4.6. Scheherazade-IF正尝试通过它在网上收集到的数据,生成故事发展的可能性树状图,进而实现这一点

4.6.1. 它所做的选择获得的满意度得分可以与人类相媲美,远远高于随机生成的故事

5. Whim

5.1. What If Machine

5.2. 由欧盟资助的Whim(What If Machine)项目所试图解决的问题

5.2.1. 从网上搜罗以前的故事把它们重新组合在一起固然不错,但想象一下如果是前所未见的场景会有怎样的结果?

5.3. 作家在尝试创造新作品时面临的一个问题是,他们会卡在自己有限的固定思维模式里

5.3.1. Whim通过提供焕然一新的故事场景,把故事讲述者带出他们的舒适区

5.4. 由Whim生成的一个故事情节,最终促成了一部音乐剧于2016年在伦敦西区上演

5.4.1. 筛选算法分析音乐剧走红或惨败的原因,为Whim提供故事情节进一步发展的建议

5.4.2. 2016年春天,《飞越藩篱》在伦敦西区的艺术剧院进行了短暂的演出

5.4.2.1. 为完成这一作品,人类的干预可能和电脑的创造力一样多

6. 普洛普写手

6.1. PropperWryter

6.2. 在生成童话故事方面,另一个算法“普洛普写手”(PropperWryter)更胜一筹

6.3. 1928年,形式主义语言学家、民俗学家弗拉基米尔·普洛普(Vladimir Propp)在他的《故事形态学》里提出,俄国民间故事有31种叙事原型

6.4. “普洛普写手”把Whim提供的情节最终发展成为一个关于格林汉姆普通妇女反核运动的故事

6.4.1. 其音乐由另一个名为“机器人劳埃德·韦伯”(Android Lloyd Webber)的算法提供

7. “自动化”数学家

7.1. 数学家如果能提出诸如“假如……”这一类的问题,就意味着他距离突破知识边界已经只有一步之遥了

7.1.1. 假如有一个数的平方值为–1

7.1.2. 假如弯曲空间中,两条平行线可以相交

7.1.2.1. 黎曼几何

7.2. 打破固有的结构框架,从变化中探索有价值的新发现,是编写新的数学“故事”的经典工具

7.3. 如果数学是用数字讲述的故事,那么目前的算法在生成新的数学故事方面有多大的价值呢?

8. 整数序列在线百科全书

8.1. oeis dot org

8.2. 其目的旨在收集所有有趣的数列,并探索生成这些数列的公式或方法

8.3. 由素数(或者说除了1和它本身以外不再有其他因数的自然数)构成的数列

8.3.1. 对于该数列,很难找到一个通项公式来生成下一个数,这也是数学界公认的未解之谜之一

8.4. 可重分解因子数是一项由机器生成的发明

8.4.1. 可重分解因子数”(refactorable numbers)的概念,其定义为:数列中每个数字的因数个数,本身又是该数字的因数

8.4.2. 该数列中的奇数,被称为“奇数可重分解因子数”

8.4.2.1. odd refactorable numbers

8.4.3. 算法推测:所有的奇数可重分解因子数都是完全平方数

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1662305.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于vgg16和efficientnet卷积神经网络的天气识别系统(pytorch框架)全网首发【图像识别-天气分类】

一个能够从给定的环境图像中自动识别并分类天气(如晴天、多云、雨天、雪天闪电等)的系统。 技术栈: 深度学习框架:PyTorch基础模型:VGG16与EfficientNet任务类型:计算机视觉中的图像分类 模型选择 VGG16 …

螺栓扭矩如何设计?——SunTorque智能扭矩系统

螺栓扭矩设计的大小是一个涉及工程实践的重要问题,它直接关系到螺栓连接的紧固质量和安全性。螺栓扭矩是工程领域中常用的一个概念,用来描述螺栓在连接过程中所需的旋转力矩。正确的螺栓扭矩可以确保螺栓和螺母之间的紧密连接,避免由于松动而…

JINGWHALE 虚拟现实物质与空间理论 —— 全息世界

JINGWHALE 对此论文相关未知以及已知概念、定理、公式、图片等内容的感悟、分析、创新、创造等拥有作品著作权。未经 JINGWHALE 授权,禁止转载与商业使用。 一、虚拟现实物质与空间理论 物质是由离散的奇点JING粒子,依据不同的维度粒度,通过…

《解锁高效合同管理系统:优化业务流程,提升管理效率》

随着企业规模的扩大和业务复杂性的增加,合同管理变得愈发重要。合同是企业与客户、供应商、合作伙伴之间的法律约束和商业承诺,而有效的合同管理系统则成为企业提高运营效率、降低风险的关键工具。本文将探讨合同管理系统的重要性以及如何利用合同管理系…

网络编程——Socket——模拟用户登录

功能一:模拟用户登录 功能二:实现客户发送登录用户信息,服务器端显示登录信息并响应给客户端登录成功 这里设置的用户登录信息为:admin,123456 实现: 1.首先,服务端创建并启动服务器&#x…

selenium爬取TapTap评论

上一篇写的beautifulsoup和request爬取出的结果有误。首先,TapTap网页以JS格式解析,且评论并没有“下一页”,而是每次加载到底部就要进行等待重新加载。我们需要做的,是模仿浏览器的行为,所以这里我们用Selenium的方式…

STM32_HAL_RTC_中断实现闹钟

1STM32设置 在STM32Cude中设置RTC//具体设置看先前发的文章 再打开闹钟中断(如下图) 2代码思路 2.1启动闹钟(HAL_RTC_SetAlarm_IT(&hrtc,&sAlarm,FORMAT_BCD)) 2.2设置回调函数(void HAL_RTC_AlarmAEventC…

C++ VScode: launch: program ...... dose not exist

VScode: launch: program … dose not exist 介绍 参考VS Code 配置 C/C 编程运行环境(保姆级教程)教程配置了VSCode。在配置launch.json适用多个.c 文件编译时,弹出下面错误。 原因和解决方法 是task.json 默认配置的问题。 默认的 cwd参…

内网远程软件哪个好用

内网远程软件哪个好用 在现代化的办公环境中,内网远程软件已成为提高工作效率、实现灵活办公的重要工具。然而,市场上内网远程软件众多,究竟哪个好用呢?本文将为您推荐几款优秀的内网远程软件,并分析其特点&#xff0…

将来会是Python、Java、Golang三足鼎立吗?

在开始前我有一些资料,是我根据网友给的问题精心整理了一份「 Java的资料从专业入门到高级教程」, 点个关注在评论区回复“888”之后私信回复“888”,全部无偿共享给大家!!! 软件工程里没有银弹&#xff…

【Mac】Indesign 2023 Mac(ID2023) v18.5中文版安装教程

软件介绍 Adobe InDesign是一款由Adobe Systems开发的桌面排版软件,旨在用于创建、编辑和格式化印刷和数字出版物,如书籍、杂志、报纸、传单等。以下是一些关于Adobe InDesign的主要特点和功能: 1.强大的排版工具:InDesign提供了…

【Java难点】多线程-终极【更新中...】

Java内存模型之JMM 为什么需要JMM 计算机存储结构:从本地磁盘到主存到CPU缓存,也就是从硬盘到内存,到CPU。一般对应的程序的操作就是从数据库查数据到内存然后到CPU进行计算。 CPU和物理主内存的速度不一致,所以设置多级缓存&am…

JAVA 双亲委派之一

JAVA 双亲委派之一 JVM类加载流程 java语言系统内置了众多类加载器,从一定程度上讲,只存在两种不同的类加载器:一种是启动类加载器,此类加载由C实现,是JVM的一部分;另一种就是所有其他的类加载器&#xf…

《软件方法(下)》8.3.2.2 警惕拼凑泛化(202405更新)

DDD领域驱动设计批评文集 做强化自测题获得“软件方法建模师”称号 《软件方法》各章合集 8.3 建模步骤C-2 识别类的关系 8.3.2 识别泛化关系 8.3.2.1 识别泛化的思路 (3)自上而下(从一般到特殊) 如图8-92所示,这…

西湖大学英语听力考试音频无线发射系统-英语听力发射系统浅析

西湖大学英语听力考试音频无线发射系统-英语听力发射系统浅析 由北京海特伟业科技任洪卓发布于2024年5月10日 西湖大学,这所矗立于时代前沿的高等学府,始终秉持着创新精神和追求卓越的坚定信念,不断致力于教学质量的提升与学术研究的深化。其…

verilog中含有无关项的序列检测

编写一个序列检测模块,检测输入信号a是否满足011XXX110序列(长度为9位数据,前三位是011,后三位是110,中间三位不做要求),当信号满足该序列,给出指示信号match。 程序的接口信号图如…

能聚合各站热点的DailyHot

什么是 DailyHot ? 今日热榜(DailyHot)是一个获取各大热门网站热门头条的聚合网站,能追踪全网热点、实现简单高效阅读。项目分为前、后端,其中后端提供了一个聚合热门数据的 API 接口。 🚩 后端 API 特性 极快响应&a…

Gradient发布支持100万token的Lllama3,上下文长度从8K扩展到1048K

前言 近日Gradient公司在Crusoe Energy公司的算力支持下,开发了一款基于Llama-3的大型语言模型。这款新模型在原Llama-3 8B的基础上,将上下文长度从8000 token大幅扩展到超过104万token。 这一创新性突破,展现了当前SOTA大语言模型在长上下…

kali安装及替换源

一、安装及简单配置 1.安装:地址就不贴了,自己打一下就好 2.虚拟机中打开kali 3.替换包源 (1)使用指令打开/etc/apt/sources.list mousepad /etc/apt/sources.list (2)将内容替换成阿里云源 deb http://mirrors.aliyun.com/kali kali-rolling main n…

DeepMind的首席执行官Demis Hassabis表示,未来一到两年内,能够独立完成复杂任务的AI代理将成为现实

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…