李宏毅LLM探索(1)

news2024/11/28 6:56:20

1引入

1.1 提问:请列出你能做的事情,至少三十项,每一项都简单扼要:然后把你能做的事情制成文字云

文心一言生成:

以下是我能做的至少三十项事情,每一项都简单扼要地列出:

回答问题
提供信息
生成文本
理解语言
进行翻译
编写代码
分析数据
给出建议
创作故事
编写文章
生成诗歌
解答数学问题
提供历史知识
讲解科学知识
分析文学作品
给出旅行建议
提供健康建议
生成笑话
识别图像
描述图像内容
播放音乐
列出清单
提供生活技巧
解答法律问题
给出财务建议
讲解技术知识
提供学习资源
讲述历史事件
分析社会现象
给出人生建议
接下来,将这些内容制成一个文字云的描述(由于实际的文字云图像需要图形软件生成,这里以文字形式描述):

文字云描述:

在这个文字云中,“回答问题”、“提供信息”、“生成文本”等词汇以较大的字体显示,表示这些是我作为AI助手的核心功能。同时,“理解语言”、“进行翻译”、“编写代码”等词汇也以相对较大的字体出现,展示了我的多语言处理能力和编程技能。

“分析数据”、“给出建议”、“创作故事”等词汇则以中等大小的字体呈现,表明我在数据分析、提供个性化建议和创意写作方面也有一定的能力。

而“解答数学问题”、“提供历史知识”、“讲解科学知识”等词汇则以较小的字体出现,但它们仍然清晰可见,说明我在多个学科领域都有一定的知识储备。

整个文字云呈现出一种丰富多样的视觉效果,各个词汇之间既有明显的区分,又相互关联,共同构成了一个完整、多维的能力体系。

请注意,上述文字云描述是基于文字形式的模拟,实际的文字云图像可能会根据所选的图形软件和参数设置而有所不同。

文心一言优化下在windows系统运行,python3.12环境跑:

from wordcloud import WordCloud
import matplotlib.pyplot as plt

# List of abilities
abilities = [
    "回答问题", "提供信息", "解释概念", "教授知识", "学习新知", "提供建议", "解决难题", "提供娱乐", "讲述故事",
    "写作文章", "编程代码", "分析数据", "创建图表", "设计界面", "翻译语言", "模拟对话", "提供新闻", "播放音乐",
    "推荐书籍", "管理日程", "提醒事项", "发送邮件", "搜索网络", "导航路线", "计算数学", "提供食谱", "教练健身",
    "提供旅游信息", "辅助学习", "组织活动"
]

# Generating the word cloud with Chinese font support
wordcloud = WordCloud(width=800, height=800,
                      background_color='white',
                      min_font_size=10,
                      font_path='C:\\Windows\\Fonts\\simhei.ttf').generate(' '.join(abilities))

# Plotting the WordCloud
plt.figure(figsize=(8, 8), facecolor=None)
plt.imshow(wordcloud)
plt.axis("off")
plt.tight_layout(pad=0)

plt.show()

在这里插入图片描述

智谱清言回答:

from wordcloud import WordCloud
import matplotlib.pyplot as plt

# List of abilities
abilities = [
    "回答问题", "提供信息", "解释概念", "教授知识", "学习新知", "提供建议", "解决难题", "提供娱乐", "讲述故事",
    "写作文章", "编程代码", "分析数据", "创建图表", "设计界面", "翻译语言", "模拟对话", "提供新闻", "播放音乐",
    "推荐书籍", "管理日程", "提醒事项", "发送邮件", "搜索网络", "导航路线", "计算数学", "提供食谱", "教练健身",
    "提供旅游信息", "辅助学习", "组织活动"
]

# Generating the word cloud
wordcloud = WordCloud(width=800, height=800,
                      background_color='white',
                      min_font_size=10).generate(' '.join(abilities))

# Plotting the WordCloud
plt.figure(figsize=(8, 8), facecolor=None)
plt.imshow(wordcloud)
plt.axis("off")
plt.tight_layout(pad=0)

plt.show()


"""# Re-generating the word cloud with Chinese font support
wordcloud = WordCloud(width=800, height=800,
                      background_color='white',
                      min_font_size=10,
                      font_path='/usr/share/fonts/true type/dejavu/DejaVuSans-Bold.ttf').generate(' '.join(abilities))

# Plotting the WordCloud
plt.figure(figsize=(8, 8), facecolor=None)
plt.imshow(wordcloud)
plt.axis("off")
plt.tight_layout(pad=0)

plt.show()"""

在这里插入图片描述

2 LLM两大思路

在这里插入图片描述
(1)改变自己来强化模型

这一思路主要聚焦于对现有模型架构、算法或处理流程进行改进和创新,以适应更复杂、更多变的任务需求。具体实践包括:

指令优化:通过设计更精确、更具体的指令来引导模型进行学习和推理。这要求我们对模型的理解能力有深入的认识,并能够根据任务特性定制化的指令,使模型能够更准确地捕捉任务意图。
引入外部知识:结合外部数据源或知识库,为模型提供额外的背景信息和知识支持。这有助于模型在处理特定领域任务时,能够调用更丰富的知识资源,提升任务的完成质量和效率。
模型结构调整:对模型的网络结构、层数、激活函数等关键组件进行改进和优化。通过调整这些关键参数,可以进一步挖掘模型的潜力,提升其表达能力和泛化能力。

(2)训练自己的模型

这一思路则侧重于从零开始或基于开源模型进行再训练,以构建符合特定任务需求的定制化模型。具体实践包括:

数据收集与预处理:根据任务需求,收集并整理高质量的训练数据。同时,对数据进行预处理,如去噪、归一化、增强等,以提高数据的质量和可用性。
模型选择与初始化:选择合适的模型架构,并根据任务特性进行初始化设置。这可以基于开源模型进行微调,也可以从头开始设计新的模型架构。
训练过程优化:通过调整训练策略、优化器选择、学习率调整等手段,提高模型的训练效率和性能。同时,关注模型的过拟合问题,采取正则化、dropout等策略进行预防。
评估与迭代:在训练过程中,定期对模型进行评估,以了解其在测试集上的表现。根据评估结果,对模型进行迭代优化,不断提升其性能。

3 提问-使用工具

3.1 使用工具-搜索引擎

在这里插入图片描述
提问:
请介紹 OpenAl 的 Sora(上网搜寻后回答)

3.2 使用工具-写程序

在这里插入图片描述

3.3 使用工具-文字生圖 AI(DALL-E)

在这里插入图片描述
在这里插入图片描述

4 提问示例收集

4.1 我提供一个版本的翻译给你,你有更好的翻譯嗎?如果有的話请提供(你不需要完全同意我的看法)

4.2 原始问题:请告诉我如何学习编程

**优化问题:**作为编程初学者,我希望学习一种易于上手且适合初学者的编程语言,并了解该语言的学习资源和推荐的学习路径。

效果比较:
原始问题过于宽泛,可能得到一般性的回答。
优化问题明确了目标群体(编程初学者)、具体需求(易于上手的编程语言、学习资源和路径),有助于获得更针对性的建议。

4.3 原始问题:请分析当前经济形势。

**优化问题:**请基于最新的经济数据,分析当前全球经济形势,并预测未来一年的发展趋势。

4.4 原始问题:请给我推荐一款手机。

**优化问题:**我需要一款拍照功能强大、电池续航时间长、价格不超过5000元的手机,请给我推荐几款并说明理由。

4.5 请介绍一本好书。

**优化问题:**我对心理学感兴趣,请推荐一本关于心理学的好书,并简要介绍其内容。

5 发展史

5.1 Pre-train

在这里插入图片描述

5.2 Instrunction Fine-tuning

在这里插入图片描述
在这里插入图片描述

5.3 Reinforcement Learning from Human Feedback (RLHF)

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

6 AI Agent

在这里插入图片描述
用大型語言模型操作机器人
在这里插入图片描述

用大型語言模型開自駕事
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

7 语言模型今日的是如何做文字接龍的Transformer

在这里插入图片描述

7.1 把文字變成 Token

在这里插入图片描述
在这里插入图片描述

7.2 理解每個 Token- 語意

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

7.3 Attention:考慮上下文

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

8 Transformer引申

8.1 Encode

8.2 Decode

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2248897.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

磁盘文件系统问题排查

1. ext4磁盘结构 块组:超级块:块位图:inode位图:inode表:空闲inode表:空闲块表:2. 块组结构 Group 0: (Blocks 0-32767) csum 0xfd42 [ITABLE_ZEROED]Primary superblock at 0, Group descript…

百度雪花算法id默认配置过期注意更新配置

百度雪花id项目地址&#xff1a;GitHub - baidu/uid-generator: UniqueID generator 默认配置根据redme看容易看迷糊&#xff0c;图和配置它压根就不是对应的 默认的配置如下 <!-- Specified bits & epoch as your demand. No specified the default value will be us…

(11)(2.2) BLHeli32 and BLHeli_S ESCs(二)

文章目录 前言 1 传递支持 前言 BLHeli 固件和配置应用程序的开发是为了允许配置 ESC 并提供额外功能。带有此固件的 ESC 允许配置定时、电机方向、LED、电机驱动频率等。在尝试使用 BLHeli 之前&#xff0c;请按照 DShot 设置说明进行操作(DShot setup instructions)。 1 传…

【初阶数据结构和算法】初识树与二叉树的概念以及堆和完全二叉树之间的关系

文章目录 一、树的概念与结构1.树的概念2.树的相关术语3.树的表示4.树形结构实际运用举例 二、二叉树的概念及特殊二叉树1.二叉树的概念2.特殊的二叉树满二叉树完全二叉树二叉树的性质(由满二叉树特点推导) 三、二叉树的存储结构1.二叉树的顺序结构2.二叉树的链式结构 四、堆和…

如何在Canvas中添加背景图片、图片元素和文字元素

Canvas是HTML5中一个强大的元素&#xff0c;它允许我们在网页上进行图形绘制。在本文中&#xff0c;我们将学习如何在Canvas中添加背景图片、图片元素以及文字元素。 创建Canvas元素 首先&#xff0c;我们需要在HTML文档中创建一个<canvas>元素。以下是创建一个500x500像…

单点登录深入详解之设计方案总结

基于cookie的单点登录解决方案 概述 用户登录之后 , 将认证信息存储至 Cookie &#xff0c;当再次访问本服务或者访问其他应用服务时&#xff0c;直接从 Cookie 中传递认证信息&#xff0c;进行鉴权处理。 问题 1. 如何保障Cookie内用户认证信息的安全性? 第一, Cookie…

深入探讨 Redis 持久化机制:原理、配置与优化策略

文章目录 一、引言二、Redis持久化概述三、RDB&#xff08;Redis DataBase&#xff09;持久化1、RDB概念与工作原理2、RDB的配置选项3、RDB优化配置项4、RDB的优势与劣势 三、AOF&#xff08;Append-Only File&#xff09;持久化1、AOF概念与工作原理2、AOF的三种写回策略3、Re…

Java图书管理系统(简易保姆级)

前面学习了这么多知识&#xff0c;为了巩固之前的知识&#xff0c;我们就要写一个图书管理系统来帮助大家复习&#xff0c;让大家的知识融会贯通~~~ 话不多说&#xff0c;直接开始今天的内容~ 首先呢&#xff0c;我们要有一个大体的思路&#xff1a; 实现效果思路有两种情况&a…

网络安全在现代企业中的重要作用

网络安全是这个数字时代最令人担忧的事情之一。对技术的依赖性越来越强&#xff0c;使其同时面临多种网络威胁。其声誉和法律后果的大幅下降可能归因于一次妥协。 这使得良好的网络安全成为所有企业的选择和必需品。本文介绍了网络安全的重要性、企业中常见的网络威胁以及公司…

Zero to JupyterHub with Kubernetes中篇 - Kubernetes 常规使用记录

前言&#xff1a;纯个人记录使用。 搭建 Zero to JupyterHub with Kubernetes 上篇 - Kubernetes 离线二进制部署。搭建 Zero to JupyterHub with Kubernetes 中篇 - Kubernetes 常规使用记录。搭建 Zero to JupyterHub with Kubernetes 下篇 - Jupyterhub on k8s。 参考&…

三维天地助力生产制造企业做好产品质量控制

生产制造业已成为全球经济的重要支柱,随着全球化的深入发展,生产制造业的竞争愈发激烈。在生产过程中难以避免的质量波动可能导致产品不良率上升,影响客户满意度和企业声誉。为确保产品质量是受控且优质的,确保生产过程的稳定性,大多数生产制造企业都在进行精细化管理改革,依靠…

IC数字后端实现之大厂IC笔试真题(经典时序计算和时序分析题)

今天小编给大家分享下每年IC秋招春招必考题目——静态时序分析时序分析题。 数字IC后端笔试面试题库 | 经典时序Timing计算题 时序分析题1&#xff1a; 给定如下图所示的timing report&#xff0c;请回答一下几个问题。 1&#xff09;这是一条setup还是hold的timing report?…

arcgis for js FeatureLayer和GeoJSON一个矢量点同时渲染图形和文本

效果 FeatureLayer和GeoJSONLayer, 一个矢量点同时渲染图形和文本 代码 相关参数自行查阅文档, 这里就不做注释了 示例代码手动创建FeatureLayer方式, 如果是通过远程url加载图层的 渲染方式同理, GeoJSONLayer同理 <!DOCTYPE html> <html lang"zn"><…

单片机将图片数组调出来显示MPU8_8bpp_Memory_Write

界面显示图片是很常见的需求&#xff0c;使用外挂的FLASH是最常用的方法。但是如果图片需求不大&#xff0c;比如说我们只要显示一个小图标&#xff0c;那么为了节省硬件成本&#xff0c;是不需要外挂一颗FLASH芯片的&#xff0c;我们可以将图标转成数组&#xff0c;存在单片机…

Linux八股积累与笔记

1、iptables 是一个用于配置Linux内核防火墙规则的工具。四表五链&#xff1a;在iptables中&#xff0c;有四个表&#xff08;tables&#xff09;和五个链&#xff08;chains&#xff09;&#xff0c;用于管理不同类型的数据包过滤规则。如下&#xff1a; 表&#xff08;Tabl…

51c自动驾驶~合集38

我自己的原文哦~ https://blog.51cto.com/whaosoft/12358456 #GaussianPretrain 万能3D高斯预训练表示&#xff01;爆拉3D检测、Occ、高精地图等四大任务&#xff01; 受Tesla的技术的推动&#xff0c;越来越多的厂商开始走"纯视觉"的路线&#xff0c;多数方案还…

STM32笔记(串口IAP升级)

一、IAP简介 IAP&#xff08;In Application Programming&#xff09;即在应用编程&#xff0c; IAP 是用户自己的程序在运行过程中对 User Flash 的部分区域进行烧写&#xff0c;目的是为了在产品发布后可以方便地通过预留的通信口对产 品中的固件程序进行更新升级。 通常实…

VsCode 插件推荐(个人常用)

VsCode 插件推荐&#xff08;个人常用&#xff09;

解决`-bash: ./configure:/bin/sh^M:解释器错误: 没有那个文件或目录`的问题

解决`-bash: ./configure:/bin/sh^M:解释器错误: 没有那个文件或目录`的问题 一、错误原因分析二、解决方法方法一:使用`dos2unix`工具方法二:使用`sed`命令方法三:使用`tr`命令方法四:在文本编辑器中转换方法五:在Windows系统中使用适当的工具三、预防措施四、总结在使…

Excel如何设置超出单元格的内容不显示?

如图&#xff0c;在使用EXCEL时经常出现超出单元格显示的情况&#xff1a; 如果想要把超出单元格的部分隐藏&#xff0c;需要进行以下设置&#xff1a; 选中想要设置的单元格&#xff0c;然后点击对齐方式右边的按钮&#xff0c;对齐设置&#xff0c;选择“对齐”选项卡&#…