llM项目分类与原理解析
Prompt项目
直接产出一些具体的文本与信息,使用markdown的格式。
对prompt进行较好的格式输出,固定格式。
ChatPaper
快速获取论文内容,然后了解对应的信息,判断是否有必要阅读这一篇论文
ChatBI,ChatEXcel类
将用户输入的信息文本,转化为SQL语句,用户上传数据文件,在使用指令对数据进行操作
直接将text转化为代码文件,直接用代码操作表格
ChatPPT
逻辑:PPT是一种文件格式,理解可以通过代码操作文件就可以。
格式:确定PPT模版,例如第一种PPT是需要一张图片,设置图片的透明度等等,其实就确定了第一张PPT的格式就行。
内容:使用大模型能力,输出大量文本信息,输出主主题,子标题,结合PPT格式输出。
如果要处理的数据很多,超过token限制怎么办?
第一,裁剪文本,将一万字文本裁剪为更小的文本,进行信息总结,但是会丢失很多信息
第二:
一个适合初学者的小项目:
将人类世界的文本,转变的那个向量空间?
对于专业领域,最好训练自己的embedding模型
遇到通用模型解决不了的问题怎么办?
datawhale,有比较多的项目分类,也有众多的学习者,大家在这里是可以找到不错的伙伴的。
非常推荐!