AI大模型探索之路-资料篇:大模型开发相关地址信息收藏

news2024/11/15 21:50:07

文章目录

  • 前言
  • 一、OpenAI大模型
  • 二、LangChain开发框架
  • 三、RAGA评估框架
  • 四、GLM大模型
  • 五、搜索服务
    • 1. Tavily Search API
  • 六、文本LLM大模型
  • 七、多模态LLM模型
  • 八、模型排行榜
    • 1.大模型评测体系(司南OpenCompass)
    • 2.大模型排行榜(DataLearner AI)
    • 3.CLiB中文大模型能力评测榜单
    • 4.Embeddings模型排行榜


前言

本文的核心目的在于梳理和汇编大型模型开发领域内的相关资料与资源。通过集中整理这些信息,为后续大模型语言应用开发实践提供一个便捷的知识库和参考入口。


一、OpenAI大模型

官网地址:https://platform.openai.com/docs/introduction
中文文档地址:https://www.openaidoc.com.cn/docs/introduction (没有官网更新那么及时
github源码地址:https://github.com/openai/openai-cookbook
在这里插入图片描述

二、LangChain开发框架

LangChain是一个为开发者设计的框架,用于构建由大型语言模型(LLM)驱动的端到端应用程序。
Langchain官网:https://python.langchain.com/docs/get_started/introduction
Langchain中文网:http://docs.autoinfra.cn/
LangSmith地址:https://smith.langchain.com/
github源码地址:https://github.com/langchain-ai/langchain

在这里插入图片描述

三、RAGA评估框架

官网地址:https://docs.ragas.io/en/latest/getstarted/index.html
RAGA评估框架是一种自动化评估工具,它旨在评估检索增强生成模型(Retrieval Augmented Generation Models)的质量。这种类型的模型通常包括两个主要组件:一个检索系统和一个语言模型。检索系统负责从大量文本中找出与给定问题最相关的信息,而语言模型则利用这些信息来生成答案。RAGA评估框架关注的是这两个组件的协同工作能力,以及它们共同产生的结果的质量。
在这里插入图片描述

四、GLM大模型

由清华智谱研发的一个开源的、高性能中英双语对话语言模型。

1) github仓库地址:https://github.com/THUDM/ChatGLM3
2) huggingface上的预训练模型下载地址:https://huggingface.co/THUDM/chatglm3-6b
3)嵌入模型:https://huggingface.co/BAAI/bge-large-zh-v1.5
其他常用的中文嵌入模型text2vec-base-chinese
https://huggingface.co/shibing624/text2vec-base-chinese

备注:也可在gitee上下载huggingface的模型: https://gitee.com/hf-models

五、搜索服务

1. Tavily Search API

官网地址:https://tavily.com/
Tavily Search API被设计成一个专门为AI代理服务的搜索引擎。它旨在提供一个可扩展、易于集成、并且能够满足AI代理特定需求的搜索API,使得AI代理能够更加高效地获取精确、相关的在线信息。这样的API可以帮助AI代理更好地理解和响应用户的查询,提供更加准确和个性化的结果。

在这里插入图片描述

六、文本LLM大模型

1)ChatGLM:
地址::https://github.com/THUDM/ChatGLM3
ChatGLM是中文领域效果最好的开源底座模型之一,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持
2)ChatGLM3-6B
地址https://github.com/THUDM/ChatGLM-6B
ChatGLM3-6B 是 ChatGLM3 系列中的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上,ChatGLM3-6B 引入了如下特性:更强大的基础模型: ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略;更完整的功能支持: ChatGLM3-6B 采用了全新设计的 Prompt 格式,除正常的多轮对话外。同时原生支持工具调用(Function Call)、代码执行(Code Interpreter)和 Agent 任务等复杂场景;更全面的开源序列: 除了对话模型 ChatGLM3-6B 外,还开源了基础模型 ChatGLM3-6B-Base、长文本对话模型 ChatGLM3-6B-32K。以上所有权重对学术研究完全开放,在填写问卷进行登记后亦允许免费商业使用。
3)Qwen
地址:https://github.com/QwenLM/Qwen
通义千问 是阿里云研发的通义千问大模型系列模型,包括参数规模为18亿(1.8B)、70亿(7B)、140亿(14B)和720亿(72B)。各个规模的模型包括基础模型Qwen,即Qwen-1.8B、Qwen-7B、Qwen-14B、Qwen-72B,以及对话模型Qwen-Chat,即Qwen-1.8B-Chat、Qwen-7B-Chat、Qwen-14B-Chat和Qwen-72B-Chat。数据集包括文本和代码等多种数据类型,覆盖通用领域和专业领域,能支持8K的上下文长度,针对插件调用相关的对齐数据做了特定优化,当前模型能有效调用插件以及升级为Agent。
4)OpenChineseLLaMA:
地址:https://github.com/OpenLMLab/OpenChineseLLaMA
OpenChineseLLaMA基于 LLaMA-7B 经过中文数据集增量预训练产生的中文大语言模型基座,对比原版 LLaMA,该模型在中文理解能力和生成能力方面均获得较大提升,在众多下游任务中均取得了突出的成绩。

七、多模态LLM模型

1)CogVLM
地址:https://github.com/THUDM/CogVLM
CogVLM是一个强大的开源视觉语言模型(VLM)。CogVLM-17B 拥有 100 亿视觉参数和 70 亿语言参数。 CogVLM-17B 在 10 个经典跨模态基准测试上取得了 SOTA 性能。CogVLM 能够准确地描述图像,几乎不会出现幻觉。

2)Qwen-VL
地址:https://github.com/QwenLM/Qwen-VL
Qwen-VL是阿里云研发的大规模视觉语言模型,可以以图像、文本、检测框作为输入,并以文本和检测框作为输出。特点包括:强大的性能:在四大类多模态任务的标准英文测评中上均取得同等通用模型大小下最好效果;多语言对话模型:天然支持英文、中文等多语言对话,端到端支持图片里中英双语的长文本识别;多图交错对话:支持多图输入和比较,指定图片问答,多图文学创作等;

八、模型排行榜

1.大模型评测体系(司南OpenCompass)

地址:https://rank.opencompass.org.cn/home
上海人工智能实验室正式发布大模型开源开放评测体系司南(OpenCompass2.0),旨在为大语言模型、多模态模型等各类模型提供一站式评测服务。
在这里插入图片描述

2.大模型排行榜(DataLearner AI)

地址:https://www.datalearner.com/ai-models/leaderboard/datalearner-llm-leaderboard
DataLearner AI 提供了最新的大模型排行榜、深入的大模型评测、丰富的大模型数据集,以及每日更新的人工智能与大模型相关的资讯
在这里插入图片描述

3.CLiB中文大模型能力评测榜单

地址:https://github.com/jeinlee1991/chinese-llm-benchmark?tab=readme-ov-file
CLiB中文大模型能力评测榜单
目前已囊括77个大模型,覆盖chatgpt、gpt4、谷歌bard、百度文心一言、阿里通义千问、讯飞星火、360智脑、商汤senseChat、微软new-bing、minimax等商用模型, 以及百川、qwen、belle、chatglm6b、tigerbot、ziya、openbuddy、Phoenix、linly、MOSS、AquilaChat、vicuna、wizardLM、书生internLM、llama2-chat等开源大模型。综合能力排行榜:综合能力得分为分类能力、信息抽取能力、阅读理解能力、数据分析能力四者得分的平均值
在这里插入图片描述

4.Embeddings模型排行榜

地址:https://huggingface.co/spaces/mteb/leaderboard
Huggingface上的mteb是一个海量Embeddings排行榜,定期会更新Huggingface开源的Embedding模型各项指标,进行一个综合的排名。
在这里插入图片描述

探索未知,分享所知;点击关注,码路同行,寻道人生!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1616895.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于SSM的在线家教管理系统(含源码+sql+视频导入教程)

👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述 基于SSM的在线家教管理系统1拥有三种角色 管理员:学生管理、老师管理、发布管理、留言管理、回复管理、订单管理等教师:我的订单、我的关注、查看回复留言、登录注…

如何加盟共享wifi项目?了解套路有哪些?

自共享wifi项目推出在市场火爆后,各路资本都看到了该项目的广阔前景,纷纷开始研发程序,想要趁机分一杯羹。但对于普通人而言,独立研发程序显然不大现实,于是,共享wifi项目如何加盟便成为了绝大多数人最为关…

Sql Server 数据库:查询表结构脚本

查询脚本: SELECT CASE WHEN col.colorder 1 THEN obj.name ELSE END AS 表名, col.colorder AS 序号 , col.name AS 列名 , ISNULL(ep.[value], ) AS 列说明 , t.name AS 数据类型 , col.length AS 长度 , ISNULL(COLUMNPROPERTY(col.id, col.name, Scale), 0) AS 小数位数…

Python与数据库连接

新建表boss create table 创建表 Code import pymysqlcon pymysql.connect(hostlocalhost,\userroot,\password,\port3306,\dbbusiness) cursorcon.cursor() cursor.execute(create table if not exists boss(id int auto_increment primary key,name varchar(20)not null…

可持续发展:制造铝制饮料罐要消耗多少资源?

铝制饮料罐是人们经常使用的日常用品,无论是在购物、午休还是在自动售货机前选择喝什么的时候,很少有人会想知道装他们喝的饮料的罐子到底是如何制成的,或者这些铝罐的原材料是如何进出的。 虽然有化学品和一些合金进入铝饮料罐制造过程或成为…

成都直播产业园「天府锋巢」电商流量深度变现,助力企业降本增效

天府锋巢园区环境 天府锋巢直播基地 其他重点特色产业服务 等您来解锁! 「锋巢资讯 聚焦天府 诚邀企业 敬请关注」

Java中的BIO、NIO与AIO

1.概述 I/O 模型简单的理解:就是用什么样的通道进行数据的发送和接收,很大程度上决定了程序通信的性能。Java 共支持 3 种网络编程模型 I/O 模式:BIO、NIO、AIO。 2.Java BIO Java BIO(Blocking I/O):是传统的java io 编程&#…

java Web-Spring AOP

AOP的概念 AOP:面向切面编程,面向方法编程。简单理解就是对特定方法的扩充的思想 例如我们要在特定方法进行方法的执行时间判断,我们假如去使用在每个方法去进行业务逻辑扩充,这样就太繁琐了,而使用AOP就可以简化操作。Spring A…

vue3中web前端JS动画案例(四)侧边栏横幅效果-右下角广告-淘宝案例

myJsAnimation.js, 这里使用了上次封装的动画方法,并进行了改造 /*** 动画的函数* dom 当前对象* JSON 传入元素对象的属性 {"width": 300, "opacity": 50}* * -------------------- 多物体运动,同时运动 ---传入JSON-------------*…

Unity Shader 图形学【笔记一】

游戏图形学 源自:计算机图形学 涵盖:图形、动画的创建渲染展示 目标:性能优化、提高视觉质量,增强用户体验 技术:三维模型、纹理、光照、阴影、特效、动画、物理模拟、碰撞检测等 Unity Shader 是:un…

力扣-1844.将所有数字用字符替换

思路: 1. class Solution::定义了一个名为 Solution 的类,用于包装解决问题的方法。 2. def replaceDigits(self, s: str) -> str::定义了一个名为 replaceDigits 的方法,该方法接受一个字符串 s 作为参数&#x…

gitee / github 配置git, 实现免密码登录

文章目录 怎么配置公钥和私钥验证配置成功问题 怎么配置公钥和私钥 以下内容参考自 github ssh 配置,gitee的配置也是一样的; 粘贴以下文本,将示例中使用的电子邮件替换为 GitHub 电子邮件地址。 ssh-keygen -t ed25519 -C "your_emai…

Kotlin语法快速入门--条件控制和循环语句(2)

Kotlin语法入门–条件控制和循环语句(2) 文章目录 Kotlin语法入门--条件控制和循环语句(2)二、条件控制和循环语句1、if...else2、when2.1、常规用法2.2、特殊用法--并列:2.3、特殊用法--类型判断:2.4、特殊…

OLED透明屏的寿命如何?

OLED透明屏的寿命一般在20年左右,但如果是旧款,其寿命可能会缩短至15年左右。然而,这个数字并不是绝对的,因为不同用户的使用和保养方法会导致OLED透明屏的寿命出现延长或缩短。例如,长时间使用或在强光、高对比度高亮…

力扣刷题学习python(跟随视频学着刷)

使用入门 视频链接 【手把手带你刷Leetcode力扣|各个击破数据结构和算法|大厂面试必备技能【已完结】-哔哩哔哩】 https://b23.tv/vIcRT61 时空复杂度 时间: 空间:主要有O(1)和O(n)两种 数组 特点:适合读多写少 操作…

Leetcode 118 杨辉三角

目录 一、问题描述二、示例及约束三、代码方法一:数学 四、总结 一、问题描述 给定一个非负整数 numRows,生成「杨辉三角」的前 numRows 行。   在「杨辉三角」中,每个数是它左上方和右上方的数的和。 二、示例及约束 示例 1&#xff1a…

SQL的基础语句

1、select语句 select colums from table_name 2、条件语句 #查询出查询出用户id为1和3的用户记录 IN 操作符允许我们在 WHERE 子句中规定多个值。 select * from student where id in (1,3) #查询出所有姓王的同学 模糊查询 like 通配符(% 任意多个字符 _单个字符) #下例…

AR HUD_VSLAM+显示技术

智能座舱的一个重要技术方向是表达与展示。HUD可以将驾驶相关的信息,如车速、导航等投射到驾驶员的视线上方,避免驾驶员的目光离开前方道路。这种显示方式可以提供关键信息的实时展示,减少驾驶员的分心。 HUD的技术原理就是通过光学系统将信息…

突破文化壁垒:海外社交媒体营销的内容创新与个性化策略

随着全球化的加速和互联网的普及,海外社交媒体营销已成为企业拓展国际市场、提升品牌影响力的重要手段。然而,如何在众多品牌中脱颖而出,吸引海外用户的关注,却是一个值得深入探讨的问题。本文Nox聚星将和大家从内容创新和个性化策…

考研日常记录(upd 24.4.22)

由于实在太无聊了 , 所以记录以下考研备考日常 , 增加一点成就感 , 获得一点前进动力。 文章目录 2024.4.18 周四课程情况:时间规划: 2024.4.19 周五课程情况:时间规划: 2024.4.20 周六2024.4.2…