开源项目_代码生成项目介绍

news2024/11/17 11:41:52

1 CodeGeeX 系列

1.1 CodeGeeX

  • 项目地址:https://github.com/THUDM/CodeGeeX 7.6k Star
  • 主要由 Python 编写
  • 深度学习框架是 Mindspore
  • 代码约 2.5W 行
  • 有 Dockerfile,可在本地搭建环境
  • 模型大小为 150 亿参数
  • 相对早期的代码生成模型,开放全部代码

1.2 CodeGeeX2

  • 项目地址:https://github.com/THUDM/CodeGeeX2 6.5k Stat
  • 主要由 Python 编写
  • 推理部分开源,通过 pytorch 调用
  • 代码约 1900 行,主要为示例和评测
  • 基于 ChatGLM2 架构,模型部分也没开源,只开源推理部分
  • 模型 60 亿参数,6G 显存即可运行
  • 使用 600 B 代码数据预训练
  • 支持最大 8192 序列长度

1.3 其它资源

  • 官网:https://codegeex.cn/

1.4 讨论

CodeGeeX 与 CodeGeeX2 效果对比如下:

2 ChatGLM 系列

2.1 ChatGLM2

  • 项目地址:https://github.com/THUDM/ChatGLM2-6B 15.2k Star
  • 代码:用 Python 实现,代码量约 1200
  • 基于 Pytorch 框架
  • 模型可在 huggingface 下载,支持本地部署
  • 提供 ChatGLM2-6B 模型基于 P-Tuning v2 的微调功能

2.2 ChatGLM3

  • 项目地址:https://github.com/THUDM/ChatGLM3 10.1k Star
  • 代码:用 Python 实现,代码量约 3200
  • 基于 Pytorch 框架
  • 模型可在 huggingface 下载,支持本地部署
  • 支持微调,微调说明:https://github.com/THUDM/ChatGLM3/tree/main/finetune_demo
  • 官网说明:https://zhipu-ai.feishu.cn/wiki/WvQbwIJ9tiPAxGk8ywDck6yfnof

2.3 讨论

  • ChatGLM 2 之后模型框架就不再开源,但可以通过打印模型结构看一下,传说 GLM 架构变为 llama 架构

3 code llama 系列

3.1 codellama

  • 项目地址:https://github.com/facebookresearch/codellama 13.7k Star
  • 代码非常之简单,只有 929 行
  • 基于 Pytorch 框架,模型在 meta 网站下载
  • 相关论文:https://arxiv.org/abs/2308.12950

3.2 llama-gpt

  • 项目地址:https://github.com/getumbrel/llama-gpt
  • 支持 code llama model

4 参考

【llm大语言模型】code llama详解与应用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1488760.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【PCL】 (十六)点云距离图可视化

&#xff08;十六&#xff09;点云距离图可视化 以下代码实现点云及其对应距离图的可视化。 数据样例&#xff1a;sphere100.pcd range_image_visualization.cpp #include <iostream>#include <pcl/range_image/range_image.h> #include <pcl/io/pcd_io.h&g…

CHI协议学习

原始文档&#xff1a;https://developer.arm.com/documentation/102407/0100/?langen CHI 总线拓扑结构 CHI总线拓扑是实现自定义的&#xff0c;可以是RING/MESH/CROSSBAR的类型&#xff1b; RING 一般适用于中等规模芯片MESH 一般适用于大规模芯片CROSSBAR 一般适用于小规模…

30天JS挑战(第十五天)------本地存储菜谱

第十五天挑战(本地存储菜谱) 地址&#xff1a;https://javascript30.com/ 所有内容均上传至gitee&#xff0c;答案不唯一&#xff0c;仅代表本人思路 中文详解&#xff1a;https://github.com/soyaine/JavaScript30 该详解是Soyaine及其团队整理编撰的&#xff0c;是对源代…

11.互信息-机器学习模型性能的常用的评估指标

互信息&#xff08;Mutual Information&#xff09;是机器学习中常用的一种评估指标&#xff0c;特别是在无监督学习和聚类分析中。它用于衡量两个随机变量之间的相关性或相似性。 定义 给定两个随机变量X和Y&#xff0c;它们的互信息I(X;Y)定义如下&#xff1a; 其中&…

命名空间(namespace)

定义 在C中&#xff0c;命名空间&#xff08;Namespace&#xff09;是一个特性&#xff0c;用于封装代码并避免名称冲突。命名空间可以看作是一个容器&#xff0c;其中可以包含类、函数、变量、常量、其他命名空间等。通过使用命名空间&#xff0c;我们可以更好地组织代码&…

linux gdb 调试工具

1.写程序 首先&#xff0c;我们先写出一个 .c 或者.cpp程序 如 然后 gcc -g hello.c -o hello 或者 g -g hello.cpp -o hello &#xff08;-g&#xff09;要加 2. gdb调试 用 gdb &#xff08;可执行程序&#xff0c;如hello&#xff09; 进入之后&#xff0c;有…

redis实战笔记汇总

文章目录 1 NoSQL入门概述1.1 能干嘛&#xff1f;1.2 传统RDBMS VS NOSQL1.3 NoSQL数据库的四大分类1.4 分布式数据库CAP原理 BASE原则1.5 分布式集群简介1.6 淘宝商品信息的存储方案 2 Redis入门概述2.1 是什么&#xff1f;2.2 能干嘛&#xff1f;2.3 怎么玩&#xff1f;核心…

《幻兽帕鲁》游戏对服务器性能的具体要求是什么?

《幻兽帕鲁》游戏对服务器性能的具体要求是什么&#xff1f; CPU&#xff1a;官方最低要求为i5-3570K&#xff0c;但在多人游玩时可能会有明显卡顿。此外&#xff0c;还有建议选择4核或更高性能的处理器&#xff0c;以确保游戏运行流畅。 内存&#xff1a;对于不同人数的联机&…

LL-34/DO-213AC/MiniMELF/NSMC/DO-213AB封装

最近在找几个特殊的二极管封装&#xff0c;能查到资料太少了&#xff0c;如同大海捞针&#xff0c;好不容易找到了一些资料&#xff0c;把相关信息总结一下. 1、LL-34/DO-213AC/MiniMELF/SOD80这三个封装尺寸很接近 LL-34以c5345992为例 MiniMELF以c131658为例 2、NSMC这个封装…

盘点3个正规靠谱的赚钱软件,作为副业,空闲时间发小财

随着移动互联网的蓬勃发展&#xff0c;手机成为了我们生活中不可或缺的一部分&#xff0c;更是赚钱的新工具。然而&#xff0c;面对琳琅满目的赚钱软件&#xff0c;如何挑选出那些既靠谱又正规的平台呢&#xff1f;接下来&#xff0c;我将为大家揭秘几款备受推崇的赚钱软件。 1…

20240304-1-操作系统

操作系统 知识体系 Questions 1.进程和线程的区别 进程是系统进行资源分配和调度的基本单位&#xff1b;线程是CPU调度和分派的基本单位。 每个进程都有独立的代码和数据空间&#xff08;程序上下文&#xff09;&#xff0c;程序之间的切换会有较大的开销&#xff1b;线程可…

#QT(智能家居界面-界面切换)

1.IDE&#xff1a;QTCreator 2.实验 3.记录 &#xff08;1&#xff09;创建一个新界面&#xff08;UI界面&#xff09; &#xff08;2&#xff09;可以看到新加入一个ui文件&#xff0c;双击打开&#xff0c;设置窗口大小与登录界面一致 &#xff08;3&#xff09;加入几个PUS…

使用echarts生成颜色渐变曲线图

效果图: 1、安装echarts npm install echarts --save2、全局注册组件 import * as echarts from echarts; Vue.prototype.$echarts echarts3、结构 附: 计算显示日期的工具文件 /** 计算月份显示* param {} * returns {}*/export function getLastFiveMonths() {let date…

【Python】进阶学习:pandas--read_excel()函数的基本使用

【Python】进阶学习&#xff1a;pandas–read_excel()函数的基本使用 &#x1f308; 个人主页&#xff1a;高斯小哥 &#x1f525; 高质量专栏&#xff1a;Matplotlib之旅&#xff1a;零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程&#x1f448; 希…

【Mybatis】动态语句 第三期

文章目录 *一、if和where标签二、set标签三、trim标签四、choose/when/otherwise标签*五、foreach标签 ( 批量操作六、sql片段 *一、if和where标签 如果传入属性&#xff0c;就判断相等。不传入不加对应的条件。 if 判断传入的参数&#xff0c;最终是否添加语句 test 属性 &am…

139.乐理基础-一四五八度为何用纯?

上一个内容&#xff1a;138.乐理基础-等音、等音程的意义-CSDN博客 上一个内容里练习的答案&#xff1a; 以乐理里写的知识&#xff0c;没办法完全解释透彻 一四五八度为何用纯&#xff1f;这个问题&#xff0c;要透彻的话要从各个文明怎么发现音高、发明音高、制定规则等&…

如何在Vue中实现事件处理?

Vue是一种流行的JavaScript框架&#xff0c;广泛应用于前端开发。在Vue中&#xff0c;事件处理是一个非常关键的概念&#xff0c;可以帮助我们实现用户与页面的交互&#xff0c;今天我们就来探讨一下如何在Vue中实现事件处理。 首先&#xff0c;让我们先了解一下在Vue中如何绑…

【数据结构】实现堆

大家好&#xff0c;我是苏貝&#xff0c;本篇博客带大家了解堆&#xff0c;如果你觉得我写的还不错的话&#xff0c;可以给我一个赞&#x1f44d;吗&#xff0c;感谢❤️ 目录 一. 堆的概念及结构二. 堆的实现堆的结构体初始化销毁插入数据删除数据&#xff08;默认删除堆顶即…

基于Mahout实现K-Means聚类

需求分析 需要对数据集进行预处理&#xff0c;选择合适的特征进行聚类分析&#xff0c;确定聚类的数量和初始中心点&#xff0c;调用Mahout提供的K-Means算法进行聚类计算&#xff0c;评估聚类结果的准确性和稳定性。同时&#xff0c;需要对Mahout的使用和参数调优进行深入学习…