开源项目_代码生成项目介绍

开源项目_代码生成项目介绍

news2025/2/22 21:06:37

1 CodeGeeX 系列

1.1 CodeGeeX

项目地址：https://github.com/THUDM/CodeGeeX 7.6k Star
主要由 Python 编写
深度学习框架是 Mindspore
代码约 2.5W 行
有 Dockerfile，可在本地搭建环境
模型大小为 150 亿参数
相对早期的代码生成模型，开放全部代码

1.2 CodeGeeX2

项目地址：https://github.com/THUDM/CodeGeeX2 6.5k Stat
主要由 Python 编写
推理部分开源，通过 pytorch 调用
代码约 1900 行，主要为示例和评测
基于 ChatGLM2 架构，模型部分也没开源，只开源推理部分
模型 60 亿参数，6G 显存即可运行
使用 600 B 代码数据预训练
支持最大 8192 序列长度

1.3 其它资源

官网：https://codegeex.cn/

1.4 讨论

CodeGeeX 与 CodeGeeX2 效果对比如下：

2 ChatGLM 系列

2.1 ChatGLM2

项目地址：https://github.com/THUDM/ChatGLM2-6B 15.2k Star
代码：用 Python 实现，代码量约 1200
基于 Pytorch 框架
模型可在 huggingface 下载，支持本地部署
提供 ChatGLM2-6B 模型基于 P-Tuning v2 的微调功能

2.2 ChatGLM3

项目地址：https://github.com/THUDM/ChatGLM3 10.1k Star
代码：用 Python 实现，代码量约 3200
基于 Pytorch 框架
模型可在 huggingface 下载，支持本地部署
支持微调，微调说明：https://github.com/THUDM/ChatGLM3/tree/main/finetune_demo
官网说明：https://zhipu-ai.feishu.cn/wiki/WvQbwIJ9tiPAxGk8ywDck6yfnof

2.3 讨论

ChatGLM 2 之后模型框架就不再开源，但可以通过打印模型结构看一下，传说 GLM 架构变为 llama 架构

3 code llama 系列

3.1 codellama

项目地址：https://github.com/facebookresearch/codellama 13.7k Star
代码非常之简单，只有 929 行
基于 Pytorch 框架，模型在 meta 网站下载
相关论文：https://arxiv.org/abs/2308.12950

3.2 llama-gpt

项目地址：https://github.com/getumbrel/llama-gpt
支持 code llama model

4 参考

【llm大语言模型】code llama详解与应用

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1488760.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【PCL】（十六）点云距离图可视化

【PCL】（十六）点云距离图可视化

（十六）点云距离图可视化以下代码实现点云及其对应距离图的可视化。数据样例：sphere100.pcd range_image_visualization.cpp #include <iostream>#include <pcl/range_image/range_image.h> #include <pcl/io/pcd_io.h&g…

阅读更多...

CHI协议学习

CHI协议学习

原始文档：https://developer.arm.com/documentation/102407/0100/?langen CHI 总线拓扑结构 CHI总线拓扑是实现自定义的，可以是RING/MESH/CROSSBAR的类型； RING 一般适用于中等规模芯片MESH 一般适用于大规模芯片CROSSBAR 一般适用于小规模…

阅读更多...

30天JS挑战(第十五天)------本地存储菜谱

30天JS挑战(第十五天)------本地存储菜谱

第十五天挑战(本地存储菜谱) 地址：https://javascript30.com/ 所有内容均上传至gitee，答案不唯一，仅代表本人思路中文详解：https://github.com/soyaine/JavaScript30 该详解是Soyaine及其团队整理编撰的，是对源代…

阅读更多...

11.互信息-机器学习模型性能的常用的评估指标

11.互信息-机器学习模型性能的常用的评估指标

互信息（Mutual Information）是机器学习中常用的一种评估指标，特别是在无监督学习和聚类分析中。它用于衡量两个随机变量之间的相关性或相似性。定义给定两个随机变量X和Y，它们的互信息I(X;Y)定义如下： 其中&…

阅读更多...

命名空间（namespace）

命名空间（namespace）

定义在C中，命名空间（Namespace）是一个特性，用于封装代码并避免名称冲突。命名空间可以看作是一个容器，其中可以包含类、函数、变量、常量、其他命名空间等。通过使用命名空间，我们可以更好地组织代码&…

阅读更多...

linux gdb 调试工具

linux gdb 调试工具

1.写程序首先，我们先写出一个 .c 或者.cpp程序如然后 gcc -g hello.c -o hello 或者 g -g hello.cpp -o hello （-g）要加 2. gdb调试用 gdb （可执行程序，如hello） 进入之后，有…

阅读更多...

redis实战笔记汇总

redis实战笔记汇总

文章目录 1 NoSQL入门概述1.1 能干嘛？1.2 传统RDBMS VS NOSQL1.3 NoSQL数据库的四大分类1.4 分布式数据库CAP原理 BASE原则1.5 分布式集群简介1.6 淘宝商品信息的存储方案 2 Redis入门概述2.1 是什么？2.2 能干嘛？2.3 怎么玩？核心…

阅读更多...

《幻兽帕鲁》游戏对服务器性能的具体要求是什么？

《幻兽帕鲁》游戏对服务器性能的具体要求是什么？

《幻兽帕鲁》游戏对服务器性能的具体要求是什么？ CPU：官方最低要求为i5-3570K，但在多人游玩时可能会有明显卡顿。此外，还有建议选择4核或更高性能的处理器，以确保游戏运行流畅。内存：对于不同人数的联机&…

阅读更多...

LL-34/DO-213AC/MiniMELF/NSMC/DO-213AB封装

LL-34/DO-213AC/MiniMELF/NSMC/DO-213AB封装

最近在找几个特殊的二极管封装，能查到资料太少了，如同大海捞针，好不容易找到了一些资料，把相关信息总结一下. 1、LL-34/DO-213AC/MiniMELF/SOD80这三个封装尺寸很接近 LL-34以c5345992为例 MiniMELF以c131658为例 2、NSMC这个封装…

阅读更多...

盘点3个正规靠谱的赚钱软件，作为副业，空闲时间发小财

盘点3个正规靠谱的赚钱软件，作为副业，空闲时间发小财

随着移动互联网的蓬勃发展，手机成为了我们生活中不可或缺的一部分，更是赚钱的新工具。然而，面对琳琅满目的赚钱软件，如何挑选出那些既靠谱又正规的平台呢？接下来，我将为大家揭秘几款备受推崇的赚钱软件。 1…

阅读更多...

20240304-1-操作系统

20240304-1-操作系统

操作系统知识体系 Questions 1.进程和线程的区别进程是系统进行资源分配和调度的基本单位；线程是CPU调度和分派的基本单位。每个进程都有独立的代码和数据空间（程序上下文），程序之间的切换会有较大的开销；线程可…

阅读更多...

#QT（智能家居界面-界面切换）

#QT（智能家居界面-界面切换）

1.IDE：QTCreator 2.实验 3.记录 （1）创建一个新界面（UI界面） （2）可以看到新加入一个ui文件，双击打开，设置窗口大小与登录界面一致 （3）加入几个PUS…

阅读更多...

使用echarts生成颜色渐变曲线图

使用echarts生成颜色渐变曲线图

效果图: 1、安装echarts npm install echarts --save2、全局注册组件 import * as echarts from echarts; Vue.prototype.$echarts echarts3、结构附: 计算显示日期的工具文件 /** 计算月份显示* param {} * returns {}*/export function getLastFiveMonths() {let date…

阅读更多...

【Python】进阶学习：pandas--read_excel()函数的基本使用

【Python】进阶学习：pandas--read_excel()函数的基本使用

【Python】进阶学习：pandas–read_excel()函数的基本使用 🌈 个人主页：高斯小哥 🔥 高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程👈 希…

阅读更多...

【Mybatis】动态语句第三期

【Mybatis】动态语句第三期

文章目录 *一、if和where标签二、set标签三、trim标签四、choose/when/otherwise标签*五、foreach标签 ( 批量操作六、sql片段 *一、if和where标签如果传入属性，就判断相等。不传入不加对应的条件。 if 判断传入的参数，最终是否添加语句 test 属性 &am…

阅读更多...

139.乐理基础-一四五八度为何用纯?

139.乐理基础-一四五八度为何用纯?

上一个内容：138.乐理基础-等音、等音程的意义-CSDN博客上一个内容里练习的答案： 以乐理里写的知识，没办法完全解释透彻一四五八度为何用纯？这个问题，要透彻的话要从各个文明怎么发现音高、发明音高、制定规则等&…

阅读更多...

如何在Vue中实现事件处理？

如何在Vue中实现事件处理？

Vue是一种流行的JavaScript框架，广泛应用于前端开发。在Vue中，事件处理是一个非常关键的概念，可以帮助我们实现用户与页面的交互，今天我们就来探讨一下如何在Vue中实现事件处理。首先，让我们先了解一下在Vue中如何绑…

阅读更多...

【数据结构】实现堆

【数据结构】实现堆

大家好，我是苏貝，本篇博客带大家了解堆，如果你觉得我写的还不错的话，可以给我一个赞👍吗，感谢❤️ 目录一. 堆的概念及结构二. 堆的实现堆的结构体初始化销毁插入数据删除数据（默认删除堆顶即…

阅读更多...

基于Mahout实现K-Means聚类

基于Mahout实现K-Means聚类

需求分析需要对数据集进行预处理，选择合适的特征进行聚类分析，确定聚类的数量和初始中心点，调用Mahout提供的K-Means算法进行聚类计算，评估聚类结果的准确性和稳定性。同时，需要对Mahout的使用和参数调优进行深入学习…

阅读更多...

YOLO——AI算法的中流砥柱(五）

YOLO——AI算法的中流砥柱(五）

阅读更多...

推荐文章

最新文章