如何优雅的使用各类LLM

news2024/11/24 17:01:47

    近几个月,随着ChatGPT的风靡,大型语言预训练模型也如雨后春笋般地涌现,虽然效果差强人意,好在不受限制。配置稍好的电脑也能跑个7B、13B参数的大语言模型。

    虽然模型众多,但是如果给每一个模型都单独去配置环境,每个模型单独启用,就显得非常的笨拙,不够优雅。如果能借助SD WEBUI的思路,给这些大预言模型也能够动态地加载起来运用,岂不美哉。俗话说,不怕你想不到,就怕你做不到,有同志已经身先士卒实现了这个想法,站在的巨人的肩膀上,我辈岂有再造轮子的道理,好好借鉴下就行。

    参照这个github地址oobabooga/text-generation-webui: A gradio web UI for running Large Language Models like LLaMA, llama.cpp, GPT-J, Pythia, OPT, and GALACTICA. (github.com)

    人家思路也很明确,就是打造LLM界的SD WEBUI

e37cab9ccaf934a97d807d85f86df49e.png

    话不多说,clone下这个https://github.com/oobabooga/text-generation-webui.git

    然后参照我前面的图文,自行安装anaconda,然后构建python=3.9的环境,然后激活环境,安装依赖包 pip install -r requirments.txt

    然后运行python server.py ,可能会出现如下问题:

9bb491743c80b409faddad4410946a1a.png

这个时候可以更新下gradio 

pip install --force gradio==3.28.3    或者

pip install gradio_client==0.1.4 gradio==3.25.0

不出意外的话会看到熟悉的gradio风味的界面

7b65e42fbc451da4203f2add0debff24.png

然后我们就需要下载各类模型了,首先当然是meta的LLaMA,这个模型在百度飞浆的页面找到了LLaMA-7B OriginalModelWeights - 飞桨AI Studio (baidu.com),然后运行convert_llama_weights_to_hf.py脚本将模型转换成pytorch的bin文件

然后导入LLaMA

2e1beaf56e893abafa3e127cdde602e5.png

好了,开始探索之旅吧,由于本人显卡太拉,运行异常缓慢,单词一个一个往外蹦,太影响体验了

6ab68cd56b1ae5059667b1237c29dab0.png

看来跟chatgpt还是有差距,可能是因为用的7B模型吧。

接下来就是meta的OPT模型,在huggingface里面可以自行下载Models - Hugging Face,电脑太拉,就选了1.3b参数的模型

2b2c29480a396b540d2dfb9a42a7e81f.png

然后导入模型

31af60c3f70b7236a0e2fc679f448c92.png

这下就快多了,同样的问候,回答的东西就让人感觉很忧郁,有点英文小说的那个味道了,像在给一个远方的朋友诉说自己的近况。

2dba6cc5246cbd9df189f1a6c30b8504.png

最后就是臭名昭著的GPT4chan,下载方法就不展示了,很多地方都把这玩意儿禁止了,很多内容都是和犹太纳粹相关

ecdb690ce13e16115caeb01ad3b63e09.png

7710c829a4d05d215a6bf9a76fd97165.png

好多词汇都打码了,不然我怕被嘎,哈哈

总的来说,模型导入还是比较靠谱的,不需要针对每个模型去搭建运行环境,大大降低了门槛。这哥们也发布了one-click-install,还没有去尝试,应该对新手更友好。各位可以自行尝试oobabooga/one-click-installers: Simplified installers for oobabooga/text-generation-webui. (github.com)

希望后续能有更多的模型接入进来的,最后希望咱们自研的中文LLM也能更进一步吧。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/535087.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Go语言的条件判断和循环语句

目录 【if语句】 if语句的内部变量 if语句的优雅写法 【switch语句】 switch语句的特点 switch语句的表达式类型 switch获取变量类型 x.(type) 【for语句】 for语句的变体 for...range break 和 continue goto for 语句的常见“坑”与避坑方法 Go语言的条件判断有…

数组map用法以及特殊值的情况

数组map用法以及特殊值的情况 一、map用法的说明 map(callbackFn, thisArg); // callbackFn回调函数,thisArg可选 callbackFn是个回调函数,该回调函数的参数按照顺序为element(当前正在处理的元素),index&#xff0…

深化企业数据智能应用 用友敢当“急先锋”

面对扑面而来的数字经济时代,一场轰轰烈烈的企业数智化转型正进行得如火如荼。 然而许多企业虽然明知道数智化转型势在必行,但是又担忧自己不具备相关能力。这些企业在数据和智能上面临哪些挑战?如何才能如何加速数智化创新?AIGC和…

人机融合智能与哲学

GPT系列的大型语言模型(LLM)在初步成功之后,需要人们重新审视图灵的计算理论,重新认识计算的本质和形式,重新思考计算机和计算机理论,以及深入思考计算的家族、广义的计算和计算的哲学等问题。这是因为GPT系…

从面对代码下不去的文章,到DBA群讨论

开头还是介绍一下群,如果感兴趣polardb ,mongodb ,mysql ,postgresql ,redis 等有问题,有需求都可以加群群内有各大数据库行业大咖,CTO,可以解决你的问题。加群请联系 liuaustin3 ,在新加的朋友会分到2群(共…

小米加速技术突破,为充电生态赋能,领航未来

5月13日,中国电工技术学会电力电子专业委员会第十八届学术年会在上海召开。小米公司作为快充技术领域代表,手机部基带总监杨玉巍出席本次年会并发表以《小米下一个十年的“助推器”——硬件技术创新与应用》为主题的报告,介绍小米最新的充电技…

简单做一下 银川第九届数模A题

A题 随着三年新冠疫情结束后第一个五一假期的到来,许多人选择出门旅游,在有限的几天假期怎样玩好就是一件值得考虑的事。小明是一位旅游爱好者,想在五一期间到宁夏一些著名景点旅游。由于跟着旅游团会受到若干限制,所以他&#xf…

Google Bard 对战 ChatGPT4

话题之一:如何降低血压 我家老爷子血压有点高,所以我挑了这么个话题。 如果用中文来问 Bard, 有点欺负它,那么索性用英文 1. Bard 在速度上占有绝对优势 2. GPT4 在最后一条监测就医建议上,完胜。 很多老人得过且过,不…

OpenCV实战(24)——相机姿态估计

OpenCV实战(24)——相机姿态估计 0. 前言1. 相机姿态估计2. 3D 可视化模块 cv::Viz3. 完整代码小结系列链接 0. 前言 校准相机后,就可以将捕获的图像与物理世界联系起来。如果物体的 3D 结构是已知的,那么就可以预测物体如何投影…

【Shell脚本】Linux安装Nexus的两种方式以及开机自启

目录 一、Linux安装Nexus的两种方式1、直接把下载好的安装包上传到服务器①、打开Nexus页面后,登录时会出现以下提示,根据路径提示可找到初始密码②、找到初始登录Nexus的初始密码 2、通过wget安装Nexus①、修改Nexus端口号②、默认的端口号为8081&#…

华为OD机试真题 Java 实现【找数字】【2023Q2 100分】

一、题目描述 给一个二维数组nums,对于每一个元素nums[i],找出距离最近的且值相等的元素,输出横纵坐标差值的绝对值之和,如果没有等值元素,则输出-1。 例如 输入数组nums为 0 3 5 4 2 2 5 7 8 3 2 5 4 2 4 对于 n…

Java每日一练(20230517) 重复元素、链表重复元素、旋转数组

目录 1. 存在重复元素 🌟 2. 删除排序链表中的重复元素 🌟 3. 旋转数组 🌟🌟 🌟 每日一练刷题专栏 🌟 Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专栏 Java每日一练 专栏 1. 存在重…

让孩子们零基础也能学习人工智能,这家科技企业是这样做的

在偏远地区的孩子,即便没有任何人工智能知识和理论基础,也可以一步步迈入人工智能科技的殿堂? 你没有看错,这就是亚马逊云科技推出的“AI在未来”公益计划项目,如今已经进入了第二个学年。 “AI在未来”公益计划走进宁…

案例分享|地弹现象导致DCDC电源芯片工作不正常

很多读者都应该听过地弹,但是实际遇到的地弹的问题应该很少。本案例就是一个DCDC电源芯片的案例。 1. 问题描述 如下图1 ,产品其中一个供电是12V转3.3V的电路,产品发货50K左右以后,大约有1%的产品无法启动,经过解耦定…

【Java8新特性】史上最全Optional实战教程,太厉害了!

目录 一、前置基础 二、什么是Optional 2.1理论拓展 三、为什么要用Optional 3.1俄罗斯式套娃判空详解 四、Optional基本知识 4.1API的思考 五、工作中如何正确使用Optional 5.1 orElseThrow 5.2 filter 5.3 orElse和orElseGet 5.4 map和flatMap 5.5 项目实战 实战…

16位单片机去哪儿了?

关注星标公众号,不错过精彩内容 作者 | strongerHuang 微信公众号 | strongerHuang 最近网友问了一个问题:为什么现在很少看见16位单片机了? 你是不是也有这样的疑问:现在市面上大多都是32位Arm Coretx-M内核的单片机,…

〖技术人职业规划白宝书 - 职业规划篇①〗- 大学生选择职业前的自我认知与剖析

历时18个月,采访 850 得到的需求。 不管你是在校大学生、研究生、还是在职的小伙伴,该专栏有你想要的职业规划、简历、面试的答案。说明:该文属于 技术人职业规划白宝书 专栏,购买任意白宝书体系化专栏可加入TFS-CLUB 私域社区&am…

【JS】1684- 重学 JavaScript API - Resize Observer API

❝ 前期回顾: 1. Page Visibility API 2. Broadcast Channel API 3. Beacon API ❞ 🏝 什么是 Resize Observer API Resize Observer API[1] 可以帮助我们监听元素尺寸的变化,并在尺寸变化时执行一些操作。例如,我们可以使用 Resi…

突发!骨灰级程序员心梗离世!

大家注意:因为微信最近又改了推送机制,经常有小伙伴说错过了之前被删的文章,比如前阵子冒着风险写的爬虫,再比如一些限时福利,错过了就是错过了。 所以建议大家加个星标,就能第一时间收到推送。&#x1f44…

什么是鉴权?这些postman鉴权方式你又知道多少?

一、什么是鉴权? 鉴权也就是身份认证,就是验证您是否有权限从服务器访问或操作相关数据。发送请求时,通常必须包含相应的检验参数以确保请求具有访问权限并返回所需数据。通俗的讲就是一个门禁,您想要进入室内,必须通过…