本地部署 Google Gemma 开源模型

news2024/9/27 9:28:33

Google Gemma 是 Google AI 团队开发的基于Transformer的轻量级大语言模型,Gemma 模型已开源并在各种硬件平台上保持良好性能,记录下本地部署过程并在多种情景下使用情况。

一、环境配置

1、下载并安装Ollama

在 Windows 上下载 Ollama ,选择操作系统对应版本下载,下载后运行安装,安装过程无任何设置操作。

安装完成后打开命令行输入 ollama -v ,全小写字母,准确显示当前安装版本号即为顺利安装。

2、模型下载

同网页,点击网页上方Models 按钮进入模型信息查询下载界面:

博主个人电脑是2080,点击gemma2 下方9B按钮,显示具体的信息和下载方式:

将上述图片中的ollama run gemma2 复制到命令行中执行,自动下载对应模型,由于博主在写博客时已完成安装,这里以老版gemma安装进行示例,读条完成后即完成下载。

二、模型使用

1、使用方法1:通过命令行

第一次安装完成后将自动打开,直接输入需要完成的工作,模型给出对应答案。

非第一次安装后,随时在命令行输入安装时的语句,即  ollama run gemma2,即可运行。

2、使用方法2:通过写程序调用

 以pycharm调用为例,以下代码实现调用ollama对外部的txt文件进行读取,并按照给定的模板进行信息提取填充输出,复制以下代码可直接运行:

from langchain_community.llms import Ollama
from langchain_core.prompts import PromptTemplate

def read_text_file(file_path):
    with open(file_path, 'r', encoding='utf-8') as file:
        return file.read()

def extract_information(text, model_name):
    # 定义信息提取的提示模板
    prompt_template = PromptTemplate.from_template("""
    从以下文本中提取信息,填充指定的模板:
    文本: {context}
    信息: 
    1. 故事人物:
    2. 背景:
    3. 时间:
    4. 起因:
    5. 故事的发展:
    6. 结束:
    请严格按照上述格式回答,不要添加额外的解释或信息。
    """)
    
    # 创建 Ollama 实例
    llm = Ollama(model=model_name)
    
    # 使用提示模板和模型进行信息提取
    chain = prompt_template | llm
    response = chain.invoke({'context': text})
    return response

def main(file_path, model_name, output_file):
    # 读取文本文件
    text = read_text_file(file_path)
    
    # 提取信息
    extracted_info = extract_information(text, model_name)
    
    # 输出提取的信息到文件
    with open(output_file, 'w', encoding='utf-8') as file:
        file.write(extracted_info)

    print(f"信息已提取并保存到 {output_file}")

if __name__ == "__main__":
    file_path = 'show.txt'
    model_name = "Gemma2"  # 根据实际模型名称进行替换
    output_file = 'extracted_info.txt'
    main(file_path, model_name, output_file)

show.txt的文本内容为:

2019年春节档期间的《流浪地球》无疑是热度最高、反响最好的一部电影。它根据刘慈欣同名小说改编,影片故事设定在2075年。科学家们发现太阳急速衰老膨胀,太阳即将毁灭,地球将不适合人类生存。为了自救,人类开启一个名为“流浪地球”的大胆计划,倾全球之力在地球表面建造上万座发动机和转向机,推动地球离开太阳系,用2500年的时间奔往另外一个栖息之地。中国航天员刘培强在儿子刘启四岁那年前往国际空间站,和国际同侪肩负起领航者的重任。由于地面低温已经降至零下84度,人类被迫迁入地下城生活。

危机来临!当刘培强经过17年的太空工作,已经到了离职的时候,他的儿子刘启带着妹妹朵朵偷偷跑到地表玩耍,还偷了外公韩子昂是超级驾驶员的车卡,不仅遭到逮捕。更大的问题是,全球发动机停摆。但是,地球还没有飞出太阳系、路过木星的时候被木星引力吸引,逐渐接近并要撞击木星。

怎么修好发动机,阻止地球撞击木星,这是全人类面临的问题。

首先,为了延续百代子孙生存的希望,人类空前团结,成立了联合政府,来自世界各国的救援队通力合作,展开营救。第二,刘启他们的车也被强征加入救援队伍,参与火石运送行动,确保所有的故障发动机都得到了重启。第三,经过三十多个小时的努力,虽然完成了71%的发动机重新启动和100%的转向机的重新启动,可是地球仍然要撞向木星。联合政府宣告流浪地球计划失败,刘培强决定牺牲自己,利用空间站的撞击点燃木星,最终拯救了地球。

示例输出结果:

3、使用方法3:创建前端对话窗口

通过以下链接下载安装Chatbox,安装地址可任意更改:

Releases · Bin-Huang/chatbox · GitHub

Chatbox AI官网:办公学习的AI好助手,全平台AI客户端,官方免费下载

点击开始设置,修改模型提供方为ollama,API地址自动填充如下,模型按需求选择:

在聊天窗口上输入问题,可正常使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2089419.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

什么牌子的可视耳勺最好用?力荐四款热门品牌!

可视挖耳勺近几年越来越火爆,各种款式层出不穷,在可视挖耳勺的挑选上,我需要提醒大家一定要避雷劣质可视挖耳勺产品,劣质可视挖耳勺产品普遍不做核心性能的反复调教,成像清晰度低、耳勺出现发烫、性能不稳定等问题是时…

web渗透:CSRF漏洞(跨站请求伪造)

目录 CSRF漏洞 深入研究 CSRF攻击常见于哪些类型的网站? 如何通过HTTP Referer头来防范CSRF攻击? 为什么设置Cookie的SameSite属性对预防CSRF有帮助? 导图 CSRF漏洞 CSRF(Cross-Site Request Forgery,跨站请求伪…

MySQL——事务与存储过程(一)事务管理(4)事务的隔离级别

数据库是多线程并发访问的,所以很容易出现多个线程同时开启事务的情况,这样就会出现脏读、重复读以及幻读的情况,为了避免这种情况的发生,就需要为事务设置隔离级别。在 MySQL 中,事务有4种隔离级别,接下来…

Linux安装Docker与基本指令

1、什么是Docker Dokcer是一种开源平台,主要用于创建、部署和管理容器化应用程序,它通过将应用程序以及所有的依赖打包到一个轻量级的、可移植的容器中,使得应用可以在任何环境中一致的运行! 1.1、Docker的优点 一致性和可移植性 跨环境一致…

删除微信重复文件的简易工具

去我的个人博客观看,观感更佳哦,😙😙 前言 !!!!温馨提示:假如你是小白,啥都不懂,请直接跳到文章的最后!!! 原本我是没想写这篇文章,契机是某一天我突然打开微信的存储空间占用才发…

5款手机版的影视解说文案生成器,无须下载更方便!

在这个自媒体的红利时期,影视解说创作占据了内容创作的很大一部分。而影视解说文案则是帮助观众更好地理解和欣赏影视作品的重要点。随着手机的普及,越来越多的人希望能够在手机上方便地生成影视解说文案创作。今天,我们就来介绍5款手机版的影…

Shared memory bank conflicts

共享内存和bank: 在CUDA架构中,共享内存是一个非常快速的内存类型,它位于每个线程块内部并为该线程块内的所有线程提供服务。为了实现高吞吐量的访问,共享内存被划分为多个独立的存储区域,称为“banks”。每个bank可以在单个时钟…

创新微MinewSemi推出基于Nordic nRF54系列芯片 SoC 低功耗蓝牙5.4模组

在物联网技术飞速发展的今天,创新微MinewSemi隆重推出基于Nordic最新nRF54系列芯片SoC的ME54BS01和ME54BS02全新低功耗蓝牙5.4模组。这两款模组的问世,标志着我们在推动物联网设备智能化、高效化道路上的迈出了坚实的一步,展示了对未来技术的…

回归预测|基于卷积神经网络-鲸鱼优化-最小二乘支持向量机的数据回归预测Matlab程序 CNN-WOA-LSSVM

回归预测|基于卷积神经网络-鲸鱼优化-最小二乘支持向量机的数据回归预测Matlab程序 CNN-WOA-LSSVM 文章目录 一、基本原理1. 数据预处理2. 特征提取(CNN)3. 参数优化(WOA)4. 模型训练(LSSVM)5. 模型评估和优…

World of Warcraft [CLASSIC][80][Grandel] Mount with 310% speed

310%速度的坐骑【被感染的始祖幼龙】 永恒之眼(3个) 纳克萨玛斯(9个) 10人副本, 白马 (DPS N)黑马(DPS N)绿马(T N DPS)红马(T …

诚信为金:揭秘好征信的六大黄金标准,并实践守护好它的五大秘籍

什么是好征信,怎么守护它 咱们平时总听人说“征信”,“征信”到底是个什么东西,但很少人能透彻的了解它。它是一个有点神秘但又挺重要的东西,简单说,它就是咱在金融界的一张“身份证”,记录着咱们的信用表…

【C++ Qt day3】

2、设计一个Per类,类中包含私有成员:姓名、年龄、指针成员身高、体重,再设计一个Stu类,类中包含私有成员:成绩、Per类对象p1,设计这两个类的构造函数、析构函数和拷贝构造函数。

【2024 CCF编程能力等级认证(GESP)C++ 】一级大纲

目录 1. 背景2. 考核知识块3. 考核内容3.1 计算机基础知识3.2 集成开发环境3.3 结构化程序设计3.4 程序的基本语句3.5 程序的基本概念3.6 基本运算3.7 基本数据类型4. 考核目标5. 题型分布6. 考试时长7. 认证时间与报名8. 政策与福利9. GESP一级认证形式 1. 背景 官网&#xff…

13.DataLoader 的使用

DataLoader 的使用 dataset:告诉程序中数据集的位置,数据集中索引,数据集中有多少数据(想象成一叠扑克牌)dataloader:加载器,将数据加载到神经网络中,每次从dataset中取数据&#x…

JAVA中的线程池说明二

目录 1.引入 2.参数解释 3.标准库中提供的四个拒绝策略 1.引入 java.util.concurrent 这个包里面放的很多类都是和并发编程(多线程编程)密切相关,这个包简称JUC;今天我们主要来了解Java线程池的相关知识。 2.参数解释 在这里,我们主要讲…

无痛除毛,告别异味,希喂、有哈、小米宠物空气净化器真实测评

养宠在年轻人生活中逐渐成为一种新的潮流,越来越多的人加入到铲屎官的队伍。其中,养宠最多的品类非猫咪莫属,凭借自身可爱的外表收获人们的芳心。同时猫咪也是宠物中掉毛最严重的,漫天的浮毛在家中不断飘散,带来无尽的…

Java——断点调试

一、断点调试简介 Java的断点调试是程序开发中非常重要的一个技术,它允许开发者在程序执行时暂停执行,以便检查变量的状态、观察程序的流程、并定位错误。 1、断点(Breakpoint): 在代码的某一行指定的暂停点。当程序…

个人旅游网(1)——数据库表详解

文章目录 一、数据库表详情1.1 tab_category 表1.2、tab_route 表1.3、tab_route_img 表1.4、tab_user 表1.5、tab_favorite 表1.6、tab_address 表1.7、tab_seller 表1.8、tab_order 表1.9、tab_orderItem 表 一、数据库表详情 该网站是一个旅游网站,为具有出游的需…

C程序设计(潭浩强教授版)精选程序题

目录 (一)顺序程序设计部分 (二)选择程序设计部分 (三)循环程序设计部分 (四)数组处理数据部分 (一)顺序程序设计部分 1. 使用getchar读入两个字符&#xf…

对比 PDAF、CDAF 和 LAAF 自动对焦技术

深入解析相位检测自动对焦(PDAF) 相位检测自动对焦(PDAF,Phase Detection Auto Focus)是一种高效的自动对焦技术,广泛应用于现代数码相机、无反相机和智能手机摄像头中。为了更好地理解 PDAF,我…