本地部署Perplexity 克隆:使用Llama 3.1实现高效搜索

news2025/1/9 1:47:34

image.png

最近,OpenAI宣布推出Search GPT,这基本上是Perplexity的改版,但直接由OpenAI开发。这让我非常高兴,因为与其让第三方使用他们的模型并提供封装服务,不如他们自己来做。我一直不喜欢Perplexity,因为他们声称他们做了很多事情来生成结果,因此向用户收费20美元,但实际上他们只是将GPT-4与Google搜索结果结合起来。每当我制作关于本地替代品的视频时,总有一些被洗脑的人会说“没有什么能打败Perplexity”,但现在OpenAI自己做了这件事,我至少感到很开心,但我打赌Perplexity的投资者现在不会高兴。

今天的视频不是关于这个的。今天我要告诉你如何在你的电脑上本地设置一个Perplexity克隆,使用的是Llama 3.1。这非常类似于Perplexity,而且完全免费和本地化。那么我会用什么来制作它呢?我会使用# Perplexica来实现这一点,设置起来超级简单,我们可以将其与ollama和Groq集成起来。我将向你展示如何使用Llama 3.1 8B模型和Gro的70B模型进行配置。最后我还会告诉你如何使用405B模型。

第一步:安装ollama

首先,打开ollama,点击下载按钮,选择你的操作系统并进行安装。安装完成后,前往模型页面,选择Llama 3.1并复制安装命令,将其粘贴到你的终端,模型将开始安装。安装完成后,你会在终端中看到这个聊天界面,发送一条消息并检查是否有效。

第二步:安装embedding model

我们还需要在ollama中安装一个embedding model。。这将把嵌入模型安装到你的电脑上。完成后,前往Docker,下载Docker并按照屏幕上的说明进行安装。我们需要Docker来安装Perplexica。

第三步:克隆Perplex仓库

完成Docker安装后,克隆 Perplexica 并按照readme文档进行配置。,向下滚动并复制这个命令。现在打开你的终端并将其粘贴进去,这将把仓库克隆到你的电脑上。现在在VS Code中打开克隆的文件夹,将sample.config.toml文件重命名为config.toml

git clone https://github.com/ItzCrazyKns/Perplexica.git

Rename the sample.config.toml file to config.toml

docker compose up -d

第四步:创建Docker容器

完成重命名后,回到终端,现在CD进入克隆的文件夹并运行这个命令,这将为你创建一个Docker容器并启动它。完成后,你可以在浏览器中打开端口3000,你会看到这个页面。你会看到一个错误,不用担心,只需进入设置选项并将这个URL添加到Al API基URL中。完成后保存,现在你会看到这个页面正常打开了。

第五步:配置Perplex

但我们仍然不能使用它,所以进入设置选项,在模型中选择Llama 3.1,在嵌入提供商中选择Ollama,然后选择刚刚安装的embedding模型。一旦完成,我们现在可以使用它了。现在发送一条消息,你会看到它正常工作。你会得到文章、图片、视频等,这非常酷。你还可以在这里询问后续问题,这也非常酷。

使用Groq进行配置

如果你不想本地运行LLM但仍想使用Perplex,你可以使用Groq。Groq添加了Llama 3.1 8B和70B模型,你可以通过API免费使用它,但会有一点速率限制。要与Gro进行配置,只需打开Groq Cloud,注册一个帐户,在API密钥选项中创建一个API密钥并复制它。现在回到Perplex,打开设置并输入API密钥,保存它,重新打开设置并将提供商更改为Groq,现在在这里选择Llama 3.1模型,保存它,现在你可以开始使用Groq了,你会看到与Perplexity相同的速度,但质量极高且免费。

使用Together AI进行配置

接下来是如何使用405B模型来设置它。我将使用Together AI,因为他们提供一些免费积分,之前是25美元的积分,但现在他们减少到了5美元,我觉得这还可以,因为你仍然可以进行大约100次请求。搜索Together AI,注册并前往设置选项,复制你的API密钥。现在回到Perplex,点击设置并将提供商更改为自定义OpenAI,现在输入这个URL作为基本URL和这个模型名称,并在这里输入你的API密钥。完成后保存,现在你可以开始使用Llama 3.1 405B,这显然也很酷。

总结

以上就是如何使用Llama 3.1完全免费和本地化地设置你自己的Perplexity克隆的步骤。因为最终它只是一个LLM和Google搜索API。此外,它使用CRX NG作为搜索引擎,这也是开源的并在你安装时直接安装,所以你不需要任何API来进行搜索,这也非常酷。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1984257.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C++ | 泛型编程】C++函数模板详解(定义、使用、特化、重载)

😁博客主页😁:🚀https://blog.csdn.net/wkd_007🚀 🤑博客内容🤑:🍭嵌入式开发、Linux、C语言、C、数据结构、音视频🍭 🤣本文内容🤣&a…

Stable Diffusion绘画 | 图生图-局部重绘(三)

重绘区域 整张图片 指重绘的分辨率是应用在整个画面上的,会整个画面综合参与运算。 选择一片空白区域,提示词添加 a book: 操作生成图片: SD会觉得整个画面中,蒙版区域出现一本书不太合理,索性生成一张木…

【多模态】43、INF-LLAVA | 使用双视角裁剪和双视角增强模块来提升模型对大分辨率图片的处理能力

论文:INF-LLaVA: Dual-perspective Perception for High-Resolution Multimodal 代码:https://github.com/WeihuangLin/INF-LLaVA 出处:厦大 时间:2024.07.23 贡献: 提出了双视角裁剪模块(Dual-perspe…

【后续 断点续传】前端大文件分片下载解决方案,没用你来砍我

前言 之前已经出过 大文件分片下载 的教程,期间也收到很多小伙伴的疑问说是功能上有点问题,也抽时间将一些大的问题修改了,验证了很多次,应该不会有什么问题了;在下载方案中涉及到断点续传部分的没有细讲,…

【MySQL】索引和事务

秋招 秋招中最经典,最高频的面试题 文章目录 索引 index操作索引的 SQL查看索引创建索引删除索引 事务操作四个核心特性 索引 index 在数据库中建立一个特殊的“目录“(一系列特定的数据结构),为了加快查询速度 select 查询都是遍…

Go项目依赖:Tidy命令与离线依赖获取

引言 Go语言以其简洁性和高效性在开发者中广受欢迎,而Go的模块系统则为依赖管理提供了极大的便利。本文将介绍如何使用go mod tidy命令来整理项目的依赖关系,以及在无法在线获取依赖的情况下,如何通过离线方式获取并使用依赖。 使用go mod …

数论基础知识(下)

目录 欧拉函数 n的分解质因数求欧拉函数 试除法求欧拉函数值 积性函数 筛法 朴素筛 埃氏筛 欧拉筛 (线性筛) 线性筛欧拉函数 快速幂 同余 欧拉定理 费马小定理 乘法逆元 欧拉函数 互质 : ∀ a , b ∈ N ,若 gcd ( a , b ) 1 ,则 a…

Java零基础之多线程篇:线程控制

哈喽,各位小伙伴们,你们好呀,我是喵手。运营社区:C站/掘金/腾讯云;欢迎大家常来逛逛 今天我要给大家分享一些自己日常学习到的一些知识点,并以文字的形式跟大家一起交流,互相学习,一…

RISC-V竞赛|第二届 RISC-V 软件移植及优化锦标赛报名正式开始!

目录 赛事背景 赛道方向 适配夺旗赛 优化竞速赛 比赛赛题(总奖金池8万元!) 🔥竞速赛 - OceanBase 移植与优化 比赛赛程(暂定) 赛事说明 「赛事背景」 为了推动 RISC-V 软件生态更快地发展&#xff0…

健身动作AI识别,仰卧起坐计数(含UI界面)

用Python和Mediapipe打造,让你的运动效果一目了然! 【技术揭秘】 利用Mediapipe的人体姿态估计,实时捕捉关键点,精确识别动作。 每一帧的关键点坐标和角度都被详细记录,为动作分析提供数据支持。 支持自定义动作训练&a…

Jave-this关键字

目录 1.this关键字 先看一段代码,并分析问题 什么是this 案例演示 2.this的注意事项和使用细节 1.this关键字 先看一段代码,并分析问题 什么是this this就 代表的是当前对象。 this可以大概理解成“我的” ,比如我的书包,这…

基于Java中的SSM框架实现大创项目申报管理系统项目【项目源码+论文说明】计算机毕业设计

基于Java中的SSM框架实现大创项目申报管理系统演示 摘要 经济的高速发展进一步推动了种类繁多的项目落地,传统的项目在申报过程中主要通过纸质文件的方式实现申报信息的传递,同时不同的项目内容所对应的申报资料模板也有所差异,人工整理的提…

没有显卡,怎么玩AI绘图?

或许很多人跟我一样,没有显卡,但又很想玩AI绘图,但本地绘图怕是无缘了,只能借助云GPU的方式了。 今天跟大家分享一下一个简单目前可白嫖无门槛的方法实现无显卡也能玩AI绘图。 方案就是ComfyUIBizyAir云节点。 ComfyUI介绍 来…

【软考】虚拟存储器

目录 1. 说明2. 定义3. 工作原理4. 管理方式5. 优点6. 例题6.1 例题1 1. 说明 1.在概念上,可以将主存存储器看作一个由若干个字节构成的存储空间,每个字节(称为一个存储单元)有一个地址编号,主存单元的该地址称为物理地址(Physical Address)…

数值分析——三次样条插值

系列文章目录 数值分析——拉格朗日插值 数值分析——牛顿插值多项式 数值分析——埃尔米特(Hermit)插值 数值分析——分段低次插值 文章目录 系列文章目录前言一、理论推导1.三次样条函数2.三次样条插值函数的求解条件3.三次样条插值函数的建立 二、MA…

简单反射型XSS的复现

xss反射型攻击&#xff1a; 1.最简单的漏洞复现&#xff1a; 这里我们有一个最简单的网页&#xff1a;由于地址不存在&#xff0c;所以图片加载不出来。 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta…

FP8量化

https://arxiv.org/html/2402.16363v5 LLama3.1用了FP8量化&#xff1a; FP8也可以用scaling factor来扩大表示范围&#xff0c;对吧&#xff1f;

开源在线剪切板 PrivateBin 安装和使用教程

我们经常需要在网上快速分享一些文本内容&#xff0c;比如代码片段、临时笔记或者敏感信息。传统的在线剪贴板服务虽然使用方便&#xff0c;但往往缺乏足够的隐私保护。 那么&#xff0c;有没有一种既方便又安全的在线文本分享方式呢&#xff1f;今天我要向大家推荐一个优秀的…

常见的图像融合方法

这里我们将介绍一些常用的图像融合方式&#xff0c;并不涉及到诸如CutMix、MixUp、TokenMix、Mosaic、Copy-Paste等图像增强方法。 首先是读取图像&#xff0c;我们这边采用了PIL库进行&#xff0c;那么读进来就应该是一个Image对象。下面介绍Image对象与array的转换方式。 f…

土地利用/土地覆盖遥感解译与基于CLUE模型未来变化情景预测

土地利用/土地覆盖数据是生态、环境和气象等领域众多模型的重要输入参数之一。基于遥感影像解译&#xff0c;可获取历史或当前任何一个区域的土地利用/土地覆盖数据&#xff0c;用于评估区域的生态环境变化、评价重大生态工程建设成效等。借助CLUE模型&#xff0c;实现对未来土…