变革 Perplexica:AI驱动的问答搜索引擎

news2024/12/24 9:28:37

Perplexica是一个开源的人工智能搜索工具,也可以说是一款人工智能搜索引擎,它深入互联网以找到答案。受Perplexity AI启发,它是一个开源选择,不仅可以搜索网络,还能理解您的问题。它使用先进的机器学习算法,如相似性搜索和嵌入式技术,以精细化结果,并提供附有来源的清晰答案。

利用SearxNG保持最新和完全开源,Perplexica确保您始终获取最新的信息,而不会损害您的隐私。

ca727ec865eb37be80b2a5b086e14319.jpeg

特点

  • 本地LLMs:您可以利用Ollama使用本地LLMs,例如Llama3和Mixtral。
  • 两种主要模式:

协作模式:(正在开发中)通过生成不同的查询来提升搜索效果,以找到更相关的互联网来源。与SearxNG仅使用上下文不同,它访问顶部匹配项并尝试直接从页面中找到与用户查询相关的来源。

普通模式:处理您的查询并执行网络搜索。

  • 专注模式:用于更好地回答特定类型问题的特殊模式。Perplexica目前有

6种专注模式:

全模式:搜索整个网络以找到最佳结果。

写作助手模式:适用于不需要搜索网络的写作任务。

学术搜索模式:找到文章和论文,非常适合学术研究。

YouTube搜索模式:根据搜索查询找到YouTube视频。

Wolfram Alpha搜索模式:使用Wolfram Alpha回答需要计算或数据分析的查询。

Reddit搜索模式:在Reddit上搜索与查询相关的讨论和观点。

  • 当前信息:一些搜索工具可能会提供过时的信息,因为它们使用爬行机器人的数据并将其转换为嵌入式并存储在索引中。与它们不同,Perplexica使用SearxNG,一个元搜索引擎来获取结果并重新排名,从中获取最相关的来源,确保您始终获取最新的信息,而无需进行每日数据更新。
  • 它还有许多其他功能,如图像和视频搜索。一些计划中的功能在即将推出的功能中提到。

安装

安装Perplexica主要有两种方式 - 使用Docker,不使用Docker。强烈推荐使用Docker。

使用Docker开始(推荐)

1.确保在您的系统上安装并运行了Docker。

2.克隆Perplexica存储库:

git clone https://github.com/ItzCrazyKns/Perplexica.git

3.克隆后,导航到包含项目文件的目录。

4.将sample.config.toml文件重命名为config.toml。对于Docker设置,您只需要填写以下字段:

CHAT_MODEL:要使用的LLM的名称。比如 llama3:latest(使用Ollama),gpt-3.5-turbo(使用OpenAI),等等。

CHAT_MODEL_PROVIDER:聊天模型提供者,可以是openai或ollama。根据您使用的提供者,您需要填写以下字段:

OPENAI:您的OpenAI API密钥。如果您希望使用OpenAI的模型,则需要填写此项。

OLLAMA:您的Ollama API URL。您应该输入为http://host.docker.internal:PORT_NUMBER。如果您将Ollama安装在端口11434上,请使用http://host.docker.internal:11434。对于其他端口,请相应调整。如果您希望使用Ollama的模型而不是OpenAI的模型,则需要填写此项。

注意:您可以在运行Perplexica后更改这些内容,并且还可以从设置页面中使用不同的模型。

SIMILARITY_MEASURE:要使用的相似度度量(默认情况下已填写;如果您不确定,请保留原样)。

5.确保您位于包含docker-compose.yaml文件的目录中,并执行:

docker compose up -d

6.等待几分钟,直到设置完成。您可以在Web浏览器中通过http://localhost:3000访问Perplexica。

注意:在构建容器后,您可以直接从Docker启动Perplexica,无需打开终端。

非Docker安装

对于不使用Docker的设置:

  • 按照克隆存储库和将sample.config.toml文件重命名为根目录下的config.toml的初始步骤。您需要在此文件中填写所有字段。
  • 此外,请将ui文件夹中的.env.example文件重命名为.env并完成所有字段。
  • 非Docker设置需要手动配置后端和前端。

注意:建议使用Docker,因为它简化了设置过程,特别是管理环境变量和依赖项。

高性价比GPU资源:https://www.ucloud.cn/site/active/gpu.html?ytag=gpu_wenzhang_0429_toutiao


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1634339.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【doghead】修改abseil-cpp 构造worker成功

台式机 13900k 的wsl2 ubuntu22.04 环境root@DESKTOP-1723CM1:/mnt/d/XTRANS/thunderbolt/ayame/zhb-bifrost/Bifrost-202403/worker/build# uname -a Linux DESKTOP-1723CM1 5.15.146.1-microsoft-standard-WSL2 #1 SMP Thu Jan 11 04:09:03 UTC 2024 x86_64 x86_64 x86_64 GN…

电商技术揭秘四十:电商智能风控系统决策引擎浅析

相关系列文章 电商技术揭秘相关系列文章合集(1) 电商技术揭秘相关系列文章合集(2) 电商技术揭秘二十八:安全与合规性保障 电商技术揭秘二十九:电商法律合规浅析 电商技术揭秘三十:知识产权保…

Grafana页面嵌入自建Web应用页面

目录 一、应用场景 二、实现方式 1、修改Grafana配置文件 2、获取监控页面url 3、隐藏左侧和顶部菜单 一、应用场景 需要将Grafana监控页面嵌入自建Web应用页面,使Grafana监控页面成为自建Web应用的一部分。 二、实现方式 总体思路:修改Grafana配…

嵌入式移植7Z解压缩(纯C)

本文分享一个纯C语言编写的7Z解压缩代码库,本代码库的主要目的是在嵌入式环境下使用7z解压缩文件,可以将升级包通过7z进行压缩,然后发送给设备,减小和设备传输过程中的文件大小,进而达到传输大文件的目的。 下载链接 …

[CUDA 学习笔记] GEMM 优化: 双缓冲 (Prefetch) 和 Bank Conflict 解决

GEMM 优化: 双缓冲 (Prefetch) 和 Bank Conflict 解决 前言 本文主要是对 深入浅出GPU优化系列:GEMM优化(一) - 知乎, 深入浅出GPU优化系列:GEMM优化(二) - 知乎 以及 深入浅出GPU优化系列:GE…

Python数组类+AI插件

目录 规划实现初始化插入删除查找 AI插件单测注释调优建议 小结 规划 先想清楚都写哪些,然后再动手操作 用Python写了一个简单数组类,首先思考下都写哪些功能: 插入删除查找用插件做单元测试和写注释 目的只是实现一个简单的数组类&#x…

React + 项目(从基础到实战) -- 第十期

目标 学会react 状态管理工具 使用redux管理用户状态 Context 跨层级传递,不像props层层传递类似于Vue的provide/inject用于:切换主题颜色,切换语言 useReducer useState 的替代方案 简化版的redux MobX 1. MobX 介绍 MobX 中文文档 声明式的修改数据 , 像vue state ac…

数据结构-AVL树

目录 什么是 AVL 树 ASL 度量查找效率 结构体定义 平衡调整 调整类型 左旋和右旋 右旋 左旋 左、右平衡调整 左平衡调整 右平衡调整 插入数据 模拟建立 AVL 树 什么是 AVL 树 二叉排序树的形状取决于数据集,当二叉树的高度越小、结构越合理&#xff0c…

利用GaussDB的可观测性能力构建故障模型

D-SMART高斯专版已经开发了几个月了,目前主要技术问题都已经解决,也能够初步看到大概的面貌了。有朋友问我,GaussDB不已经有了TPOPS了,为什么你们还要开发D-SMART高斯专版呢? 实际上TPOPS和D-SMART虽然都可以用于Gaus…

Qt客服端开发的组件库

Qt 是一个功能丰富的跨平台 C 应用程序框架,它包含了许多用于不同目的的组件库。以下是一些主要的 Qt 组件库,这些库为开发者提供了广泛的工具和功能,以便构建复杂的应用程序。北京木奇移动技术有限公司,专业的软件外包开发公司&a…

前端页面单元测试最佳策略:全面涵盖逻辑、组件、流程、UI及性能优化测试,全面保障软件应用的质量

页面级别的测试要求我们从更宏观的角度审视应用,不仅关注单个组件的正确性,还要确保组件间的协作无误,以及用户在应用中的完整体验。通过集成测试、E2E测试和场景测试,我们可以更全面地覆盖应用的各种使用情况,提高软件…

实战干货|Spark 在袋鼠云数栈的深度探索与实践

Spark 是一个快速、通用、可扩展的大数据计算引擎,具有高性能、易用、容错、可以与 Hadoop 生态无缝集成、社区活跃度高等优点。在实际使用中,具有广泛的应用场景: 数据清洗和预处理:在大数据分析场景下,数据通常需要…

解决React报错Encountered two children with the same key

当我们从map()方法返回的两个或两个以上的元素具有相同的key属性时,会产生"Encountered two children with the same key"错误。为了解决该错误,为每个元素的key属性提供独一无二的值,或者使用索引参数。 这里有个例子来展示错误是…

学习【Mysql运维篇】这一篇就够了

运维篇 1. 日志1-1. 错误日志1-2. 二进制日志1-3. 查询日志1-4. 慢查询日志 2. 主从复制2-1. 概述2-2. 原理2-3. 搭建 3. 分库分表3-1. 介绍3-2. Mycat概述3-3. Mycat入门3-4. Mycat配置3-5. Mycat分片3-6. Mycat管理及监控 4. 读写分类 1. 日志 1-1. 错误日志 错误日志是MyS…

【hackmyvm】vivifytech靶机

渗透思路 信息收集端口扫描端口服务信息目录扫描爆破hydra--sshgit提权 信息收集 ┌──(kali㉿kali)-[~] └─$ fping -ag 192.168.9.0/24 2>/dev/null 192.168.9.119 --主机 192.168.9.164 --靶机个人习惯,也方便后续操作,将IP地址赋值给一个变…

IDEA 创建Servlet-HelloWorldServlet

servlet 1.创建空项目2.配置web项目3.配置Tomcat4.加载Tomcat包5.创建HelloWorldServlet类6.配置web.xml7.运行get与post请求 1.创建空项目 2.配置web项目 3.配置Tomcat 4.加载Tomcat包 5.创建HelloWorldServlet类 public class controller extends HttpServlet {Override//get…

【Hadoop】MapReduce (五)

MapReduce 入门案例练习 统计文件中每一个单词出现的次数(文件:words.txt)对IP去重(文件:ip.txt) 组件 序列化 - Writable 统计每一个人花费的上行流量、下行流量以及总流量(文件:flow.txt) 在MapReduce中,各个节点之间基本上…

【面试经典 150 | 图的广度优先搜索】最小基因变化

文章目录 写在前面Tag题目来源解题思路方法一:广搜 写在最后 写在前面 本专栏专注于分析与讲解【面试经典150】算法,两到三天更新一篇文章,欢迎催更…… 专栏内容以分析题目为主,并附带一些对于本题涉及到的数据结构等内容进行回顾…

Java使用SpringBoot和EasyExcel 实现动态数据导出实战

Java使用SpringBoot和EasyExcel 实现动态数据导出实战 1、前言2、【资源地址】3、代码示例(demo)4、目前Java实现数据导出为Excel方式5、依赖6、总结 1、前言 工作中有用到将数据导出为Excel的场景,在此记录下。在日常开发中,Excel文件处理是一项常见的…

部署(Deployment)

Today you’ll be designing your own machine learning project, creating your own dataset, training a model using your data, and finally deploying an application on the web. We’ll be using a particular deployment target called Hugging Face Space with Gradio…