拓展 Coco AI 功能 - 智能检索 Hexo 博客

news2025/3/26 20:46:10

在之前的文章中,我们成功让 Coco AI 检索 Hugo 博客,这对于博客作者来说是一大福音。然而,从 Hexo 迁移到 Hugo 的成本不容小觑,毕竟大多数开发者对 Node.js 更熟悉,而 Golang 相对陌生。那么,既然 Coco AI 官方尚未支持 Hexo,是否有办法让它兼容 Hexo 呢?

当然可以!💡 既然 Coco AI 依赖的是 Hugo 生成的 index.json 进行检索,那我们干脆在 Hexo 中实现 相同结构的 index.json,这样就可以直接复用 Hugo 的数据结构,避免字段不兼容导致的潜在 Bug。

接下来,我们将从 0 到 1 实现 Hexo 的智能检索功能! 🚀


📌 1. 安装 Hexo 并切换到 Next 主题

首先,我们需要安装 Hexo 并设置 Next 主题

安装 Hexo

pnpm install -g hexo-cli
hexo init my-blog
cd my-blog
pnpm install

启动本地服务器:

pnpm hexo s

访问 http://localhost:4000/,确保 Hexo 站点运行正常。


安装 Next 主题

pnpm add hexo-theme-next

修改 _config.yml

theme: next

然后运行:

pnpm hexo clean && pnpm hexo s

访问 http://localhost:4000/,确认 Next 主题已生效。


📌 2. 安装 hexo-generator-json-content

我们需要安装 JSON 生成插件,用于输出博客文章数据:

pnpm add hexo-generator-json-content

这些添加到 _config.yml,确保 Hexo 生成完整的 JSON 数据:

jsonContent:
  meta: false
  pages: false
  posts:
    title: true
    date: true
    path: false
    permalink: true
    excerpt: true
    content: true
    categories: true
    tags: true

运行:

pnpm hexo clean && pnpm hexo generate

然后检查 public/index.json

cat public/index.json

此时 JSON 已经生成,但 url 不是 Hugo 风格的,我们需要进一步优化。


**📌 3. 自定义 index.json **

默认情况下,Hexo 不会生成 /YYYY/MM/DD/slug/ 格式的 URL,因此我们需要手动调整。

📌 创建 scripts/generate_index_json.js

Hexo 站点目录 下,创建 scripts/generate_index_json.js

hexo.extend.generator.register("index_json", function (locals) {
  let posts = locals.posts.sort("-date").map(post => {
    let category = post.categories && post.categories.length > 0 ? post.categories.data[0].name : null;
    let subcategory = post.categories && post.categories.length > 1 ? post.categories.data[1].name : null;
    let tags = post.tags ? post.tags.map(tag => tag.name) : null;

    // 解析发布日期
    let date = post.date;
    let formattedDate = `${date.year()}/${String(date.month() + 1).padStart(2, "0")}/${String(date.date()).padStart(2, "0")}`;
    
    // 生成 Hugo 风格 URL: `/YYYY/MM/DD/slug/`
    let postUrl = `/${formattedDate}/${post.slug || post.title.replace(/\s+/g, "-").toLowerCase()}/`;

    return {
      category: category,
      subcategory: subcategory,
      content: post.content.replace(/(<([^>]+)>)/gi, ""), // 去除 HTML 标签
      created: post.date.toISOString(),
      updated: post.updated ? post.updated.toISOString() : post.date.toISOString(),
      lang: "en", // 你可以修改为动态语言检测
      summary: post.excerpt || post.content.substring(0, 150) + "...",
      tags: tags,
      title: post.title,
      url: postUrl // 确保符合 Hugo 格式
    };
  });

  return {
    path: "index.json",
    data: JSON.stringify(posts, null, 2)
  };
});


📌 4. 重新生成 index.json

运行:

pnpm hexo clean && pnpm hexo generate

然后检查 public/index.json

cat public/index.json

你应该会看到 JSON 变成:

[
  {
    "category": "Technology",
    "subcategory": "Web Development",
    "content": "This is a test post.",
    "created": "2025-03-20T12:00:00+08:00",
    "updated": "2025-03-20T12:00:00+08:00",
    "lang": "en",
    "summary": "This is a test post.",
    "tags": ["Hexo", "Static Site"],
    "title": "Hello World",
    "url": "/2025/03/20/hello-world/"
  }
]

成功让 URL 变成 /YYYY/MM/DD/slug/ 格式!

image-20250320213141804


📌 5. 让 Coco AI 识别 Hexo 博客

既然 index.json 已经生成,我们可以像 Hugo 那样,在 Coco AI 里添加 Hexo 博客的检索。

Coco AI 里,点击 添加 Hugo Site,然后输入:

http://host.docker.internal:4000/index.json

如果想测试数据同步,我们可以修改同步时间为 1 秒,以便实时观察更新情况。

image-20250320213908270


📌 6. 观察数据同步情况

过了一会,我们可以在 Coco AI 界面看到博客数据已经同步,但前提是需要先添加模型!

Coco AI 的 KNN(近邻搜索) 会按照相关性对内容进行智能排序,使检索更高效!

image-20250320214256274


🎯 总结

步骤命令
安装 Hexo 并切换到 Next 主题pnpm install -g hexo-cli && hexo init my-blog
安装 hexo-generator-json-contentpnpm add hexo-generator-json-content
修改 _config.yml让 Hexo 生成 index.json
创建 scripts/generate_index_json.js确保 URL 变成 Hugo 风格
生成 JSONpnpm hexo clean && pnpm hexo generate
在 Coco AI 里添加 Hexo 站点输入 http://host.docker.internal:4000/index.json

🚀 结论

🎉 通过本教程,你已经成功:

让 Coco AI 兼容 Hexo 博客,实现智能检索
复用 Hugo 的 index.json 结构,避免迁移成本
让 URL 变成 /YYYY/MM/DD/slug/ 以适配 Hugo Connector
在 Coco AI 里成功同步 Hexo 博客数据,并进行智能查询

💡 现在,你可以愉快地使用 Hexo + Coco AI 进行智能检索了!如果有 更多定制需求(如 authorword count),可以继续优化 generate_index_json.js!🔥🚀

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2319018.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

爬虫基础之爬取猫眼Top100 可视化

网站: TOP100榜 - 猫眼电影 - 一网打尽好电影 本次案例所需用到的模块 requests (发送HTTP请求) pandas(数据处理和分析 保存数据) parsel(解析HTML数据) pyecharts(数据可视化图表) pymysql(连接和操作MySQL数据库) lxml(数据解析模块) 确定爬取的内容: 电影名称 电影主演…

LS-NET-006-思科MDS 9148S 查看内存

LS-NET-006-思科MDS 9148S 查看内存 方法一&#xff1a;使用 show version​ 命令 该命令可显示设备的基本系统信息&#xff0c;包括内存总量。 登录交换机的CLI&#xff08;通过控制台或SSH连接&#xff09;。输入命令&#xff1a; show version 在输出中查找类似以下内容…

小程序API —— 54 路由与通信 - 编程式导航

在小程序中实现页面的跳转&#xff0c;有两种方式&#xff1a; 声明式导航&#xff1a;navigator 组件编程式导航&#xff1a;使用小程序提供的 API 编程式导航 API 提供了五个常用的 API 方法&#xff1a; wx.navigateTo()&#xff1a;保留当前页面&#xff0c;跳转到应用内…

关于金融开发领域的一些专业知识总结

目录 1. 交易生命周期 1.1 证券交易所 1.1.1 交易前 1) 订单生成&#xff08;Order Generation&#xff09; 2) 订单管理&#xff08;Order Management&#xff09; 1.1.2 交易执行 3) 交易匹配&#xff08;Trade Matching&#xff09; 1.1.3 交易后 4) 交易确认&…

DeepSeek-R1深度解读

deepseek提出了一种通过强化学习&#xff08;RL&#xff09;激励大语言模型&#xff08;LLMs&#xff09;推理能力的方法&#xff0c;个人认为最让人兴奋的点是&#xff1a;通过RL发现了一个叫“Aha Moment”的现象&#xff0c;这个时刻发生在模型的中间版本中。在这个阶段&…

15-双链表-双链表基本操作

题目 来源 827. 双链表 - AcWing题库 思路 此题我只想说&#xff0c;千万千万别漏了头结点和尾结点&#xff0c;不然根本查不出来是哪里出了问题&#xff0c;因为传入的k会有问题&#xff1b;最左边插入&#xff0c;相当于是在头结点的右边插入&#xff08;也就是0号节点的右…

【小也的Java之旅系列】01 分布式、集群、微服务的区别

前言 做Java开发多年&#xff0c;一直以来都有想把Java做成一个系列的想法&#xff0c;最近整理自己的笔记发现有很多值得写的内容&#xff0c;但这些内容又往往杂乱不堪。CSDN上有很多高质量的Java博客&#xff0c;但大多不是从一个人成长的角度去写的。而我们——一个技术人…

基于视觉的核桃分级与套膜装置研究(大纲)

基于视觉的核桃分级与套膜装置研究&#xff1a;从设计到实现的完整指南 &#xff08;SolidWorks、OpenCV、STM32开发实践&#xff09; &#x1f31f; 项目背景与目标 1.1 为什么选择视觉分级与套膜&#xff1f; 产业痛点&#xff1a; 中国核桃年产量全球第一&#xff0c;但…

JimuReport与deepseek结合,颠覆现有BI模式

在数字化转型的浪潮中&#xff0c;企业对数据的依赖程度越来越高&#xff0c;如何高效地分析和利用数据成为关键。JimuReport凭借其强大的报表设计能力和灵活的数据处理功能&#xff0c;已经成为众多企业的首选工具。如今&#xff0c;它即将与DeepSeek深度结合&#xff0c;为企…

11、STL中的set使用方法

一、了解 set 是 C 标准模板库&#xff08;STL&#xff09;中提供的有序关联容器之一。基于红黑树&#xff08;Red-Black Tree&#xff09;实现&#xff0c;用于存储一组唯一的元素&#xff0c;并按照元素的值进行排序。 set的特性 唯一性 键是唯一的。无重复。 有序性 按升序…

操作系统——(管程、线程、进程通信)

目录 一、管程机制 &#xff08;1&#xff09;管程定义 &#xff08;2&#xff09;特点&#xff1a; 二、进程通信 &#xff08;1&#xff09;概念 &#xff08;2&#xff09;高级通信机制 三、线程 &#xff08;1&#xff09;概念 &#xff08;2&#xff09;与进程比较…

Sqlserver安全篇之_启用和禁用Named Pipes的案列介绍

https://learn.microsoft.com/zh-cn/sql/tools/configuration-manager/named-pipes-properties?viewsql-server-ver16 https://learn.microsoft.com/zh-cn/sql/tools/configuration-manager/client-protocols-named-pipes-properties-protocol-tab?viewsql-server-ver16 默认…

Web开发-JS应用原生代码前端数据加密CryptoJS库jsencrypt库代码混淆

知识点&#xff1a; 1、安全开发-原生JS-数据加密&代码混淆 2、安全开发-原生JS-数据解密安全案例 一、演示案例-WEB开发-原生JS&第三方库-数据加密 前端技术JS实现&#xff1a; 1、非加密数据大致流程&#xff1a; 客户端发送->明文数据传输-服务端接受数据->…

比特币牛市还在不在

在加密货币的风云世界里&#xff0c;比特币的一举一动始终牵动着投资者们的神经。近期比特币的涨幅动作&#xff0c;再次引发了市场对于牛市是否仍在延续的激烈讨论。 在深入探索比特币市场的过程中&#xff0c;获取全面且及时的资讯至关重要。您可以通过访问Techub News&#…

Python、MATLAB和PPT完成数学建模竞赛中的地图绘制

参加数学建模比赛时&#xff0c;很多题目——诸如统计类、数据挖掘类、环保类、建议类的题目总会涉及到地理相关的情景&#xff0c;往往要求我们制作与地图相关的可视化内容。如下图&#xff0c;这是21年亚太赛的那道塞罕坝的题目&#xff0c;期间涉及到温度、降水和森林覆盖率…

跨平台RTSP高性能实时播放器实现思路

跨平台RTSP高性能实时播放器实现思路 目标&#xff1a;局域网100ms以内超低延迟 一、引言 现有播放器&#xff08;如VLC&#xff09;在RTSP实时播放场景中面临高延迟&#xff08;通常数秒&#xff09;和资源占用大的问题。本文提出一种跨平台解决方案&#xff0c;通过网络层…

编写一个简单的chrome截图扩展

文件结构&#xff1a; screenshot |-- background.js ---> service_worker运行的js |-- images ---> 图片 | |-- logo-128x128.png | |-- logo-16x16.png | |-- logo-32x32.png | -- logo-48x48.png -- manifest.json --->…

吴恩达机器学习笔记复盘(六)梯度下降算法

简介 梯度下降&#xff08;Gradient Descent&#xff09;是一种常用的优化算法&#xff0c;广泛应用于机器学习、深度学习等领域&#xff0c;在这里是用于求J&#xff08;w,b&#xff09;局部最小值。 我自己觉得这样说有点过于抽象。换个直观点的说法就是&#xff0c;一个人…

【机器学习chp14 — 3】生成式模型—生成对抗网络GAN(超详细分析,易于理解,推导严谨,一文就够了)

目录 三、生成对抗网络 ( Generative Adversarial Networks&#xff0c;GAN ) 1、GAN的基本思想 &#xff08;1&#xff09;生成器与判别器的基本结构与演变 &#xff08;2&#xff09;“对抗”机制及名词由来 2、GAN训练的基本算法 &#xff08;1&#xff09;网络初始化与…

机器人打磨控制技术

工具姿态调整运动 法线方向对齐运动&#xff1a;机器人实时调整工具姿态&#xff0c;使打磨工具的轴线与工件曲面的法线方向一致。例如&#xff0c;在球面打磨时&#xff0c;工具需始终垂直于球面切线。角度补偿运动&#xff1a;针对倾斜或不规则曲面&#xff0c;通过调整机器人…