【强力推荐】GitCode AI开源搜索,面向开发者的专业AI搜索

news2024/9/27 9:29:35

一、GitCode AI开源搜索是什么?

GitCode AI开源搜索 是面开发者的 AI 开源搜索工具,目的是为了帮助开发者快速寻找开源项目代码、解决开发问题和快速寻找答案,帮助开发者提升效率的同时利用代码仓托管能力建立自己个人知识库。

二、GitCode AI开源搜索的技术核心原理介绍

说到AI搜索引擎,首先要区分下传统的搜索能力和AI搜索能力。

  • 传统搜索,通常使用基于关键词的算法,如布尔搜索或TF-IDF,这些算法只考虑文档中的关键词出现频率,而不考虑文档的主题或语义。这导致搜索结果可能不是最相关的,而是基于单个关键词的匹配。
  • AI搜索,使用机器学习和自然语言处理技术,可以更好地理解用户意图和查询语句的语义。它可以通过深度学习模型,如BERT和GPT-3,来生成更准确的搜索结果,并提供更具体和个性化的响应。

随着大模型的迅速发展,各个搜索引擎都接入了模型搜索能力,如百度的文心一言和必应的ChatGPT等等,但语言模型不知道训练集之外的知识(例如搜索数据、行业的 knowledge ),因此引入了RAG框架。

1. RAG是什么?

Retrieval Augmented Generation (检索增强生成),能让语言模型使用外部知识( external knowledge )进行生成,我们可以把要让模型理解的新知识通过 prompt 的方式给到模型。

RAG 框架是由 3 个部分组成的:

  • 语言模型,如ChatGPT、Llama、DeepSeek、千问等等
  • 模型所需要的外部知识集合(以 vector 的形式存储,如开发者领域内容)
  • 当前场景下需要的外部知识(以prompt上下文分装传递给模型)

通过下面示例可看到RAG框架的两个效果:

  1. RAG是什么?

文心一言的回答结果
GitCode AI回答结果
显然,在开发者领域通过RAG知识加入后,GitCode的答案是用户想得到的。

2)kafka是什么?
问心一言的回答结果
GitCode AI的回答结果
显然,GitCode AI能够在kafka开源项目的知识内容加持下回答的结果更全面,包括kafka的代码展示等等

3) GitCode是什么?
这类有实效性或者内部知识的案例,在RAG知识外挂的模式下可以让语言模型准确的回答用户。
GitCode Ai的回答结果

上述三个例子和生成效果充分的印证了RAG框架下的大模型问答效果。

2. GitCode是如何构建RAG框架?

  1. GitCode AI搜索 是使用 embedding + 传统的 relation db + Elasticsearch方式构建。
  2. embedding 本质上就是把数据转化为向量,然后通过余弦相似度来找到最匹配的两个或多个向量。即knowledge -> chunks -> vector user query -> vector的过程
  3. GitCode整套知识体系包括:
  • CSDN全部的博文和文档数据
  • GitCode的项目和代码数据

3. 如何评估RAG框架的效果呢?

通常通过以下4个指标来评估效果:

指标定义
fluency流畅性,生成的文本是否流畅连贯
perceived utility实用性,生成的内容是否有用
citation recall引文召回率,所生成的内容完全得到引文支持的比例
citation precision引文精度,引文中支持生成内容的比例

三、GitCode AI搜索功能介绍

GitCode AI开源搜面向开发者快速解决问题为初衷设计,因此产品特性中包括:

  • AI问答,能够在开发者和开源领域快速回答问题,包括连续提问场景。
  • 搜索记录,能够帮助用户记录问题和回复,能够快速寻找历史问题
  • 相关问题,能够帮助用户联想和提示出相关知识点和问题,帮助用户更准确的提出问题。
  • 个人知识库,能够帮助用户收藏和保存问题文档,以markdown格式存储在个人的代码仓中,建立个人专属的知识库和个人AI知识模型
  • 开源项目,帮助开发者快速寻找开源项目,下载和体验开源项目

另外,GitCode AI搜索对未登录用户开放,核心目的是为了快速帮助开发者解决问题和提升效率。

AI问答
Ai问答

  • 功能上支持连续问答和重新生成答案,在右侧可快速点击相关项目和技术文章
  • 体验上,渲染流畅性上较之前版本有很大提升,首字母渲染时间可维持在1秒以,渲染答案上未存在卡顿。

搜索记录
在这里插入图片描述
登录用户可以在搜索记录中快速寻找之前搜索的问题和答案

相关问题
在这里插入图片描述
用户提出问题后会生成5个相关问题,可以快速点击后连续提问,帮助用户解决问题。

个人知识库
用户可以通过个人知识库收集、整理和连接自己的知识碎片,并基于开源大模型构建个性化的知识体系,提升工作、学习效率和效果。建立个人知识体系的同时,后续可只在个人知识库内搜索,返回结果更准确。
创建个人知识库
保存知识点
个人知识库代码库
开源项目
开源项目搜索
在这里插入图片描述
开源项目中包括项目快速下载、快速启动命令展示和发行版等信息。

四、GitCode AI搜索后续计划

规划内容
个人知识库建设可导入CSDN收藏夹内容和浏览器收藏内容,建立完整个人知识仓库
个人专属AI搜索在个人知识库中检索,依然是RAG+大模型能,建立个人专属AI搜索能力
开源项目AI能力增强能够在单项目下检索和建立AI搜索能力

快速体验

GitCode AI开源搜索

意见反馈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1364206.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何才能成长为一个架构师?

很多技术小伙伴都在问我,架构师是不是很牛逼,那么为什么自己不能成长为一名优秀的架构师呢?而总是作为工程师资源被项目打包带走,并周而复始的完成领导的业务开发需求任务。 架构师的工作职责? 为了方便技术小伙伴理…

带修莫队 P1903 题解

Part # 0. 前言 \text{Part \# 0. 前言} Part # 0. 前言 这个蒟蒻刚学带修莫队,所以 介绍带修莫队的部分比较简略,大家可以去参考一下 OI-wiki 或者其他大佬的博客:) 本文参考了洛谷题解。 Part # 1. 带修莫队 \text{Part \# 1.…

OSPF 路由协议原型系统设计与实现

1.题目描述 参考计算机网络教材 164 页 OSPF 路由协议工作原理,在此基础上,实现一个简单的原型系统。主 要完成工作有:路由节点泛洪发布本地节点的链路信息,其它节点接收信息,构造网络拓扑,然后利 用 Dijk…

Linux第18步_安装“Ubuntu系统下的C语言编译器GCC”

Ubuntu系统没有提供C/C的编译环境,因此还需要手动安装build-essential软件包,它包含了 GNU 编辑器,GNU 调试器,和其他编译软件所必需的开发库和工具。本节用于重点介绍安装“Ubuntu系统下的C语言编译器GC&a…

如何解决找不到mfc100u.dll无法运行程序问题,分享四种靠谱的方法

在日常使用电脑的过程中,我们可能会遇到各种问题,其中之一就是找不到mfc100u.dll的困扰。这个问题主要是因为mfc100u.dll是Microsoft Foundation Class(MFC)库中的一个版本特定的DLL文件,它是Visual Studio 2010及更早…

java 音乐会售票平台系统Myeclipse开发mysql数据库struts2结构java编程计算机网页项目

一、源码特点 java 音乐会售票平台系统 是一套完善的web设计系统,对理解JSP java编程开发语言有帮助struts2框架开发mvc模式,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发 环境为TOCAT7.0,Myeclipse8.5开发,数据…

Video classification with UniFormer基于统一分类器的视频分类

本文主要介绍了UniFormer: Unified Transformer for Efficient Spatial-Temporal Representation Learning 代码:https://github.com/Sense-X/UniFormer/tree/main/video_classification UNIFormer 动机 由于视频具有大量的局部冗余和复杂的全局依赖关系&#xf…

企业一线员工定岗定编全解析

引言:在生产制造企业中,由于一线员工工作内容单一,与产量线性关系明显,因此针对一线员工的定编方法最简单有效的就是通过数据计算的方式。人力资源专家——华恒智信根据多年以来对生产制造企业定岗定编的关注与研究得出的经验&…

第7章-第5节-Java中的比较器comparator和泛型的简单说明

1、 引入 上个章节中我们在使用TreeSet保存自定义数据类型的时候,类必须要实现Comparable这个接口,然后重写CompareTo这个方法,这个必须是在具体的自定义类内部去写,有时不方便,每遇到一个都要在那个类内部去写这个Co…

如何把电脑中的项目快速传进Github中?

一、打开GitHub网站:https:github.com 登录自己的个人账号 1.新建一个项目 2.用鼠标直接拖拽电脑中的项目文件夹与文件到新创建的项目中点击保存即可。

Xfs文件系统磁盘布局

目录 一,CentOS下Xfs文件系统的安装 二,准备工作 三,AG结构 四,AG超级块 五,AG空闲磁盘空间管理 六,ABTB的Btree 七,ABTB/ABTC的节点块管理 八,inode节点管理 九&#xff0…

Redis 键中冒号的用途是什么?可以使匹配查询更快吗?

Redis 键中冒号的用途是什么在Redis中,冒号(:)用作键的分隔符,它的主要作用是创建层次结构和命名空间。通过在键中使用冒号,可以将键分为多个部分,从而更好地组织和管理数据。 以下是冒号在Redis键中的用途…

PyTorch|构建自己的卷积神经网络——卷积层

在构建我们的网络时,我们需要用到卷积层提取特征,来看到一些特别的东西,当图片经过卷积层,图片尺寸一般会变化。 当我们构建网络时,我们需要确定各个层的参数,而这些参数,则是要提前计算的&…

【Python常用函数】一文让你彻底掌握Python中的numpy.append函数

大数据时代的到来,使得很多工作都需要进行数据挖掘,从而发现更多有利的规律,或规避风险,或发现商业价值。而大数据分析的基础是学好编程语言。本文和你一起来探索Python中的append函数,让你以最短的时间明白这个函数的原理。也可以利用碎片化的时间巩固这个函数,让你在处…

【数据分享】2024年我国主要城市地铁站点和线路数据

地铁站点与线路数据是我们经常会用到的一种基础数据。去哪里获取该数据呢? 今天我们就给大家分享一份2024年1月采集的全国有地铁城市的地铁站点与线路数据,数据格式为shp,数据坐标为wgs1984地理坐标。数据中不仅包括地铁,也包括轻…

软件测试|深入理解SQL RIGHT JOIN:语法、用法及示例解析

引言 在SQL中,JOIN是一种重要的操作,用于将两个或多个表中的数据关联在一起。SQL提供了多种JOIN类型,其中之一是RIGHT JOIN。RIGHT JOIN用于从右表中选择所有记录,并将其与左表中匹配的记录组合在一起。本文将深入探讨SQL RIGHT …

x-cmd pkg | you-get - web 媒体内容下载工具

目录 简介首次用户功能特点竞品和相关作品进一步阅读 简介 You-Get 是一个开源的命令行小型下载工具,用于从各种网站下载视频、音频和其他媒体文件。 它可以解析和下载嵌套在网页中的媒体,能从 YouTube、优酷、Niconico 、bilibili 等热门网站下载视频、…

leetcode:1108. IP 地址无效化

一、题目 二、函数原型 char* defangIPaddr(char* address) 三、思路 本题通俗来讲就是将字符串中的 . 替换为 [.] 先遍历字符串得出有num个 . 且申请 len 2*num 1 个char空间ans。len是原字符串长度,2*num是[ ]的个数,1是 ‘ \0 ’ 的空间。 …

STL——vector详解

目录 💡基本概念 💡存放内置数据类型 💡存放自定义数据类型 💡存放自定义数据类型指针 💡vector容器嵌套容器 💡vector构造函数 💡vector赋值操作 💡vector容量和大小 &…

Linux基础命令@grep、wc、管道符

目录 grep概念语法作用演示一演示二演示三,带选项 -n wc概念语法作用wc,不带选项-c,统计字节数-m,统计字符数-l,统计行数-w,统计单词数 管道符语法作用演示一演示二演示三演示四演示五 总结 grep 概念 gre…