Ai前沿技术汇总[1]:Quivr非结构化信息搜索、Drag Your GAN AI修图、MiniGPT-4、Falcon-40B、localGPT

news2025/1/17 3:41:06

“AI前沿技术”专栏汇集了最前沿的人工智能技术,包括自然语言处理、语音识别、图像识别、机器学习、深度学习、强化学习、计算机视觉、区块链技术、智能机器人技术和虚拟现实技术等。本专栏将带您了解人工智能领域的最新进展和研究成果,探索人工智能技术的应用前景,感受人工智能给社会带来的变革。

1.Quivr 是一款使用生成 AI 技术来存储和检索非结构化信息的“第二大脑”

1.Quivr 是一款使用生成 AI 技术来存储和检索非结构化信息的“第二大脑”,可以将其视为 Obsidian 的增强版,并且具备更强的人工智能功能。

https://github.com/StanGirard/quivr

Quivr可以帮助把你的本地文件向量化,然后存储到云端,随时可以查询对话。文档格式支持Text、Markdown、 PDF、音频和视频。GPT端支持ChatGPT-3/4和Claude。 向量数据库使用的是Supabase ,音视频是基于Whisper的API处理成文本的,主要语言是Python开发。

  • 存储任何文件:Quivr可以处理几乎所有类型的数据。文本、图像、代码片段等等,您只需要说出来。
  • 生成式人工智能:Quivr使用先进的人工智能技术来帮助您生成和检索信息。
  • 快速高效:Quivr专为速度和效率而设计,以确保您能够尽快访问自己的数据。
  • 安全可靠:您的数据始终在您的控制下。
  • 兼容文件格式: TXT、CSV、MD、MARKDOWN、M4A、MP3、WEBM、MP4、MPGA、WAV、MPEG、PDF、HTML、*PPTX、DOCX(每个文件限制200M)
  • 开源免费:Quivr是开源的,并且可以免费使用。

目标:Quivr上传本地文件到向量数据库并及时进行文本内容检索。

Quivr 是一款使用生成 AI 技术来存储和检索非结构化信

Quivr 是一款使用生成 AI 技术来存储和检索非结构化信

2.Drag Your GAN AI版PhotoShop

2.Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold

https://github.com/XingangPan/DragGAN

DragGAN 由两个主要部分组成:
第一部分是基于特征的运动监督,通过控制起始点向目标点运动,实现图像的变形;
第二部分是新的点跟踪方法,即最近邻检索,通过在相同的特征空间上进行点跟踪,提高了效率,并避免了累计误差损失。

DragGAN

Drag Your GAN

看效果,炸裂!PhotoShop 瑟瑟发抖,p图越来越简单

3.MiniGPT-4

https://github.com/Vision-CAIR/MiniGPT-4

阿卜杜拉国王科技大学开源MiniGPT-4,具备类GPT-4的图像理解与对话能力的多模态大模型
MiniGPT-4 是阿卜杜拉国王科技大学开源的一款多模态大模型,同时具备图像理解与对话能力。它使用 BLIP-2 的冻结视觉编码器和 Vicuna 的冻结 LLM,仅使用一个投影层进行对齐。MiniGPT-4 的训练分为两个阶段。第一阶段是传统的预训练阶段,使用 4 个 A100 GPU,大约 10 小时内训练了大约 500 万个图像和文本对。第二阶段针对对话模板进行微调,实现了类似 GPT4 性能的视觉语言能力,例如细的图像描述生成、从手写草稿创建网站等。项目目前已经在 github 开源,提供在线试用,安装环境和模型权重的步骤,可在本地运行 demo,以重新训练。

MiniGPT4 是一个具有图像理解能力的开源模型,其基于 Vicuna 大语言模型 以及 BLIP-2 中的VIT和Qformer模块进行训练,使得MiniGPT4 拥有类似于GPT4的非凡能力,例如详细的图像描述生成和从手写草稿创建网站。 此外 MiniGPT4 还具备一些的其他新的功能,包括根据给定图像写故事和诗歌,为图像中显示的问题提供解决方案,教用户如何根据食物照片做饭等。下图展示了MiniGPT4的模型结构, 更多信息请参考MiniGPT4。
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
相关链接:

  • 模型权重-https://huggingface.co/lmsys
  • 论文-MiniGPT-4: Enhancing Vision-Language Understanding with Advanced Large Language Models
  • paddle框架下 minigpt4
  • 获取和转换 Paddle 版 MiniGPT4 权重

4.Falcon-40B,40B性能超越650亿的LLaMA

阿联酋阿布扎比技术创新研究所开源模型Falcon,支持免费商用,40B性能超越650亿的LLaMA
Falcon 是阿联酋阿布扎比技术创新研究所(TII)开发的一种开源语言模型,免费可商用,比 LLaMA 表现更好。它有三个版本,其中 Falcon 40B 是最强大的,虽然规模稍小于 LLaMA 65B,但在性能方面表现出色,位列 Hugging Face OpenLLM 排行榜前两名。Falcon 40B 经过 1 万亿 token 网络数据集的训练,能够理解多种语言,包括欧洲小语种。该模型的训练成本低,仅相当于 Chinchilla 的 40%和 PaLM-62B 的 80%。相较于 GPT-3,Falcon 在只使用 75%的训练计算预算的情况下,实现了显著的性能提升,推理能力强,只需要 20%的计算时间。

相关链接:

https://sota.jiqizhixin.com/project/falcon

5.localGPT:使用GPT在本地设备上进行100%私密问答,无需互联网连接

通过使用 GPT 模型在本地设备上与文档进行问答交流的方式,实现 100%私密且不离开设备的聊天。该项目受到了之前 privateGPT 的启发,使用 Vicuna-7B 模型替换了 GPT4ALL 模型,并使用 InstructorEmbeddings 代替原始 privateGPT 中使用的 LlamaEmbeddings。无论是 Embeddings 还是 LLM 都将在 GPU 上运行,并提供了 CPU 支持。可以在没有互联网连接的情况下向您的文档提问,并利用 LLM 的强大功能。

相关链接:

https://github.com/PromtEngineer/localGPT

LocalGPT OFFLINE CHAT FOR YOU

更多资讯:

多模态大模型MiniGPT4和LLaVA开源(GPT4图文对话平替);MOSS、StableLM等模型放出权重、支持本地部署

IBM开源单峰骆驼,自对齐训练降低类ChatGPT实现成本;MPT-7B、RedPajama系列模型可商用,权重均发布

BLOOMChat176B开源,支持中文可商用;谷歌发布DragGAN,单张3090可跑

Falcon-40B免费商用模型开源,性能超越LLaMA-65B;多个医疗、法律领域LLM开源(含中文)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/619841.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

软件测试的案例分析 - 闰年4.2 (加投票)

这篇博客的目录 文章目的正文错误之一出错后怎么改正?正确而简明的算法 文章目的 显示不同的博客能获得多少博客质量分 (这是关于博客质量分的测试 https://www.csdn.net/qc) 这个博客得了 60 分。 希望在新的质量分系统中,获得 80 - 90 分左…

NoSQL数据库

NoSQL数据库 NoSQL简介NoSQL兴起的原因NoSQL与关系数据库的对比NoSQL的四大类型键值数据库列族数据库文档数据库图形数据库不同类型数据库比较分析RedisMongoDBCassandraNeo4j NoSQL三大基石CAPBASE最终一致性 NoSQL简介 “Not Only SQL”泛指非关系型的数据库,区别…

简单分享怎么通过微信小程序开店

小程序开店的好处 1.可以为用户提供更多的便利。通过使用微信或其他社交媒体,可以随时随地与潜在客户进行交流互动。 2.让消费者体验更好。通过二维码、小程序代码等方式,消费者能够快速找到所需产品和服务。 3.有助于降低营销成本。相比传统销售渠道…

关于Idea的一些常用设置项

1. 输出中文不乱码 设置工程项目编码 file -> settings -> Editor -> File Encodings-> 如下图通通UTF-8 2. 创建文件自动设置本文模板 File–>settings–>Editor–>File and Code Templates–>Includes -> 输入类注释模板 /*** Classname ${N…

第9章:SpringMVC的拦截器

一、拦截器 1.拦截器的配置 SpringMVC中的拦截器用于拦截控制器方法的执行SpringMVC中的拦截器需要实现HandlerInterceptorSpringMVC的拦截器必须在SpringMVC的配置文件进行配置 ①创建拦截器,继承接口HandlerInterceptor. Component public class FirstIntercep…

深入理解Linux虚拟内存管理(五)

系列文章目录 Linux 内核设计与实现 深入理解 Linux 内核(一) 深入理解 Linux 内核(二) Linux 设备驱动程序(一) Linux 设备驱动程序(二) Linux 设备驱动程序(三&#xf…

面试银行测试岗,面试官问你网上银行转账是怎么测的,设计一下测试用例?你知道吗

目录 前言 1、网上银行转账是怎么测的,设计一下测试用例回答思路: 2.测试工作的流程?缺陷状态有什么?设计测试用例有几种方法? 3在项目中到的经典BUG是什么? 4、定期存款到期自动转存该怎么测? 5、登录功能如何设计测试用例?功能测试(FunctionTest) 6、…

上海亚商投顾:创业板指续创新低 AI概念股逆势大涨

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 市场情绪 大小指数今日走势分化,沪指全天横盘震荡,创业板指低开低走,午后一度跌近2%&…

低代码最真实的反馈是什么样的?

一、前言 业内大V陈果曾吐槽:“低代码正在以比中台更快的速度在臭大街”,但在另一方面,微软/华为/百度/网易/腾讯/阿里等互联网巨头又在纷纷入局低代码,并推出了自己的低代码平台。 所以,有人说好,但却又有…

《计算机组成原理》期末考试手写笔记——模块二:计算机数据表示方法

目录 (一)知识点总结 知识点一:进制表示 知识点二:进制转换 1.基本进制转换计算 (1)二进制数转八进制 (2)二进制数转十六进制 (3)二进制数转十进制 &…

Redis从入门到精通【高阶篇】之底层数据结构压缩列表(ZipList)详解

👏 简介:大家好,我是冰点,从业11年,目前在物流独角兽企业从事技术管理和架构设计方面工作,之前的把博客作为技术流水账在写。现在准备把多年的积累整理一下,成体系的分享给大家,也算…

阿里巴巴最新开源“SpringSecurity手册”用户+案例+认证+框架,面面俱到太全了

pringSecurity 相信Spring大家一定不陌生,那么SpringSecurity你又了解多少呢?市面上有关Spring的介绍有很多,那么对于SpringSecurity只有一些简单的有关概念的介绍,如果想深入了解并使用SpringSecurity还是需要下很大的功夫的&am…

Python爬取广州、深圳、河源、惠州四个城市天气数据,并作数据可视化

本文爬取的网站是天气,天气预报查询,24小时,今天,明天,未来一周7天,10天,15天,40天查询_2345天气王 1.爬取广惠河深2022-2024年的数据 import requests # 发送请求要用的模块 需要额外安装的 import parsel import csvf open(广-惠-河-深天气.csv, modea, encodingut…

【自学网安必看】自学网络安全遇到的问题及解决方法!

自学网络安全很容易学着学着就迷茫了,找到源头问题,解决它就可以了,所以首先咱们聊聊,学习网络安全方向通常会有哪些问题,看到后面有惊喜哦 1、打基础时间太长 学基础花费很长时间,光语言都有几门&#x…

STM32 HAL库开发——入门篇(1)

目录 一、GPIO 1.1 什么是GPIO 1.2 GPIO简介 1.2.1 GPIO特点 1.2.2 GPIO电气特性 1.2.3 GPIO引脚分布 1.3 IO端口基本结构介绍 1.4 GPIO的八种模式 1.5 GPIO的寄存器介绍 1.6 通用外设驱动模型(四步法) 1.7 GPIO配置步骤 1.8 编程实战…

用Notes打造一个资讯中心

大家好,才是真的好。 有一段时间,我介绍过,从Domino 10版本开始,LotusScript增强了网络数据访问和JSON解析功能等,从而可以从网上获取很多资讯,例如即时新闻、股市资讯等等。 例如我们采用Notes内置的讨论…

多线程-线程安全的懒汉式_死锁-ReentrantLock的使用

线程安全的懒汉式_死锁-ReentrantLock的使用 解决单例模式中的懒汉式的线程安全问题 解决单例模式中的懒汉式的线程安全问题> 饿汉式:不存在线程安全问题。 > 懒汉式:存在线程安全问题,(需要使用同步机制来处理&#xff0…

案例39:基于Java办公自动化管理系统开题报告设计

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

Spring架构篇--2.7.3 远程通信基础--Netty原理--bind实现端口的绑定

前言:在对ServerBootstrap 进行属性赋值之后,通过bind 方法完成端口的绑定,并开始在NioEventLoop中进行轮询进行事件的处理;本文主要探究ServersocketChannel 在netty 中是如何完成注册,以及端口的绑定 1 Nio selecto…

两个月涨粉90万,B站内容风向又有新指示?

6月1日,B站公布了2023年第一季度财报。 财报中显示第一季度,B站日均活跃用户达9370万,同比增长18%。用户日均使用时长96分钟,日均视频播放量达41亿,其中,本季度B站Story-Mode竖屏视频日均播放量同比增长82…