五音不全?手把手教你用自己声音唱任何歌;最详细的Auto-GPT整理;4月AI绘画模型推荐;HayoAI平台简直太酷了 | ShowMeAI日报

news2024/12/30 3:14:10

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

🤖 『ChatGPT + Code Interpreter = Magic』魔法!离谱!正在怀疑人生…

OpenAI 近期面向部分用户发放了 Code Interpreter (代码解释器) 插件使用权限,推上目前满屏惊讶脸 😮 拿到权限的用户,展示了使用 Code Interpreter插件进行的诸多尝试:

1. 处理图片。输出动态二维码、脸部识别、图片转ASCII码、创建调色板等

2. OCR 识别。导入图片输出文本等

3. 画图,生成较为复杂的svg

4. 生成 GIF 动画,也可以将GIF转为视频

5. 生成音频。创作音乐等

6. 生成日历邀请文件 .ics

7. 游戏模拟器,比如吃豆人游戏、行星轨道、跳棋、国际象棋

8. 数据分析。对上传的任意excel文件进行数据分析,绘制各类型图表,并提供洞察

9. 多个插件之间可以串起来,前一个代码运行的结果可以给下一个插件代码作为参数 ⋙ 部分推文

🤖 『微软 Bing Chat 全面开放并即将发布插件』

微软今天公布了 Bing 聊天机器人的重大升级,增加了图像和视频回答、餐厅预订、聊天历史记录以及更智能的 Microsoft Edge 整合。具体的功能包括:

1. Bing 聊天插件。类似于 ChatGPT 的插件系统,现在可以使用微软的 Bing AI 来完成任务,而无需在站点之间来回跳转。

视频里面演示了搜索结果推荐了一家餐厅,它就可以找到适合的预订时间,并帮助在聊天界面中预订所有餐厅

2. 多模态答案,支持图像搜索。很快就可以在 Bing 聊天中搜索,并要求查找物体、动物、地点等的照片或视频

3. 持续的聊天+聊天记录。聊天历史记录将使你能够在不同设备之间继续聊天机器人对话,甚至将 Bing 聊天用作研究工具

4. 官方已经取消了等候名单。注册即可使用了 ⋙ the verge | 中文解读

🤖 『生成式设计工具「即时AI」全面开放』

即时AI,可以将用户输入的自然语言描述快速生成可二次编辑的 UI 设计稿。5月4日,官方宣布全面开放,不再需要内测码,登录即可开始使用。

无论是「类似豆瓣App首页」的简单需求,还是「一个类似我的世界风格的游戏详情页,里面请包含了游戏简介、游戏截图、 steam 上的评分和评价」这类包含具体信息的需求,都可以在几十秒内完成,帮助设计师释放时间进行更有意义的思考和深入探索 ⋙ 官网

🤖 『面向AI的编程语言 Mojo 发布』可能是过去三十年来编程语言最大的革新

5月3日,前苹果工程师、swift 编程语言创建者 Chris Lattner 创立的 ModularAI 网站,发布了一个新的编程语言 Mojo。根据测试,该语言比 Python 最高提速 35000 倍!

Mojo 最大的特点是有类似Python那样的语法,但是没有Python编程语言的问题。换句话说,这个编程语言号称非常简洁,但是性能却非常好。总的来说,官方宣传Mojo的特点如下:

1. 完全兼容 Python 生态

2. 比 C++ 更快

3. 比 CUDA 更容易定制和修改(more hackable)

4. 和 RUST 一样安全 ⋙ 官网 | 中文解读

🤖 『Chat Chat 开源啦』解锁你的下一级 AI 对话体验

Chat Chat 可以使用 OpenAI、微软 Azure、Claude、Cohere、Hugging Face 等多个 API,让你的 AI 对话体验更加丰富。

此外,Chat Chat 还支持 Plugins,可以搜索内容和总结网页;并且支持分享记录,支持云端存储记录和个人设置等 ⋙ GitHub | 官网

🤖 『HayoAI = Product Hunt + Midjourney社区 + Discord + 聊天机器人+ FlowGPT』

Hayo 是一个强大的应用 (尤其是客户端),集合了 AI 聊天、艺术创作、工具推荐、新闻以及科技创新交流,有点类似于以下几大应用的结合体!完成度非常高,体验流畅,想做的事情有点大,大家快去下载体验!!

HayoAI = Product Hunt + Midjourney社区 + Discord + 聊天机器人+ FlowGPT

1. Product Hunt。HayoAI 收集了1700+ AI工具 ,有详细的介绍、点赞排名和标签分类,允许工具官方发布信息和用户交流

2. Midjourney社区。指令模块类似一个 AIGC 内容社区,可以浏览和直接使用内容的 Prompt,目前主要是 Stable Diffusion

3. Discord。 针对部分工具有单独的聊天室,比如可以直接在 Stable Diffusion 社区内输入 Prompt 进行作画,目前可以免费生成15张/小时,50张/天

4. 聊天机器人。支持包含 ChatGPT 在内的5个AI模型对话,而且可以在指令工厂里的 Prompt 页面直接跳转到聊天室使用,不用魔法上就可以用

5. FlowGPT。内置 300+ Prompt,也可以创建自己的 Prompt ⋙ HayoAI官网 | 解读

🤖 『我把我的声音训练成了AI模型,并让它唱了一首歌…』附超全面教程

AI歌姬现在非常火,B站遍地都是AI歌声,AI孙燕姿,AI周杰伦等等。在初音未来、洛天依之后,AI音乐的时代这次真正的到来了。

作者 @数字生命卡兹克 五音不全,这次终于借助 So-VITS-SVC,用自己的声音完整唱了一首「富士山下」。作者用大量的图文,详细写了整个AI声音教程,并准确了完整安装包。

1. 准备声音数据集。声音模型对数据集的要求比较苛刻,想训练自己的声音需要录制1小时以上的无杂音的纯人声,WAV 格式,再使用 Audio Slicer (音频切分工具) 将其剪裁成10秒左右的分段文件

2. 租云算力,上传数据集。训练模型挺烧显卡的,直接找到便宜稳定的云算力平台,充值三五十元就可以搞定!轻松便捷

3. 在云上训练模型。跟着截图在云平台的控制台操作,进行 10,000 步的模型训练,耗时较久,做好准备

4. 本地进行推理模型重绘歌曲。声音重绘的原理是,用模型的音色替换人声。这一步推荐了大量实用工具,比如分离工具「UVR5」、音乐获取「QQ音乐」、歌曲合成「AU/剪映」等

注意!项目完成时云算力还在烧钱!如果不继续使用,直接先点关机,然后点击释放实例 ⋙ 完整教程@数字生命卡兹克

🤖 『前魅族CMO李楠三个比喻解释AIGC』构建AI时代的核心能力和护城河

前魅族 CMO 李楠最新一期关于 AIGC 的视频「让所有人更好的理解 AIGC 的三个比喻」,观点和产出方式都很有意思,看完感觉很受启发。

他在视频里多次强调,新一代的技术之所以是革命性的,因为「带来了完全不同的思维方式和发展逻辑」,只有要抓住这个东西,才不会被时代淘汰。

比喻1:种子,水源和大树

种子 - 模型

水源 - Data

大树 - 可以使用的大模型 (比如训练好的 ChatGPT)

比喻2:工程师和魔法师

工程师 - 本质上前三次工业革命所有的参与者,都是工程师

魔法师 - 运用 AI 得到结果,但是并不清楚原理的人

比喻3:命令行和图形操作界面

命令行 - 上一代的技术,同时也是的确是下一代技术的基石

图形操作界面 - 下一代技术,但是其实会使用完全不同的逻辑发展

关于AIGC的内容,我们要小心什么

1. 用已知解释一切的人 - 福特汽车,无非就是更快的马。当真正技术变革发生的时候,不要听部分用已知解释一切的上个时代精英BB,因为他们把一切都纳入到自己的体系内,自洽的结果是他没办法进入新的领域,学习新的东西

2. 用技能掩盖认知 - 10 个技巧帮你玩转 Midjourney。技术进步的阶段,你尚可研究“ 10 个技巧玩转Midjourney”。但当技术发生颠覆性变革的时候,你不能用技巧用技能掩盖认知的落后

人类真正的价值在哪里

1. 预测和判断 - 用丰富的经验预测动荡未来,并且判断的能力

2. 感受力 - 对真实世界和人类社会更丰富的感受能力是 AI 不具有的数据

3. 跨界 - 不断进入新领域的学习能力,并且把自己的所有经历链接起来的能力

4. 面对未知,解决争论,创造 - 在动荡和不确定中领导和创造的能力 ⋙ B站视频

🤖 『4月AI绘画模型推荐榜』7个值得躺进收藏夹的模型

1. Anything V5:生成高质量的二次元和动漫图片 | 模型ID「9409」

2. AbyssOrangeMix3:生成高质量、逼真的纹理插图 | 模型ID「9942」

3. meinamix:擅长描绘二次元和动漫风格的图像,能够呈现出逼真且富有生动感的视觉效果 | 模型ID「7240」

4. GuoFeng3:高度逼真的古风角色模型,具有中国传统文化特色和华丽古风造型 | 模型ID「10415」

5. ReV Animated:适用于肖像和全身动漫般图片的人物描绘模型,同时也适用于幻想风景的2.5D或3D绘制 | 模型ID「7371」

6. Cute_girl_mix4:该LORA模型与Chilloutmix搭配使用,能够生成自然可爱的二次元女孩形象 | 模型ID「14171」

7. 墨心:该LORA模型与兴化板桥先生、八大山人等优秀作品搭配使用,生成的图片兼具传统与现代之美 | 模型ID「12597」 ⋙ 来源

🤖 『4月份爆火的 Auto-GPT 的系列整理』目前最详细清晰

随着 Auto-GPT、Baby AGI 以及斯坦福大学关于 AI Agents 的社会实验的出现,AI 代理/智能代理瞬间成为了 AI 领域的全球热点。本文从 Web 端、长期记忆、垂直领域服务、反面案例等等角度,整理了截止目前最具代表性的 AI 代理产品。

Auto-GPT

1. Auto-GPT

作为首批独立运行的 GPT-4 实例之一,Auto-GPT 重新定义了 AI 技术的边界,核心在于基于最少的人工输入/提示,利用 GPT-4 的推理能力解决更广泛、更复杂的问题

https://github.com/Significant-Gravitas/Auto-GPT

Baby AGI

2. Baby AGI

受 AGI 的定义启发,Untapped Capital 的合伙人 Yohei Nakajima 基于 GPT-4、Pinecone 和 LangChain搭建了一个名为 Baby AGI 的任务驱动的自动化代理

https://github.com/yoheinakajima/babyagi

Web Version|Web 端版本

3. AgentGPT

功能最基础的网页版 AutoGPT,界面清爽,易于使用,可一键存储/复制所生成的结果,也可选择使用自己的 API key

https://agentgpt.reworkd.ai/

4. Godmode

需要人为添加任务并确认每个步骤的网页版 AutoGPT,可人为控制变量

https://godmode.space/

5. Cognosys

目前最火的 Web 端 Auto GPT,由 Homam Tradeit 与 Sully Omarr 共同开发。输入项目名称,设定目标,输入或自动生成三项任务,即可让代理自动完成目标

https://www.cognosys.ai/

Long-Term Memory|长期记忆

6. MemoryGPT

MemoryGPT 是记忆力更长久的 ChatGPT,这个特点让它可以解决更复杂更具体的问题,同时也可以更个性化

https://memorygpt.io/

7. Teenage AGI

一个真正拥有长期记忆,记住初始目标并自动规划完成复杂任务的 AI agent

https://github.com/seanpixel/Teenage-AGI

More Professional Service|更专业的服务

8. Coding Assistant by Mckay Wrigley

开发者Mckay 通过 AI agents 进一步实现了与经过身份验证的用户搭建应用程序,当前可以构建和设计 Web 应用程序、创建具有工作数据库的后端、处理身份验证、部署到 Vercel等

https://twitter.com/mckaywrigley/status/1646596881420783619

9. e2b (english2bits)

基于开发文档,利用 AI agents 自动搭建软件。目前云托管版本还在开发,使用还需本地部署

https://www.e2b.dev/

Bad cases tigger|反面案例

10. ChaosGPT

一个对人类充满敌意并且想要统治世界的 Auto-GPT,虽然产品本身展现的意图是负面的,但让大家可以更直观地了解到 AI 的威胁性并(也许可以)提前做好应对准备,目前已经被推特关闭

https://twitter.com/chaos_gpt ⋙ 来源

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/490653.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一起单测引起的项目加载失败惨案 | 京东云技术团队

作者:京东科技 宋慧超 一、前言 最近在开发一个功能模块时,在功能自测阶段,通过使用单测测试功能的完整性,在测试单测联通性使用到静态方法测试时,发现单测报错,通过查阅解决方案发现需要对Javaassist包进…

vue3+webpack4 前端优化首屏时间

项目背景 中小项目,Vue-cli3 vue2 webpack4 目标 缩短白屏时间,用户能够更快的看到我的页面! 白屏时间:从打开页面到看到页面,中间白屏停留的时间。 方向 1.减少资源体积,从而缩短请求时间 2.减少资…

企业数字化转型为什么难?低代码平台能为企业带来什么?

企业数字化转型困难原因是多方便的,比如: 遗留系统:许多企业在难以替换或与新技术集成的遗留技术系统上投入了大量资金。 变革阻力:企业越大,参与决策的人就越多,让每个人都接受新工作方式的难度就越大。 …

前端架构师-week4-Node多进程开发入门

目录 学习路径 官方文档 什么是进程 child_process 用法 exec & execFile 用法 spawn 用法以及与exec & execFile的区别 fork用法及父子进程通信机制讲解 child_process同步方法使用教程 学习路径 官方文档 中文版:http://nodejs.cn/api/child_pr…

Flutter 如何将代码显示到界面上

前言 如何优雅的将项目中的代码,亦或是你的demo代码展示到界面上?本文对使用简单、便于维护且通用的解决方案,进行相关的对比和探究 为了节省大家的时间,把最终解决方案的相关接入和用法写在前面 预览代码 快速开始 接入&…

C. Permutation Game(博弈 + 拓扑的思想)

Problem - C - Codeforces 经过漫长的一天, Aice和Bob决定玩一个小游戏。游戏棋盘由n个格子组成,在一条直线上,编号从1到n,每个格子包含一个数字4;,qy在1到n.之间,而且没有两个格子包含相同的数字。 一个棋子被放在其中一个格子里…

nestJS入门cli 创建项目以及集成swagger和mysql

nestJs 1. 简介 介绍 NestJS NestJS 是一个基于 TypeScript 的渐进式 Node.js 框架,它结合了 OOP、FP 和 FRP 的元素,以提供一种现代且可扩展的开发体验。NestJS 建立在 Express.js 之上,但是提供了更加抽象和模块化的方式来编写应用程序。…

蓝牙资讯|苹果与谷歌起草蓝牙定位追踪设备行业规范

苹果与谷歌于当地时间5月2日联合提交了一份行业规范草案,以帮助应对蓝牙定位追踪设备遭滥用的问题。目前已有包括三星在内的追踪设备制造厂商宣布支持该草案。 据了解,苹果与谷歌此次联合提交的行业规范草案将云熙蓝牙定位追踪设备兼容跨iOS以及Android平…

【LeetCode: 518. 零钱兑换 II | 暴力递归=>记忆化搜索=>动态规划 | 背包模型】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

十五周算法训练营——二叉搜索树(BST)

今天是十五周算法训练营的第五周,主要讲二叉搜索树专题,包含:验证二叉搜索树、不同的二叉搜索树、二叉树的最近公共祖先、二叉搜索树的最近公共祖先。(欢迎加入十五周算法训练营,与小伙伴一起卷算法) BST的…

在SQL中使用AI【EVA】

EVA 旨在支持使用深度学习模型对结构化数据(表格、特征向量)和非结构化数据(视频、播客、PDF 等)进行操作的数据库应用程序。 它使用一系列受久经考验的关系数据库系统启发的优化,包括函数缓存、采样和基于成本的谓词重…

mybatisPlus初识

文章目录 什么是mybatisplus依赖入门案例自动填充乐观锁悲观锁乐观锁 mybatisPlus实现乐观锁批量查询根据指定条件查询 什么是mybatisplus mybatisplus是mybatis的增强工具&#xff0c;支持多种类型的数据库。 依赖 <dependency><groupId>com.baomidou</group…

我的服务器被挖矿了,原因竟是。。。

「作者简介」&#xff1a;CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」&#xff1a;对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》 挖矿木马应急响应 一、什么是挖矿二、被挖矿主机现象三、挖矿木马处置思路1&#xff09;隔…

Git 使用教程:最详细、最正宗手把手教学(万字长文)

目录 一&#xff1a;Git二&#xff1a;SVN与Git的的区别三、安装Git四&#xff1a;常规操作五&#xff1a;远程仓库六&#xff1a;创建与合并分支七&#xff1a;bug分支八&#xff1a;多人协作九&#xff1a;git可视化工具 Git Git 是一种分布式版本控制系统&#xff0c;用于…

搭建免费的Plex媒体服务器 - 打造超级多媒体中心【异地远程连接】

文章目录 1.前言2. Plex网站搭建2.1 Plex下载和安装2.2 Plex网页测试2.3 cpolar的安装和注册 3. 本地网页发布3.1 Cpolar云端设置3.2 Cpolar本地设置 4. 公网访问测试5. 结语 1.前言 用手机或者平板电脑看视频&#xff0c;已经算是生活中稀松平常的场景了&#xff0c;特别是各…

科普, API 是这么演变而来的

API&#xff0c;全称为 Application Programming Interface&#xff0c;中文翻译为应用程序编程接口&#xff0c;是为了方便应用程序之间的数据和功能交互而设计的一些标准方法。API 的使用让开发者能够快速、高效地构建应用程序&#xff0c;从而加速了应用程序的开发速度。在 …

第二章物理层

1.物理层的基本概念 物理层考虑的是怎样才能在连接各种计算机的传输媒体上传输数据比特流。物理层为数据链路层屏蔽了各种传输媒体的差异&#xff0c;使数据链路层只需要考虑如何完成本层的协议和服务&#xff0c;而不必考虑网络具体的传输媒体是什么。 物理层协议的主要任务 机…

21.ThreadLocal有哪些内存泄漏问题?如何避免?

ThreadLocal有以下几个内存泄漏问题&#xff1a; 长期不清理&#xff1a;如果ThreadLocal对象被长期占用&#xff0c;且不及时清理&#xff0c;会导致内存泄漏&#xff1b;使用static ThreadLocal&#xff1a;如果将ThreadLocal定义为static变量&#xff0c;就会导致它的生命周…

Java程序设计-案例:自由落体

程序模拟物体从10000米高空掉落后的反弹行为。 球体每落地一次&#xff0c;就会反弹至原高度的一半。按用户输入的弹跳次数&#xff0c;计算球体每次弹跳的高度。 实现过程&#xff1a; 1. 新建项目&#xff1b; 2. 接收 用户输入的弹跳次数&#xff1a; &#xff08;1&#…

全国快递物流 API 实现快递单号自动识别的原理解析

概述 全国快递物流 API 是一种提供快递物流单号查询的接口&#xff0c;涵盖了包括申通、顺丰、圆通、韵达、中通、汇通等600快递公司的数据。该 API 的目标是为快递公司、电商、物流平台等提供便捷、快速、准确的快递物流信息查询服务。 数据采集和处理 全国快递物流 API 的…