对标GPT-4o!不锁区、支持手机、免费使用,Moshi来啦!

news2024/12/28 13:24:40

7月4日凌晨,法国知名开源AI研究实验室Kyutai在官网发布了,具备看、听、说多模态大模型——Moshi。

Moshi功能与OpenAI在5月14日展示的最新模型GPT-4o差不多,可以听取人的语音提问后进行实时推理回答内容。但GPT-4o的语音模式要在秋天才能全面开放使用,而Moshi已经提供使用了。

「AIGC开放社区」已经亲自测试,Moshi不锁区,填写一个邮箱地址就能直接使用,无需任何等待。值得一提的是,Moshi是支持手机移动端使用的,只不过对普通话支持较差,最好使用英语提问

此外,Kyutai可能很快就会开源Moshi,公布代码、模型权重和论文。

免费体验地址:https://moshi.chat/?queue_id=talktomoshi

图片

Moshi的使用流程非常简单,1)登录https://moshi.chat/?queue_id=talktomoshi

2)填写一个邮箱地址,然后点击join。如果是手机登录,系统会提示使用你的麦克风,因为这个产品对语音是一个硬性要求。如果你是PC端使用,也必须有麦克风,不然没法使用。

图片

「AIGC开放社区」的真实使用过程

3)开始语音输入,你想提问的内容就行了。

图片

下面这个是官方展示的案例,根据多轮语音连续对话,主要让Moshi用法语来一首关于巴黎的诗;接着用窃窃私语的方式描述一个神秘故事。

Moshi完成的很出色,其拟人化语气是一大特点机器味很少,这一点和GPT-4o有点像。

这个是模拟星际战舰指挥官与航程的故事,主要询问了一些到达目标航程,周围环境等内容。(由于听译的可能理解的不太全~~)

「AIGC开放社区」也体验了一下,主要问了Moshi几个简单问题:第一个,法国巴黎有哪些著名景点?Moshi:埃菲尔铁塔。

接着问,卢浮宫博物馆有哪些著名的展览物品?Moshi:世界名画蒙娜丽莎的微笑。

又问了,巴黎有哪些标志性建筑?Mosh:凯旋门,这是一个拥有悠久历史的建筑。

由于Moshi的论文还没有发布,「AIGC开放社区」就说一说自己的亲身使用体验吧。

1)响应速度超级快,本次测试使用的是国区线路,而Moshi的demo服务器在欧洲和美国,但当你用语音提问完问题后,几乎0延迟就能马上响应你的提问。Moshi官方给出的理论延迟是160毫秒。

图片

2)不支持中文普通话,这一点还是能理解的,毕竟Moshi面向的国外用户群体,主流语言还是英语,同时也支持法语。

3)回答内容有限,Moshi虽然是语音输出内容,但详细程度比ChatGPT那种纯文本差好多,回答的内容只能是轮廓大概,相信以后产品会迭代更多。

4)使用方便快捷,几乎没有繁琐的注册流程,你只需要提交一个邮箱即可,马上就能帮助你非常方便。

5)Moshi听和说的能力有了看的能力还没展示出来,这个功能估计以后也会添加吧,这样整个输出模式将更加完善。

6)这类产品对家教、教育行业是起到颠覆性作用,例如,让家教老师帮你反复讲解一道高数题,估计两遍人就比较恼了,而AI可以帮你循环讲解无数次,这对于教育帮助是巨大的。

7)期待国产类似的GPT-4o、Moshi产品出现,最好再支持一些闽南话、粤语、四川话、东北话等有特色的地方语言,就像汽车导航那样一定会非常有意思。

对于Moshi的发布,网友们还是相当兴奋的,在我们苦等GPT-4o的语音模式时,Moshi横空出现,期待他们更好的表现。

图片

在推理延迟方面,Moshi似乎比GPT-4o更好。这一点从实际操作来看,确实是很快的。

图片

刚试了一下Moshi的产品,其高效的推理响应以及低延迟,令人印象深刻,这就是我一直期待的产品。

图片

继续称赞Moshi的低推理延迟。如果使用功能更高级的模型,即便推理时间长一些也没问题。确实现在,Moshi的回答内容还是太宽泛了。

图片

已经有人急的不行,开始要源代码了,你们可是开放AI研究实验室啊~

图片

本文素材来源Moshi官网,如有侵权请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1892524.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VDS虚拟导播切换台软件

VDS 导播软件是一款功能强大的虚拟导播系统软件,具有全媒体接入、播出内容丰富、调音台、快捷切播与导播键盘、云台控制等特点,同时支持向多个平台直播推流。以下是一些常见的 VDS 导播软件特点: 1. 全媒体接入:支持多种设备和网…

AI绘画Stable Diffusion 新手入门教程:万字长文解析Lora模型的使用,快速上手Lora模型!

大家好,我是设计师阿威 今天给大家讲解一下AI绘画Stable Diffusion 中的一个重要模型—Lora模型,如果还有小伙伴没有SD安装包的,可以看我往期入门教程2024最新超强AI绘画Stable Diffusion整合包安装教程,零基础入门必备&#xff…

本地搭建Stable Diffusion,文生图再也不用求别人了!

前言 本地搭建Stable Diffusion,文生图再也不用求别人了 1. 简介 Stable Diffusion 是一种深度学习模型,用于生成高质量的图像。它基于一种名为扩散过程的生成方法,能够在给定条件的情况下生成具有丰富细节的图像。 看看本文的搭建步骤&a…

国内外大模型集合

为了满足日益增长的AI需求,我们精心打造了一站式大模型导航网站,旨在成为连接您与全球顶尖人工智能模型的桥梁。无论您是科研工作者、开发者还是对AI充满好奇的探索者,这里都有您所需。 国内大模型精选 通义千问 —— 阿里巴巴集团倾力打造…

【测试开发】【postman】按顺序循环执行接口

postman按顺序循环执行接口 新建接口接口排序执行请求集合 新建接口 Request 001 Request 002 Request 003 接口排序 在Request 001的Tests中添加代码 postman.setNextRequest("Request 002");在Request 002的Tests中添加代码 postman.setNextRequest("Requ…

8.12 矢量图层面要素单一符号使用十五(栅格线渲染边界)

前言 本章介绍矢量图层线要素单一符号中标记符号渲染边界(Outline: Marker line)的使用说明:文章中的示例代码均来自开源项目qgis_cpp_api_apps 栅格线渲染边界(Outline: Raster Line) Outline系列只画边界&#xf…

Windows编程之多线程事件对象(Event Object)用法详解

目录 一、前言 二、基础用法 三、API详解 1.创建事件对象 2控制事件状态 3.等待事件对象: 四、实战案例 1.案例描述 2.代码设计 3.总设计代码 4.运行结果 一、前言 事件对象(Event Object)是我们在大型项目中,进行多线…

Android TextView的属性与用法

文本控件包括TextView、EditText、AutoCompleteTextView、CheckedTextView、MultiAutoCompleteTextView、TextInputLayout等,其中TextView、EditText是最基本最重要的文本控件,是必须要掌握的文本控件。 1.TextView TextView控件用于显示文本信息&…

21.《C语言》——【位操作符】

🌻开场语 亲爱的读者,大家好!我是一名正在学习编程的高校生。在这个博客里,我将和大家一起探讨编程技巧、分享实用工具,并交流学习心得。希望通过我的博客,你能学到有用的知识,提高自己的技能&a…

从数据洞察到智慧决策:数字孪生技术在智慧水利中的应用实践,为水库管理提供强有力的数据支撑和智能分析

目录 一、引言 二、数字孪生技术的核心与原理 三、数字孪生技术在智慧水利中的应用场景 1、水库管理的挑战与需求 2、数字孪生水库管理系统的构建 四、数字孪生技术在水库管理中的具体应用案例 1、洪水预测与模拟 2、水资源配置与调度 3、大坝安全监测与评估 4、生态环…

notepad++ 中文乱码 出现小方格

从word文档直接拷贝过来的文字,到notepad 中文乱码 出现小方格 : 方法:设置-语言格式设置,字体样式更改为宋体,勾选“使用全局字体”,点保存并关闭,则ok

组件丰富、支持2/3D数据可视化的编辑器平台软件?

数据可视化编辑器通常用于创建交互式的图表和模型,可以帮助用户以更直观的方式展示数据。一些在线平台软件提供了丰富的组件,支持2D和3D数据可视化: 1、Plotly - 提供了多种语言的库,支持在线创建交互式图表,包括2D和…

实验六(1) SQL数据查询—单表查询

题目 打开ecommerce数据库,用SQL语句完成下列各项查询要求: 查询供应商表supplier中所有供应商的信息查询供应商表supplier中所有北京地区供应商的名称supname和联系电话telephone查询商品类别表category中所有商品类别的信息,并以“类别编号…

基于主流SpringBoot进行JavaWeb开发的学习路线

目录 一、学习路线 (1)第一部分(Web前端开发的技术栈) (2)第二部分(Web后端开发) 二、学习之后必备的技能 三、学习Web开发的基础与未来的收获 学完这一类知识目标:…

Markdown编辑器的基本语法

这里写自定义目录标题 欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一个…

Stylized Modular Character Male(程式化的模块化角色-男)

一套程式化的角色模块化部件。 在这样的插槽中定制: 头 躯干 手 裤子 每个插槽都有 2 到 5 个在 URP 中工作的 PBR 材料的选项。 该项目基于官方 Unity 标准资产包中的 Ethan 默认角色。 不包含动画。 皮肤网格的 SSS 是由自发光贴图伪造的。 如果您不想要额外的发光效果,请禁…

C++:求梯形面积

梯形面积 已知上底15厘米&#xff0c;下底25厘米&#xff0c;问梯形面积值是多少&#xff1f; #include<iostream> using namespace std; int main() {//梯形的面积公式&#xff08;上底下底&#xff09; 高 2//上底变量、下底变量int s,d,h,m;s15;d25;h 2*150 * 2/s ;…

[笔记] 卷积03 - 运算的对称性 时域构建高通滤波器的失败尝试

1.卷积运算具备足够好的对称性 1.在计算卷积时&#xff0c;两个函数的位置是可以颠倒的&#xff0c;对吧&#xff1f; 在卷积运算中&#xff0c;确实可以对参与卷积的两个函数进行颠倒。这是因为卷积的定义是通过一个函数与另一个函数的翻转后的形式进行积分运算。具体来说&a…

股价持续低迷,业绩颓势不减,冀光恒难救平安银行?

文&#xff5c;新熔财经 作者&#xff5c;宏一 周一一上班&#xff0c;就听到旁边的同事感慨今年股市行情很不错&#xff0c;尤其是银行股&#xff0c;上半年累计上涨了17.02%&#xff0c;是涨幅最大的板块。 听到这里&#xff0c;我美滋滋地打开自己的账户&#xff0c;结…

21_硬件电路基础

目录 组合逻辑电路 组合逻辑电路原理 真值表 布尔代数 门电路 译码器 发光二极管LED 液晶字符显示器LCD 数据选择器 数据分配器 多路开关 时序逻辑电路 时序逻辑电路原理 时钟信号 触发器 电位触发方式触发器 边沿触发方式触发器 寄存器 移位器 计数器 总线…