赛博·新闻
1、特斯拉发布无人驾驶汽车Cybercab和Robovan
本周五(10月11日),特斯拉公布两款车型Cybercab和Robovan,以及他们的Robotaxi无人驾驶出租车计划。Cybercab没有方向盘,没有充电孔,也没有脚踏板和后视镜,一切以「人」为操作中心的部件都被拿掉,车内只有两个乘客位,还有一块中控大屏,就再无其他多余的配件。Robovan则是一辆无人驾驶的小型巴士,它的前脸有点像钢铁侠的面具,它一次性可以搭载20人,每人每英里的出行成本只有5-10美分,还可以用来运输一些大件货物。除此之外,发布会亮相了特斯拉人形机器人「TeslaBot」(前身为「Optimus」)。
2、海螺AI上线图片生成视频功能
本周,海螺视频新增了「图生视频」创作功能。用户点击「图片」按钮即可自由上传图像作为生成视频的首帧。官方称,MiniMax视频模型能够准确识别用户上传的图片,且确保所生成视频在形象保持上与原输入图像高度一致。MiniMax视频模型能够让光影、色调完美嵌入新场景的设定,为创作者提供连贯、深度创作的空间。指令响应方面,MiniMax视频模型可以理解超出图片内容之外的文本,解构指令框架和深层语义并在视频生成中整合,实现「所写即所见」。
3、Kimi探索版上线,专治复杂问题
本周,Kimi发布探索版,用于解决复杂类型问题,有点OpenAI o1那味了。目前Kimi探索版并未向所有用户开放,Kimi官方也表示预计将于下周一向所有用户全量开放。探索版亮点总结如下:
- 搜索调研是核心功能,值得上手体验
- 搜索量是普通版10倍,可精读超过500个网页
- 能即时反思,补充更多信息提供用户决策
- 每天5次机会,满足用户日常基本需求
- 启用方式简单,预计下周一全量推送
4、智谱发布「深度推理/多步搜索」功能
本周智谱和kimi几乎同时发布深度推理的功能,本文介绍了智谱AI搜索的深度推理和多步搜索功能,指出传统AI搜索在处理复杂问题时的局限性,并展示了智谱如何通过任务规划和执行、多级推理以及调用外部工具来提供更准确和深入的答案。文章通过一个具体的例子,说明了智谱如何将一个复杂问题拆解成多个步骤,逐步搜集信息并最终给出准确的答案。此外,文章还提到了智谱的更新,包括免费不限量的搜索、支持超过100个网页的并发搜索、多级推理的思维链,以及在联网搜索和多级推理过程中调用外部工具的能力。
5、豆包发布AI智能体耳机Ola Friend
本周四(10月10日),字节跳动豆包发布了首款AI智能体耳机Ola Friend。其为开放式耳机,单耳重量为6.6克,官方宣称同类最轻。其接入了豆包大模型,与豆包App深度结合,用户戴上耳机后,无需打开手机即可通过语音唤起豆包进行对话。其语气能够表现出高兴、意外等情绪,用户在沟通时可“边听边说、随时打断”,还能随时切换话题。Ola Friend已经在电商平台开启预售,将于10月17日正式发货,售价1199元。
赛博·洞见
1、大模型驱动的产品范式创新研究与思考
文章基于作者在2024全球产品经理大会上的演讲,分析了大模型对计算产业的三大范式转换:计算范式、开发范式和交互范式的影响。作者认为大模型同时带来了这三大范式的变革,是IT行业感到“热辣滚烫”的原因。文章重点讨论了交互范式的变革,如多模态和Agent技术,以及它们如何丰富自然语言交互(LUI)。作者还提出了“范式转换立方体”的概念,分析了大模型对不同需求轴的影响,并预测了通用人工智能(AGI)发展的高点可能在2030~2035年左右。文章最后探讨了大模型在多模态、智能体、推理能力方面的飞跃式发展,以及这些发展如何影响未来的产品形态和人机交互模式。
2、AI视频爆发式更新|近半年值得关注的13个闭源产品动向
文章概述了AI视频生成产品在近半年的发展,包括Luma AI、Runway、Kling等产品的更新和新功能。讨论了AI视频生成的难点,如物理交互准确性、训练数据多样性、运动模糊和可控性。同时,文章还介绍了一些其他值得关注的产品,如Krea AI、Viggle AI、Domo AI等,并提供了AI视频Prompt撰写的参考。
3、Hinton喜获诺贝尔物理学奖|10年61篇精选好文
文章回顾了Hinton的职业生涯和他对人工智能领域的贡献,精选了61篇关于Hinton的文章,分为五个类别:人物/传记、专访/演讲/对话、科普/深度、论文/研究和资讯/动向。这些文章记录了Hinton的成就、观点、研究进展和行业动态。
4、中国AI智能助手首个过亿下载产品来了|量子位智库月报
文章提供了中国AI智能助手产品的最新市场数据和分析。字节跳动的豆包AI智能助手以超过1.2亿的累计下载量领先,成为首个下载量过亿的产品。Kimi智能助手以4300万的下载量位居第二。App端日活方面,Kimi智能助手DAU已接近700万,月增长率近20%。豆包AIDAU有超过40%的明显下滑,数据跌落至约300万。除文小言DAU约130万外,其他产品DAU均未超过百万,且缺乏超过30%的明显增长。文章还分析了用户规模、增长、活跃度和留存率等关键指标,并介绍了新入场的支付宝AI生活管家支小宝。支小宝专注于日常生活场景,提供一键式生活服务。
5、马斯克19分钟发布会:PPT是一回事,现实是另一回事
来自晚点团队的报道,特斯拉的“We,Robot”发布会在万众期待中举行,但仅持续了19分钟,导致特斯拉股价下跌超过9%。发布会展示了两款无方向盘和踏板的车型——Cybercab和Robovan,以及人形机器人Optimus。尽管马斯克对自动驾驶的未来充满信心,但文章指出实现这一愿景的难度远超以往项目。文章通过对比马斯克的商业计划书和现实情况,揭示了自动驾驶技术面临的挑战,如技术实现、成本控制、市场接受度等,并讨论了特斯拉的商业模式和未来潜力。
6、被忽略的微软Copilot大更新,我从里面挖到了有趣的东西
文章详细介绍了微软Copilot的更新,包括Copilot Voice、Copilot Daily和Copilot Vision。Copilot Voice支持自然对话,而Copilot Vision结合视觉和语音交互。文章强调了微软对情感智能的追求,即AI不仅要实用,还要提供情绪价值。此外,文章还讨论了AI产品在设计上的共同趋势,如色彩渐变、无限画布、衬线体字体和半透明设计,这些设计旨在让AI产品更人性化、更易于融入用户生活。
7、一年之后:AI大模型航海我们身在何处将驶向何方(II)-硬件篇
文章分为三个部分,首先讨论了AI硬件的现状和未来,强调了软件对硬件的驱动作用,并预测了手机与传感器结合的生态和AI陪伴具身化将成为主要机会。其次,探讨了XR技术的发展,指出了VR和AR领域的不同挑战,并分析了苹果和Meta的战略路径。最后,讨论了具身智能的火热现象,分析了资本市场的需求和项目供给情况,并指出了具身智能面临的技术挑战,如数据采集成本和硬件适配问题。文章强调,尽管AI大模型技术取得了进展,但在硬件领域仍需克服多项挑战。
8、Voice-first,闭关做一款语音产品的思考
文章由AI产品专家Vela撰写,分享了其闭关开发语音产品的经历和思考。文章首先探讨了语音作为一种信息模态的特点,指出语音是人类最自然的交流方式,具有传递情感和语境信息的能力。接着,文章分析了语音产品的优势,如交互自然简单、不依赖屏幕、信息传递效率高等,并讨论了语音产品可能的趋势,包括新的内容创作媒介和硬件的适配。文章还探讨了为什么现在是开发语音产品的最佳时机,包括技术基础的成熟和市场趋势的支持。最后,文章讨论了如何判断产品是否适合采用语音交互界面(LUI),并提供了具体的判断标准和例子。
9、AI模型战局渐定,下一波红利在哪?
文章讨论了生成式AI市场的基础层逐渐稳定,形成了由几个主要参与者和联盟组成的均衡格局。随着大语言模型市场结构的稳定,新的前沿正在出现,焦点转移到推理层的开发和扩展上。文章强调了OpenAI的o1模型在通用推理能力上的突破,并探讨了AlphaGo在围棋中展示的推理能力如何启发AI的发展。文章还讨论了系统1和系统2思维在AI中的应用,以及新的扩展定律对AI推理能力的影响。最后,文章指出应用层创业的机会,以及AI转型如何将“软件即服务”转变为“服务即软件”。
10、播客,下一个AI涌入的赛道
文章讨论了AI技术在播客领域的新应用,特别是谷歌NotebookLM等产品如何将文本转换成逼真的双人对话播客。提到了AI音乐生成产品的热潮,以及AI播客的潜力和实现技术。文章还提到了AI播客在国内的发展情况,以及如何通过AI技术实现内容的多元化和个性化体验,提高用户满意度和参与度,推动内容产业的创新。
赛博·工具
1、photo4you
一个免费的在线证件照制作网站。
2、oneimgai
一个开源的、纯前端的文字转图片的网页应用,可以用于小红书图文、公众号长图文内容制作。
3、silo.kwok
纯前端的多模型对话、文生图工具,可以在网页同时使用多个AI模型,进行比较。
4、json4u
一个功能非常强大的json可视化和处理工具,提供图形和表格视图模式,支持结构化和文本比较、错误上下文验证、嵌套解析等功能,并且具有用户友好的界面设计:
- 图形和表格视图模式
- 结构化和文本比较
- 使用错误上下文进行验证
- 嵌套解析
- 支持jq
- 导入和导出CSV文件
- 设计良好且易于使用的UI
赛博·资源
1、用中文读科技新闻
这个网站实时给“黑客新闻”和“每日论文”的每个链接生成摘要。
2、llm-course
与大型语言模型相关的笔记和文章清单。
【推广时间】
欢迎大家关注我的个人公众号【产品老A】。
公众号简介:6年互联网大厂AIPM,专注探索新型人机交互。
老A是谁?——AI领域多年从业经验,见证了AI的沉寂和崛起。 热爱AI技术和产品,更热爱分享,希望将知识传递给更多人。 坚信AI的力量,致力于推动AI技术的应用和普及。