Cyber Weekly #28

news2024/10/17 15:28:22

赛博·新闻

1、特斯拉发布无人驾驶汽车Cybercab和Robovan

本周五(10月11日),特斯拉公布两款车型Cybercab和Robovan,以及他们的Robotaxi无人驾驶出租车计划。Cybercab没有方向盘,没有充电孔,也没有脚踏板和后视镜,一切以「人」为操作中心的部件都被拿掉,车内只有两个乘客位,还有一块中控大屏,就再无其他多余的配件。Robovan则是一辆无人驾驶的小型巴士,它的前脸有点像钢铁侠的面具,它一次性可以搭载20人,每人每英里的出行成本只有5-10美分,还可以用来运输一些大件货物。除此之外,发布会亮相了特斯拉人形机器人「TeslaBot」(前身为「Optimus」)。

2、海螺AI上线图片生成视频功能

本周,海螺视频新增了「图生视频」创作功能。用户点击「图片」按钮即可自由上传图像作为生成视频的首帧。官方称,MiniMax视频模型能够准确识别用户上传的图片,且确保所生成视频在形象保持上与原输入图像高度一致。MiniMax视频模型能够让光影、色调完美嵌入新场景的设定,为创作者提供连贯、深度创作的空间。指令响应方面,MiniMax视频模型可以理解超出图片内容之外的文本,解构指令框架和深层语义并在视频生成中整合,实现「所写即所见」。


 

3、Kimi探索版上线,专治复杂问题

本周,Kimi发布探索版,用于解决复杂类型问题,有点OpenAI o1那味了。目前Kimi探索版并未向所有用户开放,Kimi官方也表示预计将于下周一向所有用户全量开放。探索版亮点总结如下:

  • 搜索调研是核心功能,值得上手体验
  • 搜索量是普通版10倍,可精读超过500个网页
  • 能即时反思,补充更多信息提供用户决策
  • 每天5次机会,满足用户日常基本需求
  • 启用方式简单,预计下周一全量推送

4、智谱发布「深度推理/多步搜索」功能

本周智谱和kimi几乎同时发布深度推理的功能,本文介绍了智谱AI搜索的深度推理和多步搜索功能,指出传统AI搜索在处理复杂问题时的局限性,并展示了智谱如何通过任务规划和执行、多级推理以及调用外部工具来提供更准确和深入的答案。文章通过一个具体的例子,说明了智谱如何将一个复杂问题拆解成多个步骤,逐步搜集信息并最终给出准确的答案。此外,文章还提到了智谱的更新,包括免费不限量的搜索、支持超过100个网页的并发搜索、多级推理的思维链,以及在联网搜索和多级推理过程中调用外部工具的能力。

5、豆包发布AI智能体耳机Ola Friend

本周四(10月10日),字节跳动豆包发布了首款AI智能体耳机Ola Friend。其为开放式耳机,单耳重量为6.6克,官方宣称同类最轻。其接入了豆包大模型,与豆包App深度结合,用户戴上耳机后,无需打开手机即可通过语音唤起豆包进行对话。其语气能够表现出高兴、意外等情绪,用户在沟通时可“边听边说、随时打断”,还能随时切换话题。Ola Friend已经在电商平台开启预售,将于10月17日正式发货,售价1199元。

赛博·洞见

1、大模型驱动的产品范式创新研究与思考

文章基于作者在2024全球产品经理大会上的演讲,分析了大模型对计算产业的三大范式转换:计算范式、开发范式交互范式的影响。作者认为大模型同时带来了这三大范式的变革,是IT行业感到“热辣滚烫”的原因。文章重点讨论了交互范式的变革,如多模态和Agent技术,以及它们如何丰富自然语言交互(LUI)。作者还提出了“范式转换立方体”的概念,分析了大模型对不同需求轴的影响,并预测了通用人工智能(AGI)发展的高点可能在2030~2035年左右。文章最后探讨了大模型在多模态、智能体、推理能力方面的飞跃式发展,以及这些发展如何影响未来的产品形态和人机交互模式。

2、AI视频爆发式更新|近半年值得关注的13个闭源产品动向

文章概述了AI视频生成产品在近半年的发展,包括Luma AI、Runway、Kling等产品的更新和新功能。讨论了AI视频生成的难点,如物理交互准确性、训练数据多样性、运动模糊和可控性。同时,文章还介绍了一些其他值得关注的产品,如Krea AI、Viggle AI、Domo AI等,并提供了AI视频Prompt撰写的参考。

3、Hinton喜获诺贝尔物理学奖|10年61篇精选好文

文章回顾了Hinton的职业生涯和他对人工智能领域的贡献,精选了61篇关于Hinton的文章,分为五个类别:人物/传记、专访/演讲/对话、科普/深度、论文/研究和资讯/动向。这些文章记录了Hinton的成就、观点、研究进展和行业动态。

4、中国AI智能助手首个过亿下载产品来了|量子位智库月报

文章提供了中国AI智能助手产品的最新市场数据和分析。字节跳动的豆包AI智能助手以超过1.2亿的累计下载量领先,成为首个下载量过亿的产品。Kimi智能助手以4300万的下载量位居第二。App端日活方面,Kimi智能助手DAU已接近700万,月增长率近20%。豆包AIDAU有超过40%的明显下滑,数据跌落至约300万。除文小言DAU约130万外,其他产品DAU均未超过百万,且缺乏超过30%的明显增长。文章还分析了用户规模、增长、活跃度和留存率等关键指标,并介绍了新入场的支付宝AI生活管家支小宝。支小宝专注于日常生活场景,提供一键式生活服务。

5、马斯克19分钟发布会:PPT是一回事,现实是另一回事

来自晚点团队的报道,特斯拉的“We,Robot”发布会在万众期待中举行,但仅持续了19分钟,导致特斯拉股价下跌超过9%。发布会展示了两款无方向盘和踏板的车型——Cybercab和Robovan,以及人形机器人Optimus。尽管马斯克对自动驾驶的未来充满信心,但文章指出实现这一愿景的难度远超以往项目。文章通过对比马斯克的商业计划书和现实情况,揭示了自动驾驶技术面临的挑战,如技术实现、成本控制、市场接受度等,并讨论了特斯拉的商业模式和未来潜力。

6、被忽略的微软Copilot大更新,我从里面挖到了有趣的东西

文章详细介绍了微软Copilot的更新,包括Copilot Voice、Copilot Daily和Copilot Vision。Copilot Voice支持自然对话,而Copilot Vision结合视觉和语音交互。文章强调了微软对情感智能的追求,即AI不仅要实用,还要提供情绪价值。此外,文章还讨论了AI产品在设计上的共同趋势,如色彩渐变、无限画布、衬线体字体和半透明设计,这些设计旨在让AI产品更人性化、更易于融入用户生活。

7、一年之后:AI大模型航海我们身在何处将驶向何方(II)-硬件篇

文章分为三个部分,首先讨论了AI硬件的现状和未来,强调了软件对硬件的驱动作用,并预测了手机与传感器结合的生态和AI陪伴具身化将成为主要机会。其次,探讨了XR技术的发展,指出了VR和AR领域的不同挑战,并分析了苹果和Meta的战略路径。最后,讨论了具身智能的火热现象,分析了资本市场的需求和项目供给情况,并指出了具身智能面临的技术挑战,如数据采集成本和硬件适配问题。文章强调,尽管AI大模型技术取得了进展,但在硬件领域仍需克服多项挑战。

8、Voice-first,闭关做一款语音产品的思考

文章由AI产品专家Vela撰写,分享了其闭关开发语音产品的经历和思考。文章首先探讨了语音作为一种信息模态的特点,指出语音是人类最自然的交流方式,具有传递情感和语境信息的能力。接着,文章分析了语音产品的优势,如交互自然简单、不依赖屏幕、信息传递效率高等,并讨论了语音产品可能的趋势,包括新的内容创作媒介和硬件的适配。文章还探讨了为什么现在是开发语音产品的最佳时机,包括技术基础的成熟和市场趋势的支持。最后,文章讨论了如何判断产品是否适合采用语音交互界面(LUI),并提供了具体的判断标准和例子。

9、AI模型战局渐定,下一波红利在哪?

文章讨论了生成式AI市场的基础层逐渐稳定,形成了由几个主要参与者和联盟组成的均衡格局。随着大语言模型市场结构的稳定,新的前沿正在出现,焦点转移到推理层的开发和扩展上。文章强调了OpenAI的o1模型在通用推理能力上的突破,并探讨了AlphaGo在围棋中展示的推理能力如何启发AI的发展。文章还讨论了系统1和系统2思维在AI中的应用,以及新的扩展定律对AI推理能力的影响。最后,文章指出应用层创业的机会,以及AI转型如何将“软件即服务”转变为“服务即软件”。

10、播客,下一个AI涌入的赛道

文章讨论了AI技术在播客领域的新应用,特别是谷歌NotebookLM等产品如何将文本转换成逼真的双人对话播客。提到了AI音乐生成产品的热潮,以及AI播客的潜力和实现技术。文章还提到了AI播客在国内的发展情况,以及如何通过AI技术实现内容的多元化和个性化体验,提高用户满意度和参与度,推动内容产业的创新。

赛博·工具

1、photo4you

一个免费的在线证件照制作网站。

2、oneimgai

一个开源的、纯前端的文字转图片的网页应用,可以用于小红书图文、公众号长图文内容制作。

3、silo.kwok

纯前端的多模型对话、文生图工具,可以在网页同时使用多个AI模型,进行比较。

4、json4u

一个功能非常强大的json可视化和处理工具,提供图形和表格视图模式,支持结构化和文本比较、错误上下文验证、嵌套解析等功能,并且具有用户友好的界面设计:

  • 图形和表格视图模式
  • 结构化和文本比较
  • 使用错误上下文进行验证
  • 嵌套解析
  • 支持jq
  • 导入和导出CSV文件
  • 设计良好且易于使用的UI

赛博·资源

1、用中文读科技新闻

这个网站实时给“黑客新闻”和“每日论文”的每个链接生成摘要。

2、llm-course

与大型语言模型相关的笔记和文章清单。

【推广时间】

欢迎大家关注我的个人公众号【产品老A】。

公众号简介:6年互联网大厂AIPM,专注探索新型人机交互。

老A是谁?——AI领域多年从业经验,见证了AI的沉寂和崛起。 热爱AI技术和产品,更热爱分享,希望将知识传递给更多人。 坚信AI的力量,致力于推动AI技术的应用和普及。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2211794.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

动态规划的优化与高级应用

姊妹篇: 动态规划基础与经典问题-CSDN博客 贪心算法:原理、应用与优化_最优解-CSDN博客​​​​​​贪心算法:原理、应用与优化_最优解-CSDN博客 一、动态规划的优化策 动态规划在提高时间效率的同时,往往会占用较多的空间。因…

【电商搜索】现代工业级电商搜索技术-中科大-利用半监督学习改进非点击样本的转化率预测

【电商搜索】现代工业级电商搜索技术-中科大-利用半监督学习改进非点击样本的转化率预测 0. 论文信息 RecSys24: Utilizing Non-click Samples via Semi-supervised Learning for Conversion Rate Prediction inproceedings{huang2024utilizing, title{Utilizing Non-click S…

微生物测序报告中的多样性数据详细解读

随着技术的发展,高通量测序技术已成为研究微生物群落的重要工具。这种技术使得科学家们能够解析巨量微生物DNA序列,从而获得丰富的微生物组数据,包括16S rRNA基因、ITS序列和宏基因组。然而,这些数据只是迈向揭示微生物群落复杂性…

docker启动MySQL容器失败原因排查记录

背景 最近在尝试容器搭建MySQL集群时碰到一个错误,启动MySQL时碰到一个,经过排查解决,在此做一个记录 问题过程 1、启动MySQL容器 $ sudo docker run -d -p 3306:3306 \ > --name mysql \ > -v /opt/mysql/log:/var/log/mysql \ &g…

java项目之大型商场应急预案管理系统(源码+文档)

项目简介 大型商场应急预案管理系统实现了以下功能: 大型商场应急预案管理系统的主要使用者管理员功能有个人中心,员工管理,预案信息管理,预案类型管理,事件类型管理,预案类型统计管理,事件类…

【vue】03-指令补充+样式绑定+计算属性+侦听器

代码获取 知识总结 ⼀、指令补充 1.指令修饰符 1.1 什么是指令修饰符? 所谓指令修饰符就是让指令的 功能更强⼤,书写更便捷 1.2 分类 1.2.1 按键修饰符 keydown.enter:当enter键按下时触发 keyup.enter:当enter键抬起时触…

执行powershell脚本出错:未对文件进行数字签名

解决执行powershell脚本时出错:未对文件 \test.ps1进行数字签名。无法在当前系统上运行该脚本 前言 今天从github上下载了一个PowerShell脚本要在本地运行,运行的时候出现了未对文件进行数字签名的问题,然后在这里记录下怎么解决 解决方法…

选择2024年开发App的理由,费用分析与效益

App开发费用受复杂度、团队、地理位置、平台等因素影响。低代码平台如ZohoCreator提供经济高效开发方案,降低费用并提升灵活性。2024年,企业需考虑这些因素制定长期规划。 调查显示: 企业估算应用开发费用时,常采用以下公式&…

大厂面试真题-组合和聚合的区别是什么

组合和聚合比较类似,二者都表示整体和部分之间的关系。 聚合关系的特点是:整体由部分构成,但是整体和部分之间并不是强依赖的关系,而是弱依 赖的关系,也就是说,即使整体不存在了,部分仍然存在…

算法专题六: 模拟与分治快排

目录 模拟1. 替换所有的问号2. 提莫攻击3. Z字形变换4. 外观数列5. 数青蛙分治快排1. 颜色分类2. 排序数组3. 数组中的第K个最大元素4. 库存管理Ⅲ 模拟 1. 替换所有的问号 算法思路: 本题就是简单的模拟, 只需按照题目的思路遍历所有的字符, 如果为?则将其替换, 替换时寻找2…

今日指数项目day8实战权限管理器(上)

3.权限管理器 3.1 权限列表展示功能 1)原型效果 2)接口说明 功能描述: 查询所有权限集合 服务路径: /api/permissions 服务方法:Get 请求参数:无响应数据格式: {"code": 1,"data":…

Python自然语言处理之pyltp模块介绍、安装与常见操作案例

pyltp是哈尔滨工业大学社会计算与信息检索研究中心推出的一款基于Python封装的自然语言处理工具,它提供了哈工大LTP(Language Technology Platform)工具包的接口。LTP工具包以其强大的中文分词、词性标注、命名实体识别、依存句法分析等功能&…

Idea不能创建java8切换路径

顶部的Server URL改成https://start.aliyun.com/

Ubuntu配置应用开机自启动

有些自己下载的应用想要配置开机自启动,比如snipaste,steam等,可以通过一下步骤进行配置 点击应用展开图标 这个里面就是开机自启动的一些应用,可以将自己想要自启动的应用添加到这个里面来 以上是snipaste配置,起…

大数据治理:构建数据驱动的智能决策体系

✅作者简介:2022年博客新星 第八。热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏…

RocketMq详解:三、RocketMq通用生产和消费方法改造

文章目录 1.背景2.通用方法改造2.1添加maven依赖2.2 RocketMq基础配置2.3 配置类2.5 消息传输的对象和结果2.4 消息生产者2.5 消息消费者2.6 功能测试 1.背景 在第二章:《RocketMq详解:二、SpringBoot集成RocketMq》中我们已经实现了消费基本生产和消费…

CISCN2022-cactus

这周在疯狂学kernel pwn。 记录一下这题,race conditonmsg_msgpipe_buffer,kaslrsmepsmapkpti。 漏洞很简单,所有操作都没加锁,就是race condition了。edit什么的都只能2次。 很明显了,一次泄露基址,一次劫…

unidbg console debugger 调试技巧

版权归作者所有,如有转发,请注明文章出处:https://cyrus-studio.github.io/blog/ 打开debug日志 编辑 unidbg-android/src/test/resources/log4j.properties 把 log4j.logger.com.github.unidbg.AbstractEmulator 改为 DEBUG 当运行报错时…

lenovo联想 ThinkPad E14 Gen 2,E15 Gen 2 AMD(20T6,20T7,20T8,20T9)原厂Win10系统镜像下载

适用机型:【20T6、20T7、20T8、20T9】 链接:https://pan.baidu.com/s/1AVTvmiIHjafsFw8P7_jMPg?pwdzux5 提取码:zux5 联想原装WIN系统自带所有驱动、出厂主题壁纸、系统属性联机支持标志、系统属性专属LOGO标志、Office办公软件、联想电脑…