Cyber Weekly #26

赛博·新闻

1、Meta发布最强AR眼镜

Meta Connect 2024大会展示了多款新产品和技术，包括更便宜的Quest 3S系列AR眼镜、新功能丰富的Meta Rayban眼镜、OrionAR眼镜原型机，以及月活5亿用户的Meta AI。其中，OrionAR眼镜以其先进的交互体验和强大的AI功能备受关注，预示着AR眼镜技术的未来方向。

2、Meta发布端侧最强开源AI模型

近期，Meta正式推出了Llama 3.2多模态AI模型。Llama 3.2涵盖不同大小的模型版本：1B（文本输入）、3B（文本输入）、11B（文本+图像输入）以及90B（文本+图像输入）模型，适应于不同的应用场景和计算资源。Llama3.2保持了与前代版本相同的128K上下文长度，允许用户输入大量文本，进行复杂的任务处理。在相关的基准测试中，Llama3.2的视觉模型在图像理解任务上超越了其他竞争对手，如Claude3Haiku和GPT-4o，在图像理解任务方面表现出色。

3、Google更新Gemini 1.5系列模型

近期，Google在官网发文，宣布升级Gemini 1.5系列模型，推出了两款更新后的可投入生产的Gemini模型：Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。相较于以往版本，这两款新模型均配备200万的上下文窗口，是之前型号的两倍。此外，1.5Flash模型请求速率限制提高2倍，而1.5Pro模型请求速率限制提高约3倍。并且，两种模型在MMLU-Pro基准测试中的成绩提升了约7%，在MATH和Hidden Math基准测试中成绩都提高了约20%。Google官方表示，这些新模型基于5月份在Google I/O上发布的Gemini 1.5模型进行了改进，开发人员可以通过Google AI Studio和Gemini API免费访问该模型。

4、字节豆包视频大模型发布

9月24日，字节跳动旗下火山引擎在深圳举办AI创新巡展，一举推出了豆包视频生成-Pixel Dance、豆包视频生成-Seaweed两款大模型。简单总结豆包视频模型的特点：

支持文生/图生视频，时长可达10s
精准的语义理解，多动作多主体交互
一致性切镜
强大动态与酷炫运镜
高保真高美感，多风格多尺寸

赛博·洞见

1、AI系列(一)：一文说透AI产品经理的底牌和命门

本文是AI系列的第一篇，旨在全面分析AI产品经理的角色和挑战。文章深入探讨了AI产品经理的角色、挑战和转型路径。文章首先分析了大模型时代的行业动态和人才需求，接着讨论了C端和B端的商业应用场景，指出了AI产品经理与传统产品经理在角色上的变与不变。文章强调了AI产品经理需要理解工程链路，掌握自然语言用户界面(LUI)的设计，并在产品边界和价值上进行深入思考。

2、万字访谈Arc浏览器创始人：我们如何才能超越谷歌、苹果或微软？

文章是一次深入访谈，主要围绕Arc浏览器创始人Josh Miller对于技术创新、人工智能在浏览器中的应用、以及如何在浏览器市场与科技巨头竞争的见解。访谈中，Josh Miller分享了Arc浏览器的设计理念，即通过简化用户界面和提供自动化功能来提高用户效率。他强调了浏览器作为应用平台的潜力，并讨论了人工智能如何帮助用户更有效地处理网络任务。此外，访谈还涉及了网络商业模式的可持续性、内容创作者的权益保护，以及Arc浏览器未来的盈利模式。

3、NotebookLM：一款基于长文本理解/多模态大模型设计的Google笔记应用

NotebookLM是Google AILab基于长文本理解/多模态大模型Gemini 1.5Pro开发的笔记应用。它允许用户通过提交文件或链接快速生成英文对话播客，帮助学习英语和理解内容。NotebookLM的核心能力在于其长文本理解能力，它支持多种内容形态的组合，包括PDF、txt、Markdown文件、Google云端硬盘内容、网站链接和粘贴文字。此外，NotebookLM还支持上传图片的PDF类型内容，并可能在未来支持视频内容。产品设计上，NotebookLM基于笔记本，每个笔记本都是独立的，最多可以创建1000条笔记。NotebookLM可以用于教育、研究和内容创作等多种场景。

4、Chelsea Finn：RL是如何在Robot Learning领域创造价值的？

Chelsea Finn是斯坦福大学计算机科学与电子工程系的助理教授，她的研究重点是通过大规模机器人交互实现智能。在访谈中，Finn讨论了机器人技术的现状，包括在特定任务上取得的进展和泛化能力的挑战。她强调了数据在机器人学习中的重要性，并分享了通过收集人类操作机器人的数据来提高机器人泛化能力的方法。Finn还探讨了强化学习在机器人领域的应用，包括通过试错来学习新任务的过程。此外，她还讨论了机器人技术的商业化挑战，包括数据收集的难度和成本，以及机器人技术人才的稀缺性。最后，Finn提出了对家用机器人和人形机器人未来发展的看法。

5、找PMF就是要做没壁垒的事

来自42章经，文章通过对话形式，展示了作者Albert在AI产品开发和创业过程中的思考和经验。Albert认为，在AI创业中，最重要的是理解并长期投入于中长期成功的关键要素。他强调了评估的重要性，认为评估可以决定迭代效率，并提出了选择AI产品的原则，包括做用户有明确预期的任务和仅依靠模型就能完成交付的任务。他还讨论了创业时机的选择，认为创业成功率取决于对外部关键要素变化的判断。此外，Albert分享了他对有价值的资产的定义，以及如何通过享受过程来培养平常心。最后，他提出了寻找PMF的方法论，即去做没有壁垒的事情，并分享了他在做产品时关注的关键指标。

6、Chatbot限制了对AI Agent的想象力——斯坦福、MENLO Ventures再论Agent市场格局！

文章首先介绍了AI Agent的概念，并指出Chatbot限制了人们对AI Agent的想象力。接着，文章通过MENLO Ventures的视角，分析了AI Agent的四大构建模块：推理、外部记忆、执行和规划。文章还讨论了从RAG到自主代理的AI示例，并介绍了三种类型的代理：决策代理、轨道代理和通用AI代理。最后，文章预测了AI Agent的未来，认为它将重新定义人机动态，并影响企业应用程序和基础设施。

7、YCS24完整项目清单来了！190家AI项目一览

文章详细介绍了YCS24孵化器中的190家AI项目，这些项目涵盖了金融、医疗、工业、房地产、电商、法律、政府科技、生物技术、教育、气候、建筑、营销、客户支持、人力资源、财务、安全、税务、AI运营、芯片、数据中心、数据、模型等多个领域。文章还提到了YC孵化器即将迎来创立近20年来的最大变化，即开启1年4次路演日的新节奏，以适应AI创业速度。

8、解密OpenAI高管集体离职与o1模型十问十答续

文章首先讨论了OpenAI高管集体离职的背景，包括CTO Mira、Chief Research Officer Bob和VP of Post Training Barret的离职。文章分析了这些高管离职对OpenAI的影响，以及他们离职可能对AGI竞争格局带来的变化。接着，文章通过十问十答的形式，深入探讨了o1模型的训练、推理、数据准备等方面的挑战和进展。文章还提到了o1模型在不同领域的应用情况，以及开发者对o1模型的反馈。

9、Google发布全球185个各大企业的生成式AI实际应用落地案例

文章详细介绍了185个来自全球各大企业的生成式AI实际应用案例。这些案例展示了生成式AI在客户服务、员工管理、代码开发、数据分析、安全管理及创意领域中的广泛应用。例如，阿拉斯加航空开发自然语言搜索，麦当劳利用数据和AI技术加快创新并提升客户体验，Leroy Merlin通过VertexAI构建代码变更摘要工具，提高代码评审效率，PUMA印度利用AI自定义产品照片，点击率提高了10%。

10、明星创业者被击碎的21个月

心识宇宙创始人陶芳波分享了其创业历程。心识宇宙在ChatGPT出现后面临挑战，客户流失、融资受阻，团队成员离开。陶芳波通过海外投资机构的500万美金得以续命，并调整战略，从toB转向toC，放弃Agent平台，转向个人记忆AI伙伴Me.bot。他坚信自我迭代，希望通过Me.bot实现个人化AI，为未来AI发展提供新方向。

11、让做App像做饭一样平常，LLM即将开启「定制化应用开发」新时代

本文探讨了在大模型语言（LLM）的辅助下，软件开发的新趋势，即“赤脚开发者”的兴起。赤脚开发者指的是那些对编程感兴趣但并非专业开发者的人群，他们能够利用LLM等工具满足社区中的小众需求，开发定制化应用。文章指出，LLM的出现降低了编程的门槛，使得开发流程变得更快、更简单、更便宜，从而为赤脚开发者提供了广阔的发展空间。

12、你的AI智能体正确吗？API开发中10+个智能体的启示与反思

本文讨论了在API开发过程中AI智能体的应用和挑战。作者指出，尽管AI可以辅助API开发，但设计、文档编写和代码审查等关键环节仍需人类参与。文章通过分析API开发流程，提出了10+个智能体的概念，以减轻开发者的负担，并探讨了AI与人类协作的平衡点和确保API质量的方法。

赛博·工具

1、360AI助手：多模型协作

AI助手用了多个国内顶尖模型整合了一个思维链功能，继续发挥单挑不过就群殴的优势。你现在可以选择三个模型分别作为专家、反思者和总结者三个步骤对一个问题进行答复。即使第一个专家模型回答有问题或者不完善，后面的反思者和总结者也可以纠正问题给出正确答案。这个功能上了之后模型幻觉和错误问题可以得到很大的抑制，同时回答的质量也会大幅提高。涉及逻辑推理问题的正确率虽然没有刚发布的O1好，但是要比4O高非常多。另外他们还推出了国内模型版本的LLM模型竞技场，可以用多种方式对国内主流LLM进行测试。