赛博·新闻
1、苹果召开2024年WWDC开发者大会
本周二(6月11日)凌晨1点,苹果召开2024年全球开发者大会,宣布与OpenAl合作,在iOS18、iPadOS18和macOS Sequoia中全面支持GPT-4o。用户在询问Siri问题时,Siri可以直接以ChatGPT的Al能力回答与文本、文档、照片、PDF等相关的问题。
更多WWDC24的报道:
- 甲子光年:苹果重新定义AI:AI=Apple Intelligence|甲子光年
- APPSO:iOS18正式融合GPT-4o,苹果重新定义「AI」,你的iPhone喜提史诗级更新!
- 量子位:苹果一夜重塑iPhone!GPT-4o加持Siri,AI深入所有APP,库克:开启苹果AI下一章
- 有新:深度|Apple Intelligence正式发布!Siri进入新时代;ChatGPT接入苹果各个平台
- 极客公园:苹果AI,给手机+AI打了一个样
- 卡兹克:今年苹果的WWDC大会只有一件事-AI、AI、还是AI。
- 新硅:看完苹果的AI功能,我觉得它在逼我买最新款iPhone
- 四木相对论:Apple Intelligence:苹果终于打响大模型时代第一枪
- 夕小瑶:一夜之间,苹果杀死无数AI工具创业公司!GPT-4o深度整合进苹果
2、Stable Diffusion 3 Medium正式开源
本周三(6月12日),Stability AI正式开源了Stable Diffusion 3 Medium(2B),这是迄今为止最先进的文生图开源模型,被视为生成式AI发展的一个重要里程碑,该模型可以通过HuggingFace下载。它具有一些显著的优点:
- 照片写实主义:克服手部和面部常见的瑕疵,无需复杂的工作流即可提供高质量的图像。
- 提示遵循:理解涉及空间关系、构图元素、动作和风格的复杂提示。
- 排版:在Diffusion Transformer架构的帮助下,在生成没有伪影和拼写错误的文本方面取得了前所未有的效果。
- 资源高效利用:由于占用较低的VRAM空间,非常适合在标准消费者GPU上运行且不会降低性能。
- 微调:能够从小数据集中吸收细微的细节,非常适合定制化。
3、任何声音一键写歌,Suno让音乐彻底无门槛
本周三(6月12日),Suno正式推出了一个新功能:用任何声音写歌的「音频输入」。这进一步降低了普通人音乐创作的门槛,但目前只有Pro或者Premier订阅用户可用。
4、英伟达开源最强通用模型Nemotron-4 340B
本周五(6月15日),英伟达宣布推出Nemotron-4 340B(3400亿参数)系列模型,它包含一系列模型(基础模型Base、指令模型Instruct和奖励模型Reward),开发人员可以使用这些模型生成合成数据,用于训练大语言模型,可用于医疗健康、金融、制造、零售等所有行业的商业应用。英伟达使用了9万亿个token(文本单位)进行训练,Nemotron-4 340B-Base在常识推理任务,如ARC-c、MMLU和BBH基准测试中,可以和Llama-370B、Mixtral 8x22B和Qwen-2 72B模型媲美,该模型目前已经可从HuggingFace下载。
5、AI视频生成模型Dream Machine发布,比Sora更真实流畅
本周Luma公司发布最新的视频生产模型Dream Machine(造梦机器),效果比OpenAI Sora更真实、更流畅,网友无不惊叹,免费体验地址。Dream Machine的主要特点:
- 120秒生成120帧,动作逼真连贯
- 角色一致性极强,能够模拟物理世界
- 运镜流畅自然,情感匹配场景
6、美图版Sora最新视频曝光,还连发6款AI生产力工具
美图CEO吴欣鸿,在美图影像节上展示了奇想大模型视频生成的最新效果,现场发布6款产品,覆盖多种领域:
- 美图云修V2:专业级AI批量修图软件
- 开拍V2:AI制作口播视频工具
- 美图设计室V3:电商AI设计工具
- 站酷设计服务:优质设计服务平台
- 奇觅:游戏物料AI制作与投放平台
- MOKI:AI短片工具
7、马斯克撤销对OpenAI和Sam Altman的诉讼
本周二(6月11日),Elon Musk在加利福尼亚州法院撤回了针对OpenAI、Sam Altman和Greg Brockman的诉讼。此前,Musk公开批评了OpenAI及其与苹果的新合作伙伴关系。这起案件被驳回,但未排除再次提起诉讼的可能性。Musk在2月份对OpenAI、Altman和Brockman提起了违约和受托责任的诉讼。专家指出,这起案件的法律基础存疑,因为诉讼的核心合同并非所有相关方签署的正式书面协议。Musk声称,早期的OpenAI团队旨在为人类利益开发人工通用智能(AGI),但该项目已转变为一个主要由微软控股的盈利实体。
8、OpenAI年收入将达34亿美元,但和苹果合作却没收一分钱
据The Information最新消息,OpenAI首席执行官Sam Altman对员工表示,在过去六个月左右的时间里,OpenAI的年收入增长了一倍多,年化营收有望达到34亿美元。然而,根据彭博社最新消息,在这次苹果与OpenAI的合作中,双方都未向对方支付费用。知情人士表示,双方认为将OpenAI的品牌和技术推向数亿台设备上,比金钱支付拥有更大的价值。
9、微软正在推动OpenAI转变为营利性公司,Sam Altman或拥有更多股权
根据The Information最新报道,Sam Altman最近告诉一些股东,OpenAI正在考虑将其治理结构转变为一家营利性企业,OpenAI的非营利董事会无法控制该企业,而这一行为也是微软一直在推动的。Altman还表示,董事会正在考虑的一种方案是成立一家营利性福利公司,Anthropic和xAI等竞争对手正在使用这种方案。
10、“小爱同学”接入豆包大模型
本周三,小米旗下人工智能助手“小爱同学”与火山引擎达成合作,双方基于豆包大模型为用户带来更智能的AI交互体验。借助字节跳动豆包大模型提供的联网搜索插件能力,小爱智能助手将能够实时捕获与头条内容同源的搜索结果,为用户呈现全面且时效性强的答复。但这并不意味着小米不自研基座大模型,或许和苹果一样,现阶段使用行业内体验较好的大模型也只是无奈之选。
11、复旦大学公布高考数学大模型评测结果
本周,复旦大学NLP实验室LLM EVAL团队发布2024年高考数学大模型评测的结果。在这次评测中,阿里千问和讯飞星火分别获得了2024年高考数学新I卷的第一名和第二名,以及高考数学新II卷的第二名和第一名。而在两份考卷的评测中,GPT-4o均列第三名。字节豆包、智谱清言、百川等大模型紧随其后,而百度文心一言、Kimi等大模型准确率较低。
赛博·洞见
1、国产大模型四巨头现场激辩:价格战对中国AI有利,但降价逼不出AGI
6月14日上午,国内大模型“四小龙”:百川智能CEO王小川、智谱AICEO张鹏、月之暗面CEO杨植麟、面壁智能CEO李大海在2024年智源大会上就“大模型是否是通往AGI之路的基石”展开深入探讨,各位嘉宾分享了他们对大模型在AGI发展中关键作用的见解。以下为本次对谈的要点:
- 王小川:大模型是通往AGI的基石,但仅靠Scaling Law无法实现AGI,还需进行范式转换,如数据算法算力的创新,以及探索新的学习范式和压缩模式。此外,他认为AGI的定义可以是能否造医生,因为医生是智力密度最高的职业之一,具备多模态处理、少幻觉、记忆、推理、查文献等能力。
- 张鹏:虽然目前无法确定大模型能否帮助人类达到AGI的顶峰,但在现阶段,大模型是有效的,并且Scaling Law在未来相当一段时间内仍然会发挥作用。他认为AGI是一个动态的概念,其内涵和外延会不断变化。
- 杨植麟:大模型是第一性原理,通过提升模型规模和进行更好的压缩,可以产生智能。但在数据稀缺或不存在的领域,需要解决数据问题。他认为AGI的定义重要,但短期内难以精确量化,需要对评估维度进行拆分,以更好地衡量AGI的开发进度。
- 李大海:大模型是通往AGI方向上当前所有技术中能走得最远的,但能否直接达到AGI还存在未知因素。他认为大模型目前主要处理人的大脑系统1的工作,未来需要通过agent技术将系统2的能力外部化或内化。此外,他从经济学角度定义AGI为执行任何任务的边际成本为零,并认为大模型的智能密度和小型化也是重要的发展方向。
2、Elon Musk万字访谈:AI,脑机接口,与火星移民计划
马斯克深度访谈,干货满满,他谈到现在的AI(如OpenA ChatGPT和Google Gemini)基本上被训练来撒谎(迎合政治正确,和人类价值观“对齐”),而非追求真理,这种做法是非常危险的。马斯克认为对于AI来说,最安全的做法是最大限度地追求真理,即使真理不受欢迎,其次是让AI保持好奇心,这可以促进人类的发展。此外,马斯克强调了通信带宽在AI对齐中的重要性,认为提高通信速度可以减少AI带来的风险,同时实现大脑和脊柱的修复。最后,Musk强调了将人类变为多星球物种的重要性,以应对未来可能发生的自然灾难和确保意识的延续。
3、独家对话李开复:中国AI助手赛道DAU仅千万量级,大模型市场教育很迫切
腾讯科技对话大模型行业的创业者、零一万物CEO李开复博士,李开复指出当前国内AI助手的DAU仅在千万量级,远低于ChatGPT的亿级用户量,市场教育是当前最紧迫的任务,用户对AI助手的认识不足,常将其误作搜索引擎使用。他还讨论了大模型的评测方法、产品体验的提升、用户增长策略以及个人在团队中的领导方式。
4、万字访谈AI独角兽97年华人CEO:高质量数据对训练先进AI模型有多重要?人类智能的长期推理和优化能力是关键优势
本文是对AI独角兽Scale AI(专注于AI的数据处理)CEO Alexandr Wang进行的一次深入访谈,Wang认为高质量数据是推动AI发展的关键,而评估和透明度对于建立对AI技术的信任至关重要。此外,尽管AI在某些领域超越了人类,Wang相信人类智能的长期推理和优化能力是关键优势。
5、a16z:Top100 GenAI Consumer Apps最新官方解读
a16z发布了Top100 GenAI Consumer Apps名单,文章分析了生成式AI消费应用的市场趋势、产品特性以及全球AI技术的发展情况,其中陪伴类应用非常突出,这类应用种类繁多,旨在迎合不同用户群体的需求,同时它们并不局限于开放式对话,可能以游戏、教练或其他形式呈现。
6、AI应用爆发前夜的三个信号
松鹅撰写,主要讨论了AI应用即将到来的爆发前夜的三个关键信号:
- 大模型效果的提升和成本的下降是AI应用发展的核心驱动力:模型效果的提升和推理成本的大幅下降是AI应用商业化的关键。只有成本真正降低,才能让一些应用的商业模式成立。
- 已有互联网产品加入AI后的营收增长是AI商业价值的体现:这些产品具备市场地位、行业知识、客户关系等优势,理应最早收获AI带来的价值。文章预测,会有一些产品因为加入AI而使得营收增长至少30%。
- 共识下的应用层创业者的出现和成功是AI创新的关键:这些创业者因市场共识迅速获得融资,他们的成功将激励更多创业者进入市场,推动AI应用层的快速发展。
7、苹果专为私人AI处理设计云智能系统
这篇文章介绍了苹果公司的Private Cloud Compute(PCC)系统,这是一个专为私人AI处理而设计的云智能系统。PCC采用定制的苹果芯片和加固操作系统,将苹果设备领先的安全和隐私保护扩展到云端,确保用户发送到PCC的个人数据除用户外任何人都无法访问,甚至包括苹果公司在内。
8、LLM自动化对齐技术
阿里巴巴和中科院合作发布的论文,全面概述了大语言模型自动对齐的主要技术路径。利用自动对齐技术,以最少的人工干预,建立高质量、可扩展的对齐系统,使得语言模型能够满足人类需求。现有的自动化对齐技术分为以下四种:
- 通过归纳偏差对齐(Aligning through inductive bias)
- 通过行为模仿对齐(Aligning through behavior imitation)
- 通过模型反馈对齐(Aligning through model feedback)
- 通过环境反馈对齐(Aligning through environment feedback)
9、达摩院推出“全自动竞技场”评测框架
达摩院重磅推出大语言模型“全自动竞技场Auto Arena”评测框架,首次实现无需人工标注的评测革命。通过大模型出题、大模型辩论、大模型委员会裁定,该方法无需任何人工,却可以达成目前和人类评测结果一致度最高的结果。
10、图解自注意力机制(Self-Attention)
本文通过图解的方式详细解释了自注意力机制(Self-Attention)的原理、应用以及与RNN的区别。Self-Attention机制通过并行计算和考虑所有输入的方式,有效地解决了传统序列模型如RNN在处理长序列时的局限性,并且在捕捉序列内部元素关系方面更为灵活和有效。
11、智变时代/全面理解机器智能与生成式AI加速的新工业革命
本文洋洋洒洒3.6w字,回顾了近一年半AI的重大发展,文章深入探讨了生成式AI技术如何推动新工业革命,并全面分析了AI领域的最新进展、应用、变革及其对未来产业和人类自身的影响。本文分为五个章节,首先讨论了AI模型的竞争和变革本质,接着探讨了智能代理和组织新形态,然后分析了AI如何诱导需求和改变算力结构,进一步讨论了AI模型的理解和演化,最后探讨了职业变迁、自我提升与科技对社会的深远影响。
赛博·工具
1、手写体文稿生成器
一个手写字体模拟器,可将文本转换为手写体形式,并下载为图片或PDF文档,支持调整字体、纸张类型、边距、字体大小与颜色等,更可以设置纸张的光影和褶皱,使其更加逼真,免费使用,无需注册。
2、为图片添加文案
为照片添加极简边框和底部签名文字,让你摄影作品看上去更专业。
3、PicProse:图片文字美化
4、CoverPaint:封面设计
赛博·资源
1、AI时代个人生存/摸鱼探索指南.Beta
作者余一,分享了AI时代个人如何更好地生活、学习和工作。他提出三大原则:
- 研究AI,不仅仅是研究AI新闻。看一手一线信源,多尝过,多解决实际问题
- 打破自己的边界,关注那些过去很难,现在可以在AI帮助下开始启动的事情
- 放弃工具思维,把AI当做协作的伙伴,AI做70%,自己做30%,不要浪费时间在让它成为完整体上(最重要)
2、【IBM】内容供应链变革:生成式AI如何增强创造力和生产力(关注公众号【产品老A】回复【内容供应链变革】下载)
文档由IBM商业价值研究院与合作伙伴共同研究,分析了生成式AI对内容供应链的影响。研究表明,随着内容需求的爆炸式增长,组织需要快速创建丰富内容以提供个性化体验。90%的受访高管和内容专业人员表示需要更便捷访问内容资产的方式,而生成式AI被看作提升内容生产水平的关键技术。