在数字化浪潮的推动下,人工智能(AI)正成为塑造未来的关键力量。硅纪元视角栏目紧跟AI科技的最新发展,捕捉行业动态;提供深入的新闻解读,助您洞悉技术背后的逻辑;汇聚行业专家的见解,分享独到的视角和思考;精选对您有价值的信息,帮助您在AI时代中把握机遇。
1分钟速览新闻
-
震惊!无一大模型及格,北大/通研院超难基准LooGLE问世
-
刚刚上线!腾讯元宝颠覆深度阅读:50万字不是梦
-
AI威胁来袭:16万游戏演员大罢工,游戏行业面临冲击!
-
端侧AI新突破:MiniCPM-V 2.6模型性能超越GPT-4V,6G内存运行无忧
-
单卡4090显卡即可解锁视频生成,智谱AI CogVideoX模型开源!
-
苹果AI“反幻觉”指令曝光,智能回复严守真实底线!
-
马斯克豪言:特斯拉FSD本月将超越人类驾驶安全
-
OpenAI 在 API 中引入结构化输出,采用新的 gpt-4o 模型,降价50%
全球AI新闻
一、震惊!无一大模型及格,北大/通研院超难基准LooGLE问世
北大联合北京通用人工智能研究院提出了超难基准LooGLE,专门评估大语言模型的长上下文理解能力。结果令人震惊,所有测试模型均未及格。LooGLE包含近800个超长文档,生成了6千个任务/问题,涵盖多个领域。通过5种长期依赖任务,人工标注1100对问答,严格交叉验证,精确评估LLMs长依赖能力。实验发现,商业模型优于开源模型,但所有模型在复杂长依赖任务中表现不佳。LooGLE为未来开发增强型模型提供了重要启示。
二、刚刚上线!腾讯元宝颠覆深度阅读:50万字不是梦
腾讯元宝最新版本带来革命性深度阅读模式,支持长达50万字的专业文档输入,实现论文、财报的深度解析与图表生成。用户可通过此模式快速获取核心内容概览,配合模块化解析和总结性图表,提升理解效率。外文文献分析、专业术语翻译、杜邦分析图生成等功能,为专业用户提供了前所未有的阅读体验。即使在离线状态下,用户也能随时回顾精读内容及原文。
三、AI威胁来袭:16万游戏演员大罢工,游戏行业面临冲击!
美国演员工会(SAG-AFTRA)超16万成员针对游戏行业发起大规模罢工,抗议AI技术对演员职业的潜在威胁。核心争议在于AI数字复制品和生成式AI应用的保护问题,工会要求严格保护,游戏公司则对保护范围存在分歧。此次罢工虽非全面停工,但对游戏行业造成巨大冲击,谈判破裂,结果将影响整个行业。
四、端侧AI新突破:MiniCPM-V 2.6模型性能超越GPT-4V,6G内存运行无忧
面壁智能开源的MiniCPM-V 2.6模型,仅8B参数量,却在20B以下模型中取得单图、多图、视频理解三项SOTA成绩。该模型在端侧实现多模态能力全面超越GPT-4V,具备实时视频理解、多图联合理解等先进功能,同时保持端侧友好,量化后仅需6G内存,推理速度达到18 tokens/s,比上代快33%,并支持多种语言。MiniCPM-V 2.6的发布,标志着端侧AI性能的一次重大飞跃。
五、单卡4090显卡即可解锁视频生成,智谱AI CogVideoX模型开源!
智谱AI宣布开源与“清影”同源的视频生成模型CogVideoX,首发开源版本为CogVideoX-2B,支持单张4090显卡进行视频推理。该模型在FP-16精度下推理需18GB显存,而微调则需40GB显存,且A6000显卡可完成微调。CogVideoX-2B支持226个token提示词,生成6秒长、8帧/秒、720*480分辨率的视频。官方表示,性能更强的模型即将推出。
六、苹果AI“反幻觉”指令曝光,智能回复严守真实底线!
苹果公司在最新macOS 15.1测试版中为Apple Intelligence智能回复功能引入了“反幻觉”指令,旨在避免生成虚假或误导性信息。该功能通过分析邮件内容生成回复选项,现要求系统仅提取邮件中明确问题并提供相应答案,以减少AI生成错误。尽管苹果采取了措施,但完全消除AI幻觉问题仍面临挑战,因为生成式AI模型本身并不理解文本内容,难以准确判断信息真伪。
七、马斯克豪言特斯拉FSD本月将超越人类驾驶安全
特斯拉CEO埃隆·马斯克近日透露,公司全自动驾驶技术(FSD)将迎来突破性进展,预计本月内将实现“比人类更安全”的自动驾驶能力。这一声明引发了业界和消费者的极大关注,部分用户甚至认为,无人驾驶时代已近在咫尺。马斯克的承诺和用户反馈表明,FSD技术的发展将为特斯拉带来深远影响,有望成为推动公司未来发展的关键因素。
八、OpenAI 在 API 中引入结构化输出,采用新的 gpt-4o 模型,降价50%
OpenAI的重大更新:gpt-4o模型引入了'Structured Outputs'功能,实现100%的输出与JSON Schema匹配,大幅提升数据格式的精确性。此次更新还带来了成本的大幅降低,输入token成本降低50%至每百万$2.50,输出token成本降低33%至每百万$10.00。这一进步预计将极大地促进需要精确数据格式的应用,如实时数据格式验证、自动化数据录入和动态用户界面构建。