每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
Grok-2是目前最前沿的语言模型,具备顶尖的推理能力。这次发布包含了Grok家族的两名成员:Grok-2和Grok-2 mini。现在,这两款模型已经在𝕏平台上开放给Grok用户。
此次推出的Grok-2是对之前Grok-1.5的重大升级,展现了在聊天、编程和推理方面的前沿能力。同时,Grok-2 mini作为Grok-2的小型但功能强大的兄弟也一同亮相。Grok-2的早期版本已经以“sus-column-r”的名义在LMSYS排行榜上进行了测试,目前表现优于Claude 3.5 Sonnet和GPT-4-Turbo。
Grok-2和Grok-2 mini目前处于𝕏平台上的Beta测试阶段,并将在本月晚些时候通过企业API向更多用户开放。
Grok-2的语言模型和聊天能力
Grok-2的早期版本以“sus-column-r”的名字进入了LMSYS聊天机器人竞技场,这是一个受欢迎的语言模型基准测试平台。Grok-2在LMSYS排行榜上的Elo评分超越了Claude和GPT-4。
在内部测试中,AI导师与模型进行互动,评估模型在指令执行和信息准确性方面的表现。Grok-2在处理检索内容的推理能力和工具使用方面,表现出显著的进步,能够更好地识别缺失信息、推理事件顺序并排除无关内容。
基准测试
Grok-2在多个学术基准测试中表现出色,包括推理、阅读理解、数学、科学和编程等领域。与之前的Grok-1.5相比,Grok-2和Grok-2 mini在这些测试中取得了显著提升,表现出与其他前沿模型相当的竞争力。在视觉数学推理(MathVista)和基于文档的问答(DocVQA)任务中,Grok-2的表现尤为突出,达到了业界最先进的水平。
在𝕏上体验实时信息的Grok
过去几个月中,Grok在𝕏平台上持续优化。如今,推出了新一代的Grok体验,带来了重新设计的界面和新功能。
𝕏 Premium和Premium+用户将能够使用两款新模型:Grok-2和Grok-2 mini。Grok-2是最先进的AI助手,具有强大的文本和视觉理解能力,能够集成𝕏平台的实时信息。Grok-2 mini则在速度和回答质量之间取得了平衡。与前代相比,Grok-2在各类任务中更加直观、易于操作,无论是寻求答案、协作写作,还是解决编程任务,都表现出色。与Black Forest Labs合作,Grok正在与他们的FLUX.1模型进行实验,扩展其在𝕏平台上的功能。如果是Premium或Premium+订阅者,请确保更新到𝕏应用的最新版本,以便参与Grok-2的Beta测试。
使用企业API构建Grok
本月晚些时候,Grok-2和Grok-2 mini还将通过新的企业API平台开放给开发者使用。新的API平台基于全新的技术架构,支持全球范围的低延迟多区域推理部署,提供了增强的安全功能,如强制多因素认证(如Yubikey、Apple TouchID或TOTP),丰富的流量统计数据,以及高级计费分析(包括详细的数据导出)。此外,还提供了管理API,允许团队、用户和计费管理集成到现有的内部工具和服务中。如果想要获得最新消息,可以订阅我们的新闻简报。
未来展望
Grok-2和Grok-2 mini正在𝕏平台上逐步推出,其应用范围包括增强的搜索功能、更深入的𝕏帖子见解和改进的回复功能,所有这些都由Grok驱动。即将发布的多模态理解功能预览也将成为Grok体验的一部分。
自2023年11月推出Grok-1以来,xAI团队以极高的速度推动着发展。通过引入Grok-2,xAI在AI开发领域占据了领先地位。未来几个月中,更多的进展将陆续公布。