每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
在AI时代的组织准备:从技术到变革
谷歌AI Studio产品负责人Logan Kilpatrick自信满满地在X平台上发文称:“Gemini 1.5 Flash是目前全球开发者的最佳选择。”
“前所未有”的Gemini模型最新实验版
今年5月,谷歌推出了Gemini 1.5 Flash,这是一款轻量版的Gemini 1.5。Gemini 1.5系列模型专为处理超长文本设计,能够分析超过1000万标记的复杂信息。这使得这些模型能够处理包括文档、视频和音频在内的大量多模态输入。
今天,谷歌推出了一款改进版的Gemini 1.5 Flash模型,其参数达80亿。此外,全新的Gemini 1.5 Pro在编码和处理复杂指令方面表现出显著提升,成为8月初发布的前一版本的“即插即用”替代品。
Kilpatrick没有透露更多细节,只是表示谷歌将在未来几周内发布一个可用于生产环境的版本,并“希望附带评估功能”。
他在X平台的帖子中解释称,这些实验模型是为了收集反馈,让开发者尽早接触到最新更新。“通过实验性发布获得的经验教训将指导我们如何更广泛地发布模型,”他写道。
这次发布的Gemini 1.5 Flash和Pro的“最新实验版”均支持100万个标记限制,并可以通过Google AI Studio和Gemini API免费测试。根据Kilpatrick的说法,这些模型很快也会通过Vertex AI实验端点提供免费使用,并且公司将在未来几周内推出一个用于生产环境的版本。
自9月3日起,谷歌将自动将请求重新路由到新模型,并从Google AI Studio和API中移除旧版模型,以“避免因同时保留多个版本而造成混淆”。
“我们迫不及待地想听听大家的反馈,看看这个模型如何能解锁更多新的多模态应用场景,”Kilpatrick在X上发文称。
“巨大进步”,但依旧存在“懒惰编码病”
发布仅几小时后,大型模型系统组织(LMSO)就在其聊天机器人竞技场中发布了基于2万社区投票的排行榜更新。Gemini 1.5 Flash取得了“巨大飞跃”,从第23位跃升至第6位,达到了Llama的水平,并超越了谷歌的Gemma开放模型。
Gemini 1.5 Pro在编码和数学方面也表现出“强劲提升”,并且“显著改进”。
LMSO对这些模型表示赞赏:“恭喜谷歌DeepMind Gemini团队取得了令人难以置信的发布成果!”
然而,正如通常在迭代模型发布中所见,早期反馈呈现出多样化——从过度吹捧到讽刺和困惑。
一些X用户质疑为何如此频繁地更新而不是直接推出2.0版本。有人发帖表示:“伙计,这已经不够用了 :| 我们需要真正的升级,Gemini 2.0。”
另一方面,许多自称粉丝的用户对这些快速升级表示赞赏,报告称图像分析的“改进非常明显”。“速度简直太快了,”一位用户写道,另一位则指出,谷歌持续推出新产品,而OpenAI几乎保持沉默。还有人甚至表示,“谷歌团队正在默默地、勤奋地、不断地交付成果。”
但也有批评者称其“糟糕”和“懒惰”,特别是在处理需要较长输出的任务时,认为谷歌在这方面“远远落后”于Claude、OpenAI和Anthropic。
一位X用户遗憾地表示,这次更新“可悲地患上了懒惰编码病”,类似于GPT-4 Turbo的表现。
另一位用户则称更新版本“并没有那么好”,并表示模型“经常会崩溃,开始重复内容,就像小模型常见的问题那样。” 还有人表示,尽管对测试感到兴奋,但Gemini在编码方面“是最糟糕的。”
还有人调侃谷歌的命名能力,回忆起其今年早些时候的巨大觉醒失误。
“你们已经完全失去了命名事物的能力,”一位用户开玩笑道,另一位则附和说:“你们真的需要找人帮忙起名字。”
还有人冷嘲热讽地问道:“Gemini 1.5还是讨厌白人吗?”