AI大模型日报#0430：疑似GPT4.5模型刷屏、上交实现「蛋白质功能定向进化」、微软紧急撤回WizardLM-2

导读：欢迎阅读《AI大模型日报》，内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了今日要点以及每条资讯的摘要。

《AI大模型日报》今日要点：在AI大模型领域，多项研究进展和行业应用动态引发关注。一夜之间，疑似一个GPT4.5的神秘模型刷屏。科学家Ellie Pavlick正致力于研究大语言模型中的理解证据，试图找到代表概念的神经网络部分，以推动语言模型领域向更直接的方法发展。同时，AI工具如Kimi被发现能直出思维导图，尽管存在局限，但仍展示了AI在工作方式上的改变潜力。在蛋白质功能定向进化方面，上海交通大学实现了全球首次湿实验证实，为生物医药领域提供全新解决方案。此外，复旦大学与小红书联合推出的大模型专属群聊工具以及智慧眼推出的国产自研通用大模型“砭石”等，均展示了AI技术在社交、行业应用等方面的广泛前景。然而，微软紧急撤回大型语言模型WizardLM-2的事件也引发了业界对AI模型性能和毒性测试的关注。

标题: AI知道苹果是什么吗？DeepMind语言模型科学家正把这些概念变得可量化、可测试

摘要: 科技记者报道，计算机科学家Ellie Pavlick正在研究大语言模型（LLM）中的理解证据。她专注于描述模型内部的“意义”结构，并试图找到代表概念的神经网络部分。Pavlick认为，语言模型为探索基础对意义的重要性提供了平台，但这是一个复杂的问题，需要精确描述和评估。她强调，我们需要找到科学上合理的方法来处理内部表征，以便正确回答关于智力和模型智能的深刻问题。虽然目前取得重大突破还为时过早，但Pavlick相信，用来描述简单问题的工具对于回答有关智力的深层问题至关重要。她的研究旨在推动语言模型领域向更直接的方法发展，以便更好地理解智力和模型智能的组成部分。
网址: AI知道苹果是什么吗？DeepMind语言模型科学家正把这些概念变得可量化、可测试 | 机器之心

标题: AI在用| 原来，Kimi 还能直出思维导图

摘要: 科技浪潮下，人工智能如大模型和AIGC正逐渐改变生活和工作方式，但使用门槛仍高。为此，有专栏通过实例介绍AI使用，并鼓励读者分享创新用例。最近发现国内工具Kimi能直出思维导图，操作简便，但仍有局限，如细节展示不足、复杂任务处理能力有限。同时，与其他AI工具相比，Kimi在某些方面还有待提升，如解析能力、稳定性等。新专栏将继续带来AIGC案例，并欢迎改进建议。
网址: AI在用| 原来，Kimi 还能直出思维导图 | 机器之心

标题: 全球首次，湿实验证实！上交成功实现「蛋白质功能定向进化」，零数据跨入AGI时代

摘要: 上海交通大学洪亮课题组在JCIM期刊发布研究成果，介绍了一种名为ProtLGN的微环境感知图神经网络。该网络可从蛋白质三维结构中学习有益突变，并指导蛋白质设计，提升特定功能。经湿实验验证，ProtLGN在少量或无实验数据下实现蛋白质定向进化，包括提高抗体亲和力、荧光蛋白强度等。此方法解决了传统蛋白质设计方法的效率低下、成本高昂等问题，为生物医药领域提供全新有效的解决方案。
网址: 全球首次，湿实验证实！上交成功实现「蛋白质功能定向进化」，零数据跨入AGI时代|训练|进化|上海交通大学_新浪新闻

标题: 小红书让智能体们吵起来了！联合复旦推出大模型专属群聊工具

摘要: 科技新闻摘要：复旦大学与小红书联合推出名为AgentGroupChat的模拟平台，该平台允许人工智能模型在群聊环境中模拟社会行为，以深入研究语言在人类行为中的影响。AgentGroupChat的设计包括角色区分、资源管理和游戏进程，旨在模拟现实生活中的社交结构。此外，研究团队还引入了一种名为Verbal Strategist Agent的智能体框架，以增强模拟中的互动策略和决策制定。实验结果表明，新兴行为是多种因素共同作用的结果，包括环境、角色特征和语言理解能力。该平台有助于更好地理解语言如何塑造社会行为以及社会结构的演变。相关论文和代码已公开发布。
网址: https://www.qbitai.com/2024/04/138807.html

标题: 神秘大模型一夜刷屏，能力太强被疑GPT4.5，奥特曼避而不答打哑谜

摘要: 科技新闻快讯：一个名为"gpt2-chatbot"的神秘大型语言模型在网络上引起轰动，其能力之强被疑为传说中的GPT-4.5。该模型在国际数学奥林匹克竞赛题目、3D图形生成、逻辑推理等方面表现出色，甚至超越了GPT-4等一众开源模型。网友和科技界人士纷纷猜测其真实身份，有人怀疑这是OpenAI秘密发布的新模型，也有人认为这可能是基于古老GPT-2架构的新训练成果。目前，该模型仅在LMSYS大模型竞技场可供试玩，且试玩机会有限。同时，该模型的中文处理能力也非常出色，引发了广泛关注。然而，其真实身份仍然是个谜。
网址: https://www.qbitai.com/2024/04/138674.html

标题: 具身智能最佳形态是什么？它是通往AGI必由之路？八位头部玩家、学者现身说法

摘要: 科技记者提炼：在北京智源人工智能研究院院长王仲远主持的中关村论坛年会上，七位具身智能领域的专家和企业家探讨了具身智能的发展现状和未来趋势。他们普遍认为，虽然具身智能是实现人工智能通用智能（AGI）的重要方向，但目前仍存在许多技术和数据上的挑战。专家们讨论了具身智能是否一定需要人形机器人，以及硬件和软件发展的优先顺序等问题。他们认为，本体和大脑是相互制约的，需要同时发展。在数据采集方面，真实数据和仿真数据都有其优势和挑战，需要结合使用。对于具身智能的短期和长期发展，专家们认为短期内可能会有所突破，但长期来看，仍需要解决许多技术难题。他们预测，未来3-5年将是具身智能的逐步渗透期，而5-8年后可能会有快速的发展。此外，专家们还就自动驾驶和具身智能的关系以及大厂和创业公司在具身智能发展中的角色进行了讨论。他们认为，自动驾驶的发展经验可以为具身智能提供参考，而大厂和创业公司在具身智能领域都有机会取得成功，关键在于目标选择和坚持。总的来说，虽然具身智能领域仍面临许多挑战，但专家们对其未来发展充满信心。他们相信，通过持续的研究和创新，具身智能将成为实现AGI的重要途径。
网址: 具身智能最佳形态是什么？它是通往AGI必由之路？八位头部玩家、学者现身说法 | 机器之心

标题: 「非常接近GPT-4」的WizardLM-2被微软紧急撤回，有什么内幕？

摘要: 微软曾开源了名为WizardLM-2的大型语言模型，宣称其性能可媲美GPT-4，但在不久后完全撤回。该系列包括三个模型，其中WizardLM-2 8x22B被认为是最先进的。团队解释称，撤回是因为遗漏了毒性测试，但此举引发了AI社区的质疑和猜测。有人怀疑团队被解雇或微软因技术路线问题与OpenAI产生冲突，但这些都未得到证实。微软建立了一个完全由人工智能驱动的合成训练系统，用于提高模型性能。尽管有诸多猜测，但仍需等待WizardLM-2的重新发布以了解其真实情况。
网址: 「非常接近GPT-4」的WizardLM-2被微软紧急撤回，有什么内幕？ | 机器之心

标题: 在12个视频理解任务中，Mamba先打败了Transformer

摘要: 科技记者报道，机器之心AIxiv专栏持续推动学术交流，已报道2000多篇学术技术内容。近日，南京大学、上海人工智能实验室等团队发布了Video Mamba Suite，探索了状态空间模型Mamba在视频理解领域的潜力。Mamba以其长序列处理优势，为视频理解带来革命性变革，在14种模型/模块的评估中展现出强劲潜力，实现了效率与性能的理想平衡。这不仅是技术飞跃，更是对未来视频理解研究的有力推动。同时，Mamba还有望成为Transformer在视频理解领域的一个有前景的替代方案。研究团队希望Video Mamba Suite能成为未来探索基于SSM的视频理解模型的基础型资源。此外，研究还探索了Mamba在时序模型、时序模块、多模态交互网络和时空模型等不同角色中的潜力，为视频理解领域的未来发展提供了新的思路。
网址: 在12个视频理解任务中，Mamba先打败了Transformer | 机器之心

标题: 打通AI「任督二脉」，国产自研通用大模型「砭石」实力迈向AGI

摘要: 科技巨头智慧眼最近推出了创新研发的通用大模型——砭石，旨在通过打通AI技术的通用性，推动生产方式的深刻变革与生产力水平的显著提升。砭石基于海量多模态数据训练，具备强大的代码生成、推理及写作能力，并能理解和执行多种任务。其核心技术包括知识图谱、智能大模型和隐私计算，均拥有自主知识产权。砭石采用分层解耦设计，融合机器视觉、自然语言理解、多模态和认知四大基础模型，可广泛应用于医疗、金融、政务等多个行业，实现高度个性化的赋能。智慧眼将继续引领AI技术发展，推动大模型技术在各行各业的应用，为社会发展注入新的生产力。
网址: 打通AI「任督二脉」，国产自研通用大模型「砭石」实力迈向AGI|隐私|模型|砭石_新浪新闻