【AI News | 20250331】每日AI进展

news2025/4/25 9:18:22

AI Repos

1、MCP-Chinese-Getting-Started-Guide
模型上下文协议（MCP）是一个创新的开源协议，旨在标准化大语言模型（LLM）与外部数据源及工具的连接方式，类似AI应用的“USB-C接口”。其核心功能包括资源、提示词、工具、采样、根目录和传输层，其中“工具”是本文重点。MCP支持stdio和SSE两种传输协议，以stdio为主进行讲解。文章使用Python 3.11和uv工具管理项目，代码将在Github上开源。本项目详细介绍了MCP的实现，强调其通用性及与大语言模型的适配潜力，其他功能则简要说明。
在这里插入图片描述

2、arxiv-mcp-server
ArXiv MCP服务器通过消息控制协议（MCP）连接AI助手与arXiv研究库，使AI模型能够以编程方式搜索和访问论文内容。其核心功能包括：论文搜索（支持日期范围和类别过滤）、论文访问（下载并阅读内容）、论文列表（查看已下载论文）、本地存储（本地保存论文以加快访问速度）以及研究提示词集合。该服务器为AI助手提供了一个简单接口，增强其研究能力，用户可参与贡献或报告问题，项目详情见Github。
在这里插入图片描述

3、bilibili-mcp-js
Bilibili MCP是一个基于模型上下文协议（MCP）的B站视频搜索服务器，提供简单API接口，支持用户搜索B站视频内容。其功能包括B站视频搜索、分页查询以及返回视频信息（如标题、作者、播放量、时长等），采用MCP协议实现标准化接口。项目提供LangChain调用示例和测试脚本，英文、中文、日文文档齐全。该服务器为用户提供便捷的B站内容检索方案。
在这里插入图片描述

4、AutoAgent
AutoAgent是一个全自动且高度自进化的框架，用户仅通过自然语言即可创建和部署大语言模型（LLM）代理。其核心功能包括：在GAIA基准测试中名列前茅，性能媲美OpenAI的Deep Research；内置自管理向量数据库的Agentic-RAG，超越LangChain等领先方案；支持自然语言轻松构建工具、代理和工作流，无需编码；兼容多种LLM（如OpenAI、Grok等）；支持函数调用和ReAct交互模式；框架动态、可扩展且轻量化，适合定制化个人AI助手。
在这里插入图片描述

5、whatsapp-mcp
WhatsApp MCP服务器基于模型上下文协议（MCP），通过WhatsApp网页多设备API（whatsmeow库）直接连接个人WhatsApp账户。用户可搜索个人消息、联系人，并向个人或群组发送消息。所有消息本地存储于SQLite数据库，仅在代理通过工具访问时（由用户控制）发送至LLM（如Claude）。该服务器实现消息的本地管理和与LLM的集成，提供示例展示其与Claude的协作能力。用户可订阅邮件获取项目更新。
在这里插入图片描述

6、awesome-prompts
此仓库汇集了适用于浏览器代理的有效提示词，旨在提供示例、模板和最佳实践，帮助用户打造能充分发挥浏览器代理能力的提示词。任何相关且具商业价值的提示词投稿均可接受。

7、awesome-mcp-list
汇集了各类高质量 MCP 服务器，包含浏览器控制、云平台、通讯聊天、数据库、开发工具、文件操作等等。每个项目都附有简明描述，并按功能类别进行了清晰分类，让我们能够快速找到所需的工具。

AI News

1、Google发布TxGemma开源模型，加速治疗性药物研发
谷歌推出开源模型TxGemma，旨在提升治疗性药物研发效率，由DeepMind基于Gemma模型微调开发，融合语言理解、科学预测和多轮对话功能。该模型支持药物研发全流程，包括毒性预测、靶点识别和疗效评估，提供2B、9B、27B三种规模，适配不同需求。27B版本性能卓越，超越谷歌先前Tx-LLM模型，兼具通用性与专业性。TxGemma通过Vertex AI和Hugging Face开放，鼓励全球协作创新，有望缩短研发周期、降低成本，助力生物医药领域突破。

2、智谱发布AutoGLM沉思：首款“边想边干”智能体
智谱AI在2025中关村论坛上发布AutoGLM沉思，这是业内首款融合深度研究与操作能力的Agent产品，特点是“边想边干”。它能模拟人类行为，浏览网页并完成数据检索、分析及报告生成等全流程任务。技术依托智谱GLM自研模型，包括推理模型GLM-Z1-Air（性能媲美DeepSeek-R1，速度提升8倍，价格仅1/30）和基座模型GLM-4-Air0414。模型将于4月14日开源并上线bigmodel.cn，标志着智能体技术向实用化迈进。

3、英伟达推出FFN融合技术：加速大型语言模型推理效率
英伟达研究人员发布“FFN融合”技术，通过优化Transformer架构中串行计算瓶颈，提升大型语言模型（LLM）的推理效率。该技术将依赖性较低的连续FFN层合并为单一宽层，实现并行计算，保持模型表示能力。应用于Llama-3.1-405B的Ultra-253B-Base模型，推理延迟降低1.71倍，每token成本降35倍，内存使用减半。性能上，该模型在MMLU、HumanEval等基准测试中媲美甚至超越原405B模型，参数仅253B，验证了技术的通用性和效率优化潜力。

4、Ai2 PaperFinder：AI驱动的论文搜索与整合工具
Ai2 PaperFinder是一款为科研人员设计的AI工具，整合超过800万篇全文论文和1.08亿篇摘要，提供高效文献检索与合成服务。用户通过关键词即可快速搜索热门或小众主题的相关论文，系统还能综合多篇文献回答问题，节省查阅时间。平台持续开发新功能，旨在提升用户体验并支持学术交流，助力研究者把握动态、加速科研进程。现已开放体验，成为科研的重要助手。

5、苹果“Project Mulberry”：AI健康助手助力个性化健康管理
苹果正研发“Project Mulberry”AI健康应用，计划随iOS19.4推出，具体时间未定。该应用整合苹果设备及第三方数据，通过AI助手提供个性化健康建议，与医疗专家合作提升模型智能。如检测心率异常时，AI或推送心脏健康视频，并计划利用设备摄像头分析用户活动。尽管苹果AI项目曾因BUG受质疑，此次健康助手展现其决心。未来Apple Watch或集成摄像头，支持AI功能，标准版内置屏幕内摄像头，Ultra版则设表盘旁镜头。

6、ChatGPT图像生成功能免费开放，引发热议与限制
OpenAI将ChatGPT的图像生成功能从付费用户扩展至免费用户，新增“创建图片”选项，尤以“吉卜力风格”受欢迎。此前仅限Plus、Pro、Team用户使用，现所有用户可将概念转化为图像。然而，该功能引发吉卜力粉丝抄袭争议。CEO山姆·奥尔特曼称，因高使用率导致GPU过热，计划引入速率限制，免费用户将获每天三次生成机会，以平衡效率与服务稳定性。

7、百度文小言升级：多模型融合与新语音大模型亮相
百度文小言在AI DAY上宣布品牌焕新与功能升级，引入多模型融合调度技术，整合文心X1、4.5及DeepSeek-R1等模型，用户可通过“自动模式”智能选择最佳组合，提升响应速度与任务处理能力。新语音大模型支持多方言对话与复杂问答，采用跨注意力技术，成本降低50%-90%，响应时间缩至1秒。新增图片问答功能支持拍照提问，提供解题、购物比价及趣味“冷知识”解读，交互体验更智能便捷。

8、安巴雷拉ISC West展推边缘AI新突破，展示生成AI实力
安巴雷拉在2025年ISC West展会上发布新一代CVflow®3.0 AI SoC系列，支持0.5亿至340亿参数的生成AI模型，展示边缘AI技术突破。公司累计出货超3000万台，展出基于DeepSeek模型的实时AI安全方案，强调高效边缘推理与集成能力。CEO Fermi Wang称其产品融合图像处理与AI性能，优于传统加速器。新增AI模型花园与Cooper™平台，方便开发者，并展示多流视频分析及设备内AI应用，覆盖智能安防等场景，提升实时洞察与隐私保护。

9、Wayve发布GAIA-2：多视角视频生成世界模型助力自动驾驶安全
Wayve推出GAIA-2视频生成世界模型，升级自GAIA-1，支持生成多样化驾驶场景视频，提升自动驾驶系统安全性。该模型覆盖英、美、德等多国场景，可控制时间、天气、道路类型，并同时生成五个视角视频，增强环境感知能力。GAIA-2能模拟高风险场景如紧急制动与碰撞，弥补真实数据稀缺，强化系统鲁棒性。采用潜在扩散模型与视频标记器，优化生成效率与时空一致性，加速模型测试与优化，助力安全自动驾驶落地。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2325850.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！