AI Repos
1、MCP-Chinese-Getting-Started-Guide
模型上下文协议(MCP)是一个创新的开源协议,旨在标准化大语言模型(LLM)与外部数据源及工具的连接方式,类似AI应用的“USB-C接口”。其核心功能包括资源、提示词、工具、采样、根目录和传输层,其中“工具”是本文重点。MCP支持stdio和SSE两种传输协议,以stdio为主进行讲解。文章使用Python 3.11和uv工具管理项目,代码将在Github上开源。本项目详细介绍了MCP的实现,强调其通用性及与大语言模型的适配潜力,其他功能则简要说明。
2、arxiv-mcp-server
ArXiv MCP服务器通过消息控制协议(MCP)连接AI助手与arXiv研究库,使AI模型能够以编程方式搜索和访问论文内容。其核心功能包括:论文搜索(支持日期范围和类别过滤)、论文访问(下载并阅读内容)、论文列表(查看已下载论文)、本地存储(本地保存论文以加快访问速度)以及研究提示词集合。该服务器为AI助手提供了一个简单接口,增强其研究能力,用户可参与贡献或报告问题,项目详情见Github。
3、bilibili-mcp-js
Bilibili MCP是一个基于模型上下文协议(MCP)的B站视频搜索服务器,提供简单API接口,支持用户搜索B站视频内容。其功能包括B站视频搜索、分页查询以及返回视频信息(如标题、作者、播放量、时长等),采用MCP协议实现标准化接口。项目提供LangChain调用示例和测试脚本,英文、中文、日文文档齐全。该服务器为用户提供便捷的B站内容检索方案。
4、AutoAgent
AutoAgent是一个全自动且高度自进化的框架,用户仅通过自然语言即可创建和部署大语言模型(LLM)代理。其核心功能包括:在GAIA基准测试中名列前茅,性能媲美OpenAI的Deep Research;内置自管理向量数据库的Agentic-RAG,超越LangChain等领先方案;支持自然语言轻松构建工具、代理和工作流,无需编码;兼容多种LLM(如OpenAI、Grok等);支持函数调用和ReAct交互模式;框架动态、可扩展且轻量化,适合定制化个人AI助手。
5、whatsapp-mcp
WhatsApp MCP服务器基于模型上下文协议(MCP),通过WhatsApp网页多设备API(whatsmeow库)直接连接个人WhatsApp账户。用户可搜索个人消息、联系人,并向个人或群组发送消息。所有消息本地存储于SQLite数据库,仅在代理通过工具访问时(由用户控制)发送至LLM(如Claude)。该服务器实现消息的本地管理和与LLM的集成,提供示例展示其与Claude的协作能力。用户可订阅邮件获取项目更新。
6、awesome-prompts
此仓库汇集了适用于浏览器代理的有效提示词,旨在提供示例、模板和最佳实践,帮助用户打造能充分发挥浏览器代理能力的提示词。任何相关且具商业价值的提示词投稿均可接受。
7、awesome-mcp-list
汇集了各类高质量 MCP 服务器,包含浏览器控制、云平台、通讯聊天、数据库、开发工具、文件操作等等。每个项目都附有简明描述,并按功能类别进行了清晰分类,让我们能够快速找到所需的工具。
AI News
1、Google发布TxGemma开源模型,加速治疗性药物研发
谷歌推出开源模型TxGemma,旨在提升治疗性药物研发效率,由DeepMind基于Gemma模型微调开发,融合语言理解、科学预测和多轮对话功能。该模型支持药物研发全流程,包括毒性预测、靶点识别和疗效评估,提供2B、9B、27B三种规模,适配不同需求。27B版本性能卓越,超越谷歌先前Tx-LLM模型,兼具通用性与专业性。TxGemma通过Vertex AI和Hugging Face开放,鼓励全球协作创新,有望缩短研发周期、降低成本,助力生物医药领域突破。
2、智谱发布AutoGLM沉思:首款“边想边干”智能体
智谱AI在2025中关村论坛上发布AutoGLM沉思,这是业内首款融合深度研究与操作能力的Agent产品,特点是“边想边干”。它能模拟人类行为,浏览网页并完成数据检索、分析及报告生成等全流程任务。技术依托智谱GLM自研模型,包括推理模型GLM-Z1-Air(性能媲美DeepSeek-R1,速度提升8倍,价格仅1/30)和基座模型GLM-4-Air0414。模型将于4月14日开源并上线bigmodel.cn,标志着智能体技术向实用化迈进。
3、英伟达推出FFN融合技术:加速大型语言模型推理效率
英伟达研究人员发布“FFN融合”技术,通过优化Transformer架构中串行计算瓶颈,提升大型语言模型(LLM)的推理效率。该技术将依赖性较低的连续FFN层合并为单一宽层,实现并行计算,保持模型表示能力。应用于Llama-3.1-405B的Ultra-253B-Base模型,推理延迟降低1.71倍,每token成本降35倍,内存使用减半。性能上,该模型在MMLU、HumanEval等基准测试中媲美甚至超越原405B模型,参数仅253B,验证了技术的通用性和效率优化潜力。
4、Ai2 PaperFinder:AI驱动的论文搜索与整合工具
Ai2 PaperFinder是一款为科研人员设计的AI工具,整合超过800万篇全文论文和1.08亿篇摘要,提供高效文献检索与合成服务。用户通过关键词即可快速搜索热门或小众主题的相关论文,系统还能综合多篇文献回答问题,节省查阅时间。平台持续开发新功能,旨在提升用户体验并支持学术交流,助力研究者把握动态、加速科研进程。现已开放体验,成为科研的重要助手。
5、苹果“Project Mulberry”:AI健康助手助力个性化健康管理
苹果正研发“Project Mulberry”AI健康应用,计划随iOS19.4推出,具体时间未定。该应用整合苹果设备及第三方数据,通过AI助手提供个性化健康建议,与医疗专家合作提升模型智能。如检测心率异常时,AI或推送心脏健康视频,并计划利用设备摄像头分析用户活动。尽管苹果AI项目曾因BUG受质疑,此次健康助手展现其决心。未来Apple Watch或集成摄像头,支持AI功能,标准版内置屏幕内摄像头,Ultra版则设表盘旁镜头。
6、ChatGPT图像生成功能免费开放,引发热议与限制
OpenAI将ChatGPT的图像生成功能从付费用户扩展至免费用户,新增“创建图片”选项,尤以“吉卜力风格”受欢迎。此前仅限Plus、Pro、Team用户使用,现所有用户可将概念转化为图像。然而,该功能引发吉卜力粉丝抄袭争议。CEO山姆·奥尔特曼称,因高使用率导致GPU过热,计划引入速率限制,免费用户将获每天三次生成机会,以平衡效率与服务稳定性。
7、百度文小言升级:多模型融合与新语音大模型亮相
百度文小言在AI DAY上宣布品牌焕新与功能升级,引入多模型融合调度技术,整合文心X1、4.5及DeepSeek-R1等模型,用户可通过“自动模式”智能选择最佳组合,提升响应速度与任务处理能力。新语音大模型支持多方言对话与复杂问答,采用跨注意力技术,成本降低50%-90%,响应时间缩至1秒。新增图片问答功能支持拍照提问,提供解题、购物比价及趣味“冷知识”解读,交互体验更智能便捷。
8、安巴雷拉ISC West展推边缘AI新突破,展示生成AI实力
安巴雷拉在2025年ISC West展会上发布新一代CVflow®3.0 AI SoC系列,支持0.5亿至340亿参数的生成AI模型,展示边缘AI技术突破。公司累计出货超3000万台,展出基于DeepSeek模型的实时AI安全方案,强调高效边缘推理与集成能力。CEO Fermi Wang称其产品融合图像处理与AI性能,优于传统加速器。新增AI模型花园与Cooper™平台,方便开发者,并展示多流视频分析及设备内AI应用,覆盖智能安防等场景,提升实时洞察与隐私保护。
9、Wayve发布GAIA-2:多视角视频生成世界模型助力自动驾驶安全
Wayve推出GAIA-2视频生成世界模型,升级自GAIA-1,支持生成多样化驾驶场景视频,提升自动驾驶系统安全性。该模型覆盖英、美、德等多国场景,可控制时间、天气、道路类型,并同时生成五个视角视频,增强环境感知能力。GAIA-2能模拟高风险场景如紧急制动与碰撞,弥补真实数据稀缺,强化系统鲁棒性。采用潜在扩散模型与视频标记器,优化生成效率与时空一致性,加速模型测试与优化,助力安全自动驾驶落地。