微软发布功能强大的全新 Phi-3.5 机型,击败谷歌、OpenAI 等公司

news2024/9/22 3:37:17

在这里插入图片描述
微软并没有因为与 OpenAI 的合作而满足于其在人工智能领域的成功。 相反,这家因总部位于华盛顿州而被称为雷德蒙德(Redmond)的公司今天发布了其不断发展的语言/多模态人工智能 Phi 系列中的 3 个新模型。这三个模型分别针对基本/快速推理、更强大的推理和视觉(图像和视频分析)任务而设计。

这三个模型都允许开发者在Hugging Face上下载、使用和微调,并采用微软的MIT许可,允许商业使用和无限制修改。 令人惊讶的是,这三个模型在一些第三方基准测试中的性能也接近最先进水平,甚至在某些情况下击败了其他人工智能提供商,包括谷歌的Gemini 1.5 Flash、Meta的Llama 3.1,甚至OpenAI的GPT-4o。

在这里插入图片描述

Phi-3.5 Mini Instruct: 为计算受限环境而优化

Phi-3.5 Mini Instruct 模型是一款拥有 38 亿个参数的轻量级人工智能模型,专为遵守指令而设计,支持 128k 标记上下文长度。 该模型非常适合在内存或计算受限环境中需要强大推理能力的场景,包括代码生成、数学问题求解和逻辑推理等任务。

尽管体积小巧,Phi-3.5 Mini Instruct 模型在多语言和多轮会话任务中表现出了极具竞争力的性能,与前代产品相比有了显著改进。 它在多项基准测试中的性能接近最先进水平,并在衡量 "长上下文代码理解 "的 RepoQA 基准测试中超越了其他类似尺寸的模型(Llama-3.1-8B-instruct 和 Mistral-7B-instruct)。

在这里插入图片描述

Phi-3.5 MoE: 微软的 “专家混合物”

Phi-3.5 MoE(专家混合物)模型似乎是该公司推出的第一个模型类别,它将多种不同的模型类型整合到一个模型中,每种模型都擅长不同的任务。 该模型利用具有 420 亿个活动参数的架构,支持 128k 标记上下文长度,为要求苛刻的应用提供可扩展的人工智能性能。 Phi-3.5 MoE 专为各种推理任务而设计,在代码、数学和多语言语言理解方面表现出色,在特定基准测试(包括 RepoQA)中的表现往往优于大型模型:

在这里插入图片描述
此外,在科技、人文和社会科学等学科的 5 次 MMLU(大规模多任务语言理解)测试中,它也在不同的专业水平上击败了 GPT-4o mini,令人印象深刻。

在这里插入图片描述
MoE 模型的独特架构使其能够在处理跨多种语言的复杂人工智能任务时保持高效。

Phi-3.5 Vision Instruct: 高级多模态推理

Phi-3.5 Vision Instruct 模型将文本和图像处理功能整合在一起,完成了三重奏。 这种多模态模型特别适用于一般图像理解、光学字符识别、图表和表格理解以及视频摘要等任务。

与 Phi-3.5 系列中的其他模型一样,Vision Instruct 支持 128k 标记上下文长度,使其能够管理复杂的多帧视觉任务。 微软强调,该模型的训练结合了合成数据集和经过过滤的公开数据集,侧重于高质量、推理密集的数据。

训练新的 Phi 三巨头

Phi-3.5 Mini Instruct 模型使用 512 个 H100-80G GPU,历时 10 天,在 3.4 万亿个代币上进行了训练;Vision Instruct 模型使用 256 个 A100-80G GPU,历时 6 天,在 5000 亿个代币上进行了训练。 Phi-3.5 MoE 模型采用专家混合架构,使用 512 个 H100-80G GPU,历时 23 天,在 4.9 万亿个代币上进行了训练。

MIT 许可下的开放源码

所有三种 Phi-3.5 型号均在 MIT 许可下提供,体现了微软支持开放源码社区的承诺。 该许可允许开发人员自由使用、修改、合并、发布、分发、转授权或出售软件副本。 该许可还包括一项免责声明,即软件按 "原样 "提供,不提供任何形式的保证。 微软和其他版权持有者对因使用该软件而可能产生的任何索赔、损害或其他责任不承担任何责任。 微软发布 Phi-3.5 系列代表着多语言和多模态人工智能的发展向前迈出了重要一步。 通过在开源许可下提供这些模型,微软使开发人员能够将尖端的人工智能功能集成到他们的应用程序中,从而促进商业和研究领域的创新。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2058758.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

pygame开发课程系列(4): 游戏元素

第四章 游戏元素 在本章中,我们将深入探讨如何在 Pygame 中处理游戏元素,包括键盘输入、鼠标输入、图像加载和声音播放。这些元素是构建互动游戏的基础,能够让你的游戏变得更生动、更有趣。 4.1 处理键盘输入 键盘输入是控制游戏角色或元素…

微服务及安全

一、微服务的原理 1.什么是微服务架构 微服务架构区别于传统的单体软件架构,是一种为了适应当前互联网后台服务的「三高需求:高并发、高性能、高可用」而产生的的软件架构。 单体式应用程序 与微服务相对的另一个概念是传统的单体式应用程序( Monolithic application ),…

【Git】分支的创建、提交、合并、冲突、删除

Git分支 分支的创建更改的提交合并分支到主支解决冲突删除分支 可以将项目不断修改调整的过程放到分支上,修改定性之后再将分支内容向主支合并 分支的创建 //创建一个新的分支( new-fenzhi:自定义分支名 ) git branch new-fenzhi…

【源码】基于Java开发的HRM人力资源管理系统(企业人力管理实际项目)

在当今企业迅速扩张与业务日益复杂的环境下,传统的人力资源管理方式已显得力不从心。为了应对这一挑战,eHR人力资源管理系统应运而生,它以其强大的功能和卓越的性能,为企业的人力资源管理带来了革命性的变革。 一、系统概览与技术…

AI文本转语音:Toucan TTS 支持 7000 多种语言的语音合成工具箱,突破性 OCR 技术:支持多种语言识别,媲美顶级云服务

AI文本转语音:Toucan TTS 支持 7000 多种语言的语音合成工具箱,突破性 OCR 技术:支持多种语言识别,媲美顶级云服务。 AI文本转语音:Toucan TTS 支持 7000 多种语言的语音合成工具箱 Toucan TTS是由德国斯图加特大学自…

【教程】Win11用户必看:旧版记事本恢复方法!

在Win11电脑操作中,很多用户并不喜欢新版的记事本,想知道有什么方法能够恢复旧版记事本?首先需要打开Win11系统设置选项,点击关闭记事本选项,然后从Windows文件夹或使用notepad命令来打开旧记事本。以下系统之家小编给…

探索Facebook的区块链计划:未来社交网络的变革

随着区块链技术的迅速发展,社交网络领域正面临一场深刻的变革。Facebook,作为全球最大且最具影响力的社交平台之一,正在积极探索区块链技术的应用。本文将深入探讨Facebook的区块链计划,分析其潜在的变革性影响,并展望…

2024年新SCI顶刊算法信息获取优化算法IAO优化Transformer-GRU模型的多变量时间序列预测

matlab R2024a以上 一、数据集 ​ ​ 二、2024年新SCI顶刊算法信息获取优化算法IAO 本期介绍了一种名为信息获取优化算法Information acquisition optimizer,IAO的元启发式算法。该算法受人类信息获取行为的启发,由信息收集、信息过滤和评估以及信息分…

A286螺栓产品特性及主要应用领域

A286螺栓是一种采用A286合金制成的高性能紧固件,具有优异的高温强度、耐腐蚀性能以及良好的加工性能。下面是关于A286螺栓的产品特性和主要应用领域的详细介绍。 产品特性 高温强度:A286合金在高温下仍能保持较高的机械强度,适用于高温环境下…

iOS Forensics with Belkasoft

本课程专为需要在工作中处理 iOS 设备并希望增强知识并获得 iOS 获取和分析实践经验的数字取证调查员而设计。 您将学到什么? 如何使用 iOS 获取的基本和高级方法,例如基于 checkm8 和基于代理的获取 如何从云端获取 iOS 数据 如何分析 iOS 应用程序&…

《黑神话:悟空》引爆全球,AI揭秘中国古建之美

在数字化浪潮的推动下,人工智能(AI)正成为塑造未来的关键力量。硅纪元视角栏目紧跟AI科技的最新发展,捕捉行业动态;提供深入的新闻解读,助您洞悉技术背后的逻辑;汇聚行业专家的见解,…

C++第三十九弹---C++ STL中的无序容器:unordered_set与unordered_map使用详解

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】【C详解】 目录 1 unordered_set 1.1 unordered_set的接口说明 1.1.1 unordered_set的构造 1.1.2. unordered_set的容量 1.1.3. unordered_set的迭代器 1.1…

电子电路学习之电感

电感作用:电感具有“通直流,阻交流”的作用,即对交流电具有阻碍作用,频率越高,阻抗越大。 电感类型:贴片和直插 电感参数: (1) 精度:电感精度一般为30% (2)直流电阻(DC…

JS获取当前设备名称

在JavaScript中,没有直接获取“当前设备名称”的标准方法,因为这通常涉及访问底层系统信息,而JavaScript在浏览器中运行时通常无权访问这些信息。不过,可以通过用户代理字符串(User-Agent string)来间接推断…

Facebook的区块链战略:如何在社交媒体中实现去中心化

随着区块链技术的发展,Facebook(现Meta)正积极探索如何将这一技术整合进其社交平台中,以提升用户体验和数据安全。区块链技术以去中心化、透明性和不可篡改性为特点,为社交媒体带来了新的可能性。本文将探讨Facebook在…

若依平台/vue2引入代码编辑器(monaco-editor)

需求背景:需要在线编辑javascript代码,方便维护,有些更新不需要再重新部署 一、安装依赖 "monaco-editor": "^0.30.1", "monaco-editor-webpack-plugin": "^6.0.0", 二、 vue.config.js中添加如下配…

How to check the validity of the OpenAI key from python?

题意:如何在 Python 中检查 OpenAI 密钥的有效性? 问题背景: https://pypi.org/project/openai/ "The library needs to be configured with your accounts secret key which is available on the website. [...] Set it as the OPENAI…

RxJava-操作符-mergeDelayError使用

说明 合并多个源Observable的事件,事件不是按照顺序被发射(如需顺序使用concat操作符)。Error事件被延迟发射,针对的是源Observable中的Error事件,多个源Observable都有Error时,会合并Error事件。执行结束 …

vba自动发送邮件的基础步骤?有哪些流程?

vba自动发送邮件如何设置?vba自动发送邮件的技巧? 如果你想节省时间,提高工作效率,学会如何使用VBA自动发送邮件是一个非常有用的技能。AokSend将为你介绍VBA自动发送邮件的基础步骤,并通过简单的分段来详细讲解。 v…

《黑神话:悟空》的发布是否能打开元宇宙游戏世界的门

四年漫长等待,8月20日,国产3A游戏巨制《黑神话:悟空》正式上线并彻底引爆全球市场。这背后不仅是中国游戏史的里程碑,也将为元宇宙的未来夯实地基! 游戏上线后,热度持续飙升,成为了社交媒体和游…