微软发布Phi-3,手机上就能跑,是时候聊聊小型语言模型了|TodayAI

news2025/3/15 14:49:47

微软发布Phi-3,手机上就能跑,是时候聊聊小型语言模型了|TodayAI

微软公司最近宣布推出了其最新开发的最新AI语言模型,名为Phi-3。这款小型语言模型(SLMs)在市场上以其卓越的性能和成本效率获得关注,尤其在语言处理、推理、编程及数学基准测试方面表现出色,超越了同等规模甚至更大规模的模型。

Phi-3模型系列的最新成员,包括拥有3.8亿参数的Phi-3-mini,从今天起将通过微软Azure AI Studio、Hugging Face和Ollama平台提供。Phi-3-mini具备两种上下文长度选项——4K和128K令牌,是同类中首个支持高达128K令牌上下文窗口的模型,且几乎不影响性能质量。此模型经过了指令优化,可以根据各种真实沟通场景中的指令进行操作,确保即购即用。

此外,Phi-3-mini已针对ONNX运行时进行优化,并支持Windows DirectML,提供包括GPU、CPU及移动硬件在内的跨平台支持。它还可作为NVIDIA NIM微服务提供,配备标准API接口,能够在任何设备上部署,并已针对NVIDIA GPU进行了特别优化。

微软计划在接下来的几周内进一步扩展Phi-3模型家族,推出Phi-3-small(7B)和Phi-3-medium(14B)等模型,这将为客户提供在性能和成本之间更灵活的选择。这些模型即将在Azure AI模型目录及其他平台上推出。

微软的追求

大型语言模型(LLMs)创造了使用AI提高生产力和创造力的新机会。但它们的体积意味着运行它们需要大量计算资源。虽然这些模型仍将是解决许多复杂任务的黄金标准,微软一直在开发一系列小型语言模型(SLMs),这些模型具有在LLMs中发现的许多相同功能,但体积更小,训练数据量也更少。该公司今天宣布推出Phi-3系列开放模型,这是目前市场上最有能力和最具成本效益的小型语言模型。Phi-3模型在评估语言、编码和数学能力的各种基准测试中表现优于同等大小和更大尺寸的模型,这得益于微软研究员开发的训练创新。

Phi-3系列的新模型的推出标志着微软公司在提供性能和成本效益上的最优解方面的持续承诺。

在最新的基准测试中,Phi-3系列显示出了突破性的性能,超越了许多相同尺寸甚至体量更大的现有语言模型。特别是,Phi-3-mini模型的性能优于其体量两倍的其他模型,而Phi-3-small和Phi-3-medium模型则优于更大规模的模型,如广为人知的GPT-3.5T。

微软发布Phi-3,手机上就能跑,是时候聊聊小型语言模型了|TodayAI

这些性能数据是通过标准化的测试流程获得的,以确保结果的可比性。虽然由于评估方法的微小差别,这些测试结果可能与其他发布的数据有所不同,详细信息已在公司的技术论文中公布。

值得注意的是,在专注于事实知识的基准测试(如TriviaQA)中,Phi-3系列的表现不如某些更小型的模型,这主要是因为较小模型尺寸可能限制了其保留事实的能力。

Phi-3模型是在微软负责任的AI原则指导下开发的,这些原则包括问责制、透明度、公平性、可靠性与安全性、隐私保护以及包容性。每个模型在上市前都经过了严格的安全评估,包括红队测试和敏感用途审查,确保它们在符合公司标准的同时,也能安全可靠地部署和使用。

基于微软既有的Phi模型系列,Phi-3模型通过使用高质量数据进行训练,并结合了人类反馈的强化学习、自动化测试、以及手动的红队测试等多种方式,进一步提升了其安全性能。公司还在其技术论文中详细介绍了这些安全培训和评估方法,并在模型卡中提供了推荐的使用方式和限制。

为什么要有小型语言模型

在当前的技术发展趋势中,小型语言模型正成为解决简单任务的理想选择。这类模型不仅易于使用,还因其能够被资源有限的组织快速部署和定制以满足特定需求而受到青睐。微软的相关负责人在最近的一个技术研讨会上指出:“我们将见证的,不再是模型从大到小的简单缩减,而是从单一模型向模型组合的转变。在这种变革中,客户能够根据自己的实际情况选择最适合自己的模型。”同样,其也强调了模型选择的多样性:“有些客户可能只需要小型模型,而一些则需要大型模型,许多人将希望将两者结合使用。”选择合适的语言模型依赖于组织的具体需求、任务的复杂度以及可利用的资源。特别是对于那些需要在设备上本地运行的应用程序,小型模型以其快速响应和不依赖于广泛推理的特性,显得尤为适合。

大型语言模型(LLMs)以其处理高级推理、数据分析和上下文理解的能力,在执行复杂任务方面显示出显著优势。与此同时,小型语言模型(SLMs)为那些受监管的行业提供了新的可能性,特别是在这些行业中,有高质量结果需求且希望数据保留在本地的情况下。微软的研究人员特别看好在移动设备上部署功能更强大的SLMs的前景,这些设备能在无需连接云端的情况下,在“边缘”环境中运行,如汽车计算机、无Wi-Fi个人电脑、交通系统、工厂地板上的智能传感器、遥控摄像机或监控环境合规性的设备。

微软的研究人员指出,这种方式可以“最小化延迟并最大化隐私”。他解释说,延迟是指LLMs与云通信检索数据以响应用户提示时可能发生的时间延迟。在某些情况下,用户可能愿意等待高质量的回答,而在其他情况下,快速响应是用户满意度的关键。他还提到,由于SLMs能够离线工作,更多人将能以前所未有的方式使用人工智能。例如,在缺乏蜂窝服务的农村地区,SLMs能提供即时的智能支持。他补充道:“即使在网络条件不佳的地区,你也可以在你的设备上享受AI体验。”

尽管在AI标准上SLMs相对较小,例如Phi-3-mini模型仅有38亿参数,但它们的潜力不容小觑。相比之下,最大的LLMs的规模远超此数,这些模型的巨大进步通常被认为是其庞大规模所带来的。然而,微软的团队成功开发出在小型封装中提供卓越结果的SLMs,这一成就得益于对训练数据的精选策略。

微软发布Phi-3,手机上就能跑,是时候聊聊小型语言模型了|TodayAI

传统上,大型语言模型的训练依赖于海量的互联网数据,这被视为满足这些模型对复杂内容处理需求的唯一方式。然而,微软的生成性AI研究副总裁Sebastien Bubeck提出了另一种思路:“我们为何不寻找极高质量的数据呢?”受到微软同事每晚与女儿的阅读仪式的启发,微软研究团队决定创建一个名为“TinyStories”的数据集,该数据集从3000个精选词汇开始,包括相似数量的名词、动词和形容词。这些词汇被用于指导一个大型模型生成数百万个小型儿童故事,这个过程持续了几天。这些故事后来被用来训练一个约有1000万参数的小型模型。出乎意料的是,当这个通过TinyStories训练的模型被用来生成故事时,它展示了流畅的叙述和完美的语法,证明了在精确数据驱动下小型模型的巨大潜力。

小型语言模型如何应用

微软通过Azure AI平台推出的Phi-3模型,特别适合用于资源受限、延迟敏感和成本受限的环境。例如,Phi-3-mini因其小尺寸和优化的ONNX运行时,能够在多种平台上进行部署,非常适合需要在设备上或离线进行推理的场景。Phi-3模型的较小尺寸也使得微调或定制变得更容易和更经济。此外,它们较低的计算需求使其成为一个成本更低、延迟更好的选项。更长的上下文窗口使其能够接收并推理大量文本内容——文档、网页、代码等。Phi-3-mini展示了强大的推理和逻辑能力,使其成为分析任务的良好候选者。

根据微软官网的介绍,Phi-3系列已被广泛应用于多个行业,包括农业。例如,在微软与印度ITC企业集团合作的Krishi Mitra项目中,Phi-3模型已被用来支持超过一百万农民,帮助他们在网络连接不稳定的环境中获得实时的农业建议和支持。

此外,从最初的Phi-1模型,专注于Python编程,到后续的Phi-1.5和Phi-2模型,每一代产品都显示了如何通过战略数据策划和创新的规模扩展来实现性能的显著提升,Phi系列模型已经在业界树立了高标准的典范。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1622664.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Matlab|含多微网租赁共享储能的配电网博弈优化调度

目录 主要内容 结果一览 下载链接 主要内容 首先利用NSGA-II算法求解三个微网的最优充放电策略并做为已知条件代入到双层调度模型中;然后求解双层模型,上层为主动配电网调度模型,下层包括共享储能优化模型和多微网优化调度模型&a…

SPSS软件安装包(亲测可用)

目录 一、软件简介 二、软件下载 一、软件简介 IBM SPSS Statistics是一款功能强大的统计分析软件,广泛应用于各种学术研究、商业决策和政府机构等领域。其强大的数据分析和可视化功能使得用户能够从数据中发现模式、预测趋势,并做出有根据的决策。 SPS…

《系统架构设计师教程(第2版)》第10章-软件架构的演化和维护-02-面向对象软件架构演化过程

文章目录 1. 对象演化1.1 添加一个新对象(AO)1.2 删除一个对象(DO) 2. 消息演化2.1 消息2.2 消息演化的操作2.2.1 Add Message(AM)2.2.2 Delete Message (DM)2.2.3 Swap Message Order(SMO)2.2.4 Overturn Message(OM)2.2.5 Chang…

【漏洞复现】泛微e-office系统ajax.php接口存在任意文件上传漏洞

漏洞描述 泛微e-office系统是标准、易用、快速部署上线的专业协同OA软件。泛微 E-Office 9.5版本存在代码问题漏洞,泛微e-office系统ajax.php接口存在任意文件上传漏洞 免责声明 技术文章仅供参考,任何个人和组织使用网络应当遵守宪法法律,遵守公共秩序,尊重社会公德,…

缓存神器-JetCache

序言 今天和大家聊聊阿里的一款缓存神器 JetCache。 一、缓存在开发实践中的问题 1.1 缓存方案的可扩展性问题 谈及缓存,其实有许多方案可供选择。例如:Guava Cache、Caffine、Encache、Redis 等。 这些缓存技术都能满足我们的需求,但现…

电商技术揭秘三十一:智能风控与反欺诈技术

相关系列文章 电商技术揭秘相关系列文章合集(1) 电商技术揭秘相关系列文章合集(2) 电商技术揭秘二十八:安全与合规性保障 电商技术揭秘二十九:电商法律合规浅析 电商技术揭秘三十:知识产权保…

全光谱灯对人体的危害?谨记全光谱灯选购要避开的四大套路

全光谱灯对人体的危害有多大?近年来网上关于护眼台灯对视力有害的言论有很多,引发了很多人空前的关注,事实上这未必是一件坏事,因为随着护眼台灯的热度持续上涨,市面上浑水摸鱼的行为增多了不少,有着不少劣…

不要摆摊,不要开早餐店,原因如下

关注卢松松,会经常给你分享一些我的经验和观点。 我最近开通了视频号会员专区嘛,专区有个问答功能可以提问,有个会员问了我问题,其中一条问答分享给大家: 松哥,突然想去兼职,早上卖点杂粮煎饼果…

像素着色技术在AI去衣中的深度应用与探索

在人工智能(AI)领域,图像处理技术一直是一个热门且充满挑战的研究方向。其中,AI去衣技术作为图像处理技术的一个分支,近年来引起了广大研究者和公众的广泛关注。本文将重点探讨像素着色技术在AI去衣中的重要作用&#…

深度学习图像生成在AI去衣技术中的应用与探索

随着人工智能技术的迅猛发展,深度学习在图像生成领域的应用越来越广泛。其中,AI去衣技术作为深度学习在图像处理中的一个新兴分支,引起了广大科研人员和公众的关注。本文将深入探讨深度学习图像生成在AI去衣技术中的作用,并尝试解…

那些你不知道的数据库知识:行式存储和列式存储

前几天听课,听到老师讲数据列式存储。 我🙋🏻‍♀️:等等,what,什么列式存储,数据一行一行的展示,然后一行一行的存在数据库里面不就好了,什么叫做列式存储,…

前端中不同格式的日期相互转换(字符串、时间戳)js相关

在项目中遇到了,需要实现字符串和Unix时间戳的相互转换,随手记录一下。 我使用的组件库为Naive UI,涉及到的组件为日期选择器(Date Picker)。作者在文档中写道: 实话说我不喜欢这个 feature,因为…

训练营第三十三天贪心(第五部分重叠区间问题)

训练营第三十三天贪心(第五部分重叠区间问题) 435.无重叠区间 力扣题目链接 题目 给定一个区间的集合 intervals ,其中 intervals[i] [starti, endi] 。返回 需要移除区间的最小数量,使剩余区间互不重叠 。 示例 1: 输入: …

TapData + 实时数仓:实时数据如何赋能船舶制造业,助力数字化应用升级和科学管理运营

使用 TapData,化繁为简,摆脱手动搭建、维护数据管道的诸多烦扰,轻量代替 OGG、DSG 等同步工具,「CDC 流处理 数据集成」组合拳,加速仓内数据流转,帮助企业将真正具有业务价值的数据作用到实处&#xff0c…

笔试狂刷--Day5(最小公倍数+最优路径)

大家好,我是LvZi,今天带来笔试狂刷--Day5 一.求最小公倍数 链接:求最小公倍数 分析: 数学知识–辗转相除法(迭代/递归) 代码: import java.util.Scanner;// 注意类名必须为 Main, 不要有任何 package xxx 信息 public class Main {public static void main(String[] args)…

计算机视觉——两视图几何求解投影矩阵

上文我提到了通过图像匹配得到基本矩阵,接下来我们要接着求解投影矩阵。 计算投影矩阵思路 假设两个投影矩阵为规范化相机,因此采用基本矩阵进行恢复。在规范化相机下, P [ I ∣ 0 ] P[I|0] P[I∣0], P ′ [ M ∣ m ] P[M|m] P′[M∣m]。…

【结构型模型】享元模式

一、享元模式概述 享元模式定义:又叫蝇量模式,运用共享技术有效地支持大量细粒度对象的复用。系统只使用少量的对象,而这些对象都很相似,状态变化很小,可以实现对象的多次复用。由于享元模式要求能够共享的对象必须是细…

创建SpringBoot和RabbitMQ的整合项目

文章目录 创建SpringBoot和RabbitMQ的整合项目首先快速创建一个maven项目引入SpringBoot整合rabbitMQ的依赖在src/main目录下创建resources目录并引入配置文件写消息发送者MessageSender写消息接收者MessageReceiver写RabbitMQConfig配置类写SpringBoot启动主类CommandLineRunn…

Bootloader应用启动分析详解

内存->磁盘 引导程序->核心->根文件系统rootfs->app 引导程序加载最重要 由于boot设计比较偏底层,所以根据CPU架构和OS类型可能有所不同 uboot是对CPU架构和OS类型支持得比较多得一种开源引导程序 Bootloader的种类 s5p6818启动流程 芯片最开始是从iROM启动,…

【漏洞复现】泛微e-Mobile 移动管理平台文件上传漏洞

0x01 阅读须知 “如棠安全的技术文章仅供参考,此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等(包括但不限于)进行检测或维护参考,未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供…