SLMs之Phi-3:Phi-3的简介、安装和使用方法、案例应用之详细攻略

news2025/1/16 18:04:49

SLMs之Phi-3:Phi-3的简介、安装和使用方法、案例应用之详细攻略

导读:2024年4月23日,微软发布Phi-3,这是微软推出的一款新的开源AI模型家族Phi-3
背景痛点:小语言模型(SLM)尽管规模不大,但在语言理解、代码编写和数学计算等方面表现出色。
产品介绍
>> Phi-3家族成员包括Phi-3-mini(待推出的Phi-3-small和Phi-3-medium)。
>> Phi-3-mini是首个支持上万字符上下文窗口的小型模型,性能影响小。
>> Phi-3模型在相同规模或者比它大一倍模型的多个语言评测指标上都表现出色
核心特点
>> 安全首要,按照微软责任AI标准开发。
>> 高效、低延迟,尤其适用于边缘计算。
>> 低成本,面向资源有限且任务简单的场景。
应用场景
>> 边缘和嵌入式设备
>> 延迟敏感场景
>> 成本面临限制的场景
优势
>> 在同规模模型基础上显著提升性能
>> 安全培训与评估丰富
>> 提供不同规模选择,满足多样需求
综上,微软Phi-3 family旨在提供更多选择以满足客户需求,新推出的Phi-3-mini是一个稳定性能的小型语言模型,特别适用于边缘和低延迟场景

目录

Phi-3的简介

1、Phi-3的特点

2、Phi-3的核心技术点

3、模型效果:其中Phi-3-small稍微较强于LLaMA-3-8B,而Phi-3-medium几乎全胜于LLaMA-3-8B

Phi-3的安装和使用方法

1、下载模型

2、模型微调与部署

T1、在Azure AI Studio中利用部署-评估-微调工具链进行部署和评估

T2、在Ollama上进行本地运行,并根据需要进行定制和微调

3、模型体验

T1、HuggingFace平台

T2、Azure平台

Phi-3的案例应用


Phi-3的简介

2024年4月23日,Phi-3是由微软开发的一系列开放AI模型,旨在重新定义小型语言模型(SLMs)的可能性。Phi-3模型以其卓越的性能和高效的成本而著称,超越了同等大小和稍大一号的模型,在各种语言、推理、编码和数学基准测试中表现优异。Phi-3系列包括Phi-3-mini等多个模型,其中Phi-3-mini拥有38亿参数,可在Microsoft Azure AI Studio、Hugging Face和Ollama等平台上使用。

官网地址:https://azure.microsoft.com/en-us/blog/introducing-phi-3-redefining-whats-possible-with-slms/

1、Phi-3的特点

>> 支持不同长度的上下文窗口,其中Phi-3-mini是同类模型中首个支持最多128K令牌上下文窗口的模型。

>> 经过指令调整,可以遵循不同类型指令,使模型即开即用。

>> 在Azure AI上利用部署-评估-微调工具链,以及在Ollama上提供本地运行支持。

>> 经过优化,支持跨平台的ONNX Runtime,并可在GPU、CPU甚至移动硬件上运行。

>> 作为NVIDIA NIM微服务提供,具有标准API接口,可在任何地方部署,并针对NVIDIA GPU进行了优化。

2、Phi-3的核心技术点

>> 高质量数据的训练,确保模型的性能和效果。

>> 安全后训练,包括强化学习人类反馈、自动化测试和对数十种危害类别的评估。

>> 符合微软负责任AI标准,遵循责任、透明、公平、可靠和安全、隐私和安全、包容等原则。

3、模型效果:其中Phi-3-small稍微较强于LLaMA-3-8B,而Phi-3-medium几乎全胜于LLaMA-3-8B

Phi-3模型在关键基准测试中显著优于同大小和更大尺寸的语言模型(见下方的基准测试数字,数字越高越好)。Phi-3-mini的表现优于其两倍大小的模型,而Phi-3-small和Phi-3-medium则超过了包括GPT-3.5T在内的更大模型

所有报告的数字都是使用相同的流程产生的,以确保这些数字具有可比性。因此,由于评估方法上的微小差异,这些数字可能与其他已发布的数字不同。我们在技术论文中提供了更多关于基准测试的细节。

注意:Phi-3模型在事实知识基准测试(如TriviaQA)上的表现不如小型模型,因为较小的模型尺寸导致保留事实的能力较低

Phi-3的安装和使用方法

在Microsoft Azure AI Studio、Hugging Face或Ollama上查找和下载Phi-3-mini模型。

1、下载模型

地址:https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3

2、模型微调与部署

T1、在Azure AI Studio中利用部署-评估-微调工具链进行部署和评估

地址:Azure AI Studio

T2、在Ollama上进行本地运行,并根据需要进行定制和微调

地址:phi3

3、模型体验

T1、HuggingFace平台

地址:https://huggingface.co/chat/models/microsoft/Phi-3-mini-4k-instruct

T2、Azure平台

地址:Azure AI Studio

Phi-3的案例应用

在资源受限环境中,如设备上和离线推断场景。

在需要快速响应时间的延迟绑定场景中。

在成本受限的使用案例中,尤其是那些任务较简单的情况下。

在农业领域等地方,通过与微软合作伙伴模板的使用,提供具有降低成本运行的强大小型模型,以帮助改善农民的效率和准确性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1623032.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

three.js 制作卡牌正反面 旋转

1.效果图 2.代码 <template><div><div id"container"></div></div> </template><script> import * as THREE from "three"; import { OrbitControls } from "three/examples/jsm/controls/OrbitControls.…

C语言指针进阶:各类型指针变量详解

目录 1. 字符指针变量2. 数组指针变量2.1 什么是数组指针变量2.2 数组指针变量的初始化 3. 二维数组传参的本质4. 函数指针变量4.1 函数指针变量的创建4.2 函数指针变量的使用4.3 代码分析4.3.1 typedef 关键字 5. 函数指针数组6. 转移表 正文开始。 1. 字符指针变量 我们可以…

融合算法:引力融合

问题&#xff1a; 有一批数据&#xff0c;如&#xff1a; [ 1, 2, 3, 45, 46, 55, 89, 101 ]想把它分成3块&#xff0c;如&#xff1a; [1, 2, 3] [45, 46, 55] [89, 101]算法&#xff1a; 参考万有引力公式&#xff0c;想象坐标轴上这8个点的分布&#xff1a; 每一个点都会…

偏执型人格的症状和起因,偏执型人格测试和应对方法

偏执型人格&#xff0c;主打一个敏感多疑&#xff0c;过分的固执&#xff0c;过度的警觉。无论别人怎么解析&#xff0c;都难以说服。偏执型人格常常毫无根据的怀疑他人的忠诚&#xff08;动机&#xff09;&#xff0c;曲解别人的言语&#xff08;或行为&#xff09;&#xff0…

MySQL--表的操作

目录 创建表 查看表结构 修改表 新增列 修改列类型 修改列名 修改表名&#xff1a; 删除列 删除表 创建表 语法&#xff1a; CREATE TABLE table_name ( field1 datatype, field2 datatype, field3 datatype ) character set 字符集 collate 校验规则 engine 存储引…

数据结构 - 顺序表

一. 线性表的概念 线性表&#xff08;linear list&#xff09;是n个具有相同特性的数据元素的有限序列。 线性表是一种在实际中广泛使用的数据结构&#xff0c;常见的线性表&#xff1a;顺序表、链表、栈、队列、字符串... 线性表在逻辑上是线性结构&#xff0c;也就说是连续的…

分类算法——决策树(五)

认识决策树 决策树思想的来源非常朴素&#xff0c;程序设计中的条件分支结构就是if-else结构&#xff0c;最早的决策树就是利用这类结构分割数据的一种分类学习方法。 决策树分类原理详解 为了更好理解决策树具体怎么分类的&#xff0c;通过一个问题例子&#xff1a; 问题…

每日OJ题_BFS解决拓扑排序③_力扣LCR 114. 火星词典

目录 力扣LCR 114. 火星词典 解析代码 力扣LCR 114. 火星词典 LCR 114. 火星词典 难度 困难 现有一种使用英语字母的外星文语言&#xff0c;这门语言的字母顺序与英语顺序不同。 给定一个字符串列表 words &#xff0c;作为这门语言的词典&#xff0c;words 中的字符串已…

[Java EE] 多线程(三):线程安全问题(上)

1. 线程安全 1.1 线程安全的概念 如果多线程环境下代码运行的结果不符合我们的预期,则我们说存在线程安全问题,即程序存在bug,反之,不存在线程安全问题. 1.2 线程不安全的原因 我们下面举出一个线程不安全的例子:我们想要在两个线程中对count进行操作 public class Demo9 …

RC电路延时时间常数在线计算器

RC电路延时时间常数在线计算器: https://www.838dz.com/calculator/1888.html 急用时&#xff0c;找不到。

后端通过@jsonformat格式化数据转发,前端无法正确显示

后端发送给前端的updatatime是有格式的 后端接收的数据没有任何变化&#xff0c;前端代码也很正常 显示时间也乱码 原因应该是某个注释和jsonformat冲突了&#xff0c;所幸就不用jesonformat 用手动配置的消息转换器 // 消息转换器&#xff0c;后端返回给前端数据格式化Overri…

用斐波那契数列感受算法的神奇(21亿耗时0.02毫秒)

目录 一、回顾斐波那契数列 二、简单递归方法 &#xff08;一&#xff09;解决思路 &#xff08;二&#xff09;代码展示 &#xff08;三&#xff09;性能分析 三、采用递归HashMap缓存 &#xff08;一&#xff09;解决思路 &#xff08;二&#xff09;代码展示 &…

C++入门----内联函数auto范围fornullptr指针

1.内联函数 顾名思义&#xff0c;内联函数也是函数的一种&#xff0c;我们在C语言的学习过程里面知道了函数和宏之间的区别和各自的优缺点&#xff1b; 函数的使用需要建立栈帧&#xff0c;宏的使用需要考虑各种符号的优先级问题&#xff0c;很容易出错&#xff0c;因为宏在使…

新恒盛110kV变电站智能辅助系统综合监控平台+道巡检机器人

江苏晋控装备新恒盛化工有限公司是晋能控股装备制造集团有限公司绝对控股的化工企业&#xff0c;公司位于江苏省新沂市。新恒盛公司40•60搬迁项目在江苏省新沂市经济开发区化工产业集聚区苏化片区建设&#xff0c;总投资为56.64亿元&#xff0c;该项目是晋能控股装备制造集团重…

Spring - 5 ( 8000 字 Spring 入门级教程 )

一&#xff1a;Spring IoC&DI 1.1 方法注解 Bean 类注解是添加到某个类上的&#xff0c; 但是存在两个问题: 使用外部包里的类, 没办法添加类注解⼀个类, 需要多个对象, ⽐如多个数据源 这种场景, 我们就需要使用方法注解 Bean 我们先来看方法注解如何使用: public c…

YOLOv3没有比这详细的了吧

YOLOv3&#xff1a;目标检测基于YOLOv2的改进 在目标检测领域&#xff0c;YOLO&#xff08;You Only Look Once&#xff09;系列以其出色的性能和速度而闻名。YOLOv3作为该系列的第三个版本&#xff0c;不仅继承了前身YOLOv2的优势&#xff0c;还在多个方面进行了创新和改进。…

Linux中的高级IO函数(一)pipe socketpair dup

Linux提供了很多高级的I/O函数。它们并不像Linux基础I/O函数&#xff08;比如open和read&#xff09;那么常用&#xff08;编写内核模块时一般要实现这些I/O函数&#xff09;&#xff0c;但在特定的条件下却表现出优秀的性能。这些函数大致分为三类&#xff1a; 用于创建文件描…

HarmonyOS开发案例:【闹钟】

介绍 使用后台代理提醒&#xff0c;实现一个简易闹钟。要求完成以下功能&#xff1a; 展示指针表盘或数字时间。添加、修改和删除闹钟。展示闹钟列表&#xff0c;并可打开和关闭单个闹钟。闹钟到设定的时间后弹出提醒。将闹钟的定时数据保存到轻量级数据库。 相关概念 [Canva…

数据结构入门——排序(代码实现)(下)

int GetMidi(int* a, int left, int right) {int mid (left right) / 2;// left mid rightif (a[left] < a[mid]){if (a[mid] < a[right]){return mid;}else if (a[left] > a[right]) // mid是最大值{return left;}else{return right;}}else // a[left] > a[mid…

MySQL-----多表查询(一)

目录 一.多表关系&#xff1a; 1.1 一对多(多对一)&#xff1a; 1.2 多对多: 1.3 一对一: 二.多表查询概述&#xff1a; 三.连接查询&#xff1a; 3.1内连接&#xff1a; 3.2外连接&#xff1a; 3.3自连接查询&#xff1a; 3.4联合查询&#xff1a; 一.多表关系&…