如何评价微软发布的Phi-3，手机都可以运行的小模型

如何评价微软发布的Phi-3，手机都可以运行的小模型

news2026/2/13 10:04:29

前几天才刚刚发布了Llama 3，今天微软就出手了，发布了小而精的phi-3

添加图片注释，不超过 140 字（可选）

刚刚发布的Phi-3系列小模型技术报告，引起AI圈热议。

添加图片注释，不超过 140 字（可选）

其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B。

为了方便开源社区使用，还特意设计成了与Llama系列兼容的结构。

添加图片注释，不超过 140 字（可选）

微软这次打出“手机就能直接跑的小模型”的旗号，4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的苹果A16芯片上跑到每秒12 token。

添加图片注释，不超过 140 字（可选）

这意味着，现在手机上能本地运行的最佳开源模型，已经做到ChatGPT水平。

在技术报告中还玩了一把花活，让phi-3-mini自己解释为什么构建小到手机能跑的模型很令人惊叹。

添加图片注释，不超过 140 字（可选）

除了mini杯之外，小杯中杯也一并发布：

Phi-3-small，7B参数，为支持多语言换用了tiktoken分词器，并额外增加10%多语种数据。

Phi-3-medium，14B参数，在更多数据上训练，多数测试中已超越GPT-3.5和Mixtral 8x7b MoE。

根据技术报告中披露，其核心秘诀就在于数据。

去年团队就发现，单纯堆砌参数量并不是提升模型性能的唯一路径。

反而是精心设计训练数据，尤其是利用大语言模型本身去生成合成数据，配合严格过滤的高质量数据，反而能让中小模型的能力大幅跃升。

也就是训练阶段只接触教科书级别的高质量数据，Textbooks are all you need。

Phi-3也延续了这一思路，这次他们更是下了血本:

投喂了多达3.3万亿token的训练数据（medium中杯是4.8万亿）
大幅强化了数据的”教育水平”过滤
更多样化的合成数据，涵盖逻辑推理、知识问答等多种技能
独特的指令微调和RLHF训练，大幅提升对话和安全性

举个例子，比如某一天足球比赛的结果可能对于大模型是良好的训练数据，但微软团队删除了这些加强知识的数据，留下更多能提高模型推理能力的数据。

这样一来，对比Llama-2系列，就可以用更小的参数获得更高的MMLU测试分数了。

不过小模型毕竟是小模型，也不可避免存在一些弱点。

微软透露，模型本身参数中没能力存储太多事实和知识，这一点也可以从TriviaQA测试分数低看出来。

缓解办法就是联网接入搜索引擎增强。

总之，微软研究院团队是铁了心了要在小模型+数据工程这条路上走下去，未来还打算继续增强小模型的多语言能力、安全性等指标。

对于开源小模型超过ChatGPT这回事，不少网友都认为压力现在给到OpenAI这边，需要赶快推出GPT-3.5的继任者了。

什么Mid journey、onlyfans、chatgpt、claude3、其他国外需要付费的会员都可以用这个方法解决。

资料可以参考：https://openssora.com/chatgpt-upgrade-plus-gpt/

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1620822.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

DHCP和DNS

DHCP和DNS

DHCP和DNS 一、DHCP服务 1.简介 Dynamic Host Configuration Protocol（DHCP动态主机配置协议） 可以能看见下面的IP、子网掩码、默认网关、DNS都是自动获取得到。但是它是怎么自动获取的，别急我给大家来介绍下 2.DHCP原理介绍前先给大家…

阅读更多...

移动端日志采集与分析最佳实践

移动端日志采集与分析最佳实践

前言做为一名移动端开发者，深刻体会日志采集对工程师来说具有重要意义，遇到问题除了 debug 调试就是看日志了，通过看日志可以帮助我们了解应用程序运行状况、优化用户体验、保障数据安全依据，本文将介绍日志采集的重要性、移动端…

阅读更多...

接口测试|超详细面试题【附答案】

接口测试|超详细面试题【附答案】

今天给姐妹们整理了一套超详细的附答案的接口测试面试题，姐妹们快学起来吧~ 接口测试的重要性，相信不用我多说了。接口测试是现在软件测试工程师一个加分项。因为很多朋友一开始做了几年的软件测试都是在做功能测试，做界面UI的测试&#xff…

阅读更多...

（二）Go的Mysql、Redis、Cookie、Logger等的文件配置

（二）Go的Mysql、Redis、Cookie、Logger等的文件配置

初始化配置文章目录初始化配置一、配置yaml文件二、Go读取配置文件三、初始化日志Logger四、初始化数据库（MySQL或SqlLite）五、初始化缓存（Redis）六、中间件服务（middleware） 一、配置yaml文件 Server:M…

阅读更多...

2024.4.24

2024.4.24

求圆半径和周长 #include <iostream> using namespace std;struct Cir { private:int r; public:void set_r(int i);void show(); }; void Cir::set_r(int i)//设置半径 {r i; } void Cir::show()//打印周长面积 {double Pi 3.14;double l 2*Pi*r;double s Pi*r*r;c…

阅读更多...

【pycharm】调试模式中四个常用按钮介绍

【pycharm】调试模式中四个常用按钮介绍

【pycharm】调试模式中四个常用按钮介绍在 PyCharm 的调试模式中，有四个常用的按钮，它们的功能如下： Step Over (F8)：单步执行，但在遇到函数调用时，不会进入函数内部，而是将整个函数作为一步执…

阅读更多...

技术速递｜Java on Azure Tooling 3月更新 - Java on Azure 开发工具未来六个月路线图发布

技术速递｜Java on Azure Tooling 3月更新 - Java on Azure 开发工具未来六个月路线图发布

作者：Jialuo Gan - Program Manager, Developer Division At Microsoft 排版：Alan Wang 大家好，欢迎阅读 Java on Azure 工具的三月更新。在本次更新中，我们将分享未来几个月对 Java on Azure 开发工具的投资。此外，我…

阅读更多...

基础SQL DCL语句

基础SQL DCL语句

DCL是数据控制语言，用来管理数据库用户，还有控制用户的访问权限 1.用户的查询 MySQL的用户信息存储在mysql数据库中，查询用户时，我们需要使用这个数据库。后面，还有很多数据，因为篇幅的问题，就…

阅读更多...

码头船只出行及配套货柜码放管理系统-毕设

码头船只出行及配套货柜码放管理系统-毕设

毕业设计说明书码头船只出行及配套货柜码放管理系统码头船只出行及配套货柜码放管理系统摘要伴随着全球化的发展，码头的物流和客运增多，码头业务迎来新的高峰。然而码头业务的增加，导致了人员成本和工作量的增多。为了解决这一基本问题&…

阅读更多...

SpringBoot Bean管理（扫描、注册、注册条件）

SpringBoot Bean管理（扫描、注册、注册条件）

Bean扫描一般的扫描包路径需要使用xml标签或者是ComponentScan(basePackages “xxx.xxx”) ,但是在SpringBoot中不需要。在springBoot 项目的启动类中有一个注解：SpringBootApplication,这个注解包含以下注解： 但是ComponentScan并没有指明包路径…

阅读更多...

consul ui访问安全加固

consul ui访问安全加固

本文侧重介绍访问ui安全加固部分。安装配置以及集群搭建请参考官方文档下载安装官方下载地址&安装教程 Install | Consul | HashiCorp Developer 修改配置，开启acl 首先自行规划好 server和client机器。按照下述流程在server 生成 bootstrap token。修改ac…

阅读更多...

【大语言模型LLM】-基础语言模型和指令微调的语言模型

【大语言模型LLM】-基础语言模型和指令微调的语言模型

🔥博客主页：西瓜WiFi 🎥系列专栏：《大语言模型》很多非常有趣的模型，值得收藏，满足大家的收集癖！ 如果觉得有用，请三连👍⭐❤️，谢谢！ 长期不…

阅读更多...

openEuler 22.03 LTS SP3（华为欧拉）一键安装 Oracle 11GR2 RAC（231017）

openEuler 22.03 LTS SP3（华为欧拉）一键安装 Oracle 11GR2 RAC（231017）

前言 Oracle 一键安装脚本，演示 openEuler 22.03 LTS SP3 一键安装 Oracle 11GR2 RAC（231017）过程（全程无需人工干预）：（脚本包括 ORALCE PSU/OJVM 等补丁自动安装） ⭐️ 脚本下载地…

阅读更多...

【学习记录】autoware标定相机与激光雷达外参

【学习记录】autoware标定相机与激光雷达外参

一、autoware选择这里踩了好几个坑，首先autoware作为一个无人驾驶知名框架，其内部实际上是有两套标定的东西的，这一点绝大多数博客没有提到。其中最常用的是一个叫标定工具箱的东西，这个ros包已经在1.10往后的版本中被删掉了&am…

阅读更多...

独立搭建UI自动化测试框架分享

独立搭建UI自动化测试框架分享

今天给大家分享一个seleniumtestngmavenant的UI自动化，可以用于功能测试，也可按复杂的业务流程编写测试用例，今天此篇文章不过多讲解如何实现CI/CD，只讲解自己能独立搭建UI框架，如果有其他好的框架也可以联系我&#x…

阅读更多...

springboot基于点餐码二维码在线点餐系统vue.js+java

springboot基于点餐码二维码在线点餐系统vue.js+java

Maven: 项目管理和构建自动化工具，用于java项目。 java: 广泛使用的编程语言，适用于构建跨平台应用。 Springmvc:从而在使用Spring进行WEB开发时，可以选择使用Spring的Spring MVC框架。 MyBatis: java持久层框架，支持定制化SQL、存…

阅读更多...

网络中其他协议

网络中其他协议

目录 DNS协议域名简介 ICMP协议 ICMP功能 ICMP协议格式 ping命令 NAT技术 NATP NAT技术的限制代理服务器 DNS协议 DNS（Domain Name System，域名系统）协议，是一个用来将域名转化为IP地址的应用层协议。为什么有这个协…

阅读更多...

随机森林原理及应用

随机森林原理及应用

目录一、随机森林原理、优点、应用场景 1.1基本原理 1.2主要优点 1.3使用场景二、具体实例一、随机森林原理、优点、应用场景随机森林是一种流行且强大的机器学习算法，属于集成学习方法的一部分，主要用于分类和回归任务。它通过组合多个决策树…

阅读更多...

Java文件流练习

Java文件流练习

1 扫描指定目录，并找到名称中包含指定字符的所有普通文件（不包含目录），并且后续询问用户是否要删除该文件 import java.io.File; import java.util.Scanner;public class Main {public static void main(String[] args) {Scanne…

阅读更多...

工业相机和镜头参数和选型

工业相机和镜头参数和选型

工业相机和镜头参数和选型文章目录工业相机和镜头参数和选型前言一、相机参数解释和选型1.相机参数1.1快门-shutter1.2曝光-exposure1.3增益-gain1.4 感光芯片类型（CCD/CMOS）1.5 感光芯片（靶面）尺寸1.6 分辨率1.7 像元尺寸1.8 帧…

阅读更多...

推荐文章

最新文章