微软现在允许开发人员对 Phi-3-mini 和 Phi-3-medium 模型进行微调

news2024/11/19 13:24:47

今年 4 月,微软首次发布了Phi-3 系列 SLM(小型语言模型),该产品具有低成本、低延迟的特性。Phi-3-mini 是一种 3.8B 语言模型,有 4K 和 128K 两种上下文长度。Phi-3-medium 是 14B 语言模型,也有两种上下文长度。

在这里插入图片描述
微软今天宣布,Phi-3-mini 和 Phi-3-medium 均可在 Azure 上进行微调。微调允许开发人员针对不同的用例提高基本模型的性能。例如,可以针对学生辅导对 Phi-3-medium 模型进行微调,也可以根据特定的语气或回复风格构建聊天应用。可汗学院等领先机构已经在实际的人工智能应用中使用了 Phi-3 模型。

微软还宣布了模型即服务(无服务器端点)功能的全面可用性。正如预期的那样,Phi-3-small 模型现在可通过无服务器端点提供,让任何人都能快速开发人工智能应用,而无需担心底层基础设施。通过 Azure AI 模型目录提供的多模式模型Phi-3-vision 很快也将通过无服务器端点提供。

上个月,微软更新了 Phi-3-mini 型号,提供了显著的改进。根据行业基准测试,Phi-3-mini-4k 在 2024 年 6 月更新后的得分为 35.8(以前为 21.7),Phi-3-mini-128k 的得分为 37.6(以前为 25.7)。

微软还重点介绍了最近在 Azure 上推出的新机型:

OpenAI GPT-4o mini

Mistral Large 2

Meta Llama 3.1 型号系列

Cohere Rerank

Azure OpenAI 服务现在默认启用了新的 Azure AI 内容安全功能,包括提示屏蔽和受保护材料检测。开发人员可以将这些功能用作任何基础模型(包括 Phi-3、Llama、Mistral 等)的内容过滤器。

通过这些更新和扩展,微软清楚地表明了其在 Azure 上推进人工智能功能的承诺。通过不断投资于Azure上最先进的人工智能模型,并提供用于微调和部署的可用工具,使开发人员能够轻松创建人工智能解决方案。

了解更多:

https://azure.microsoft.com/en-us/blog/announcing-phi-3-fine-tuning-new-generative-ai-models-and-other-azure-ai-updates-to-empower-organizations-to-customize-and-scale-ai-applications/

感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1955172.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解决git每次push代码到github都需要输入用户名以及密码

产生原因: 出现以上情况的主要原因在于采用的是 https 方式提交代码, 如果采用的是 ssh 方式只需要在版本库中添加用户的 sha 的key就可以实现提交时无需输入用户名和密码。 解决方法 在终端中使用以下命令删除原先已经建立的http的链接方式&#xff0c…

leetcode-79. 单词搜索

题目描述 给定一个 m x n 二维字符网格 board 和一个字符串单词 word 。如果 word 存在于网格中,返回 true ;否则,返回 false 。 单词必须按照字母顺序,通过相邻的单元格内的字母构成,其中“相邻”单元格是那些水平相…

基于JSP、java、Tomcat三者的项目实战--校园交易网(3)主页

前文功能的实现 技术支持:JAVA、JSP 服务器:TOMCAT 7.0.86 编程软件:IntelliJ IDEA 2021.1.3 x64 前文三篇登录和注册功能的实现 基于JSP、java、Tomcat、mysql三层交互的项目实战--校园交易网(1)-项目搭建&#xf…

go 协程池的实现

使用场景 这次需求是做一个临时的数据采集功能,为了将积压的数据快速的消耗完,但是单一的脚本消耗的太慢,于是乎就手写了一个简单的协程池: 为了能加快数据的收集速度为了稳定协程的数量,让脚本变得稳定 设计图如下…

【JUC】线程局部变量ThreadLocal

文章目录 ThreadLocal简介面试题是什么?能干吗?API介绍initialValue方法(不推荐)withInitial方法(推荐)remove ThreadLocal入门案例原始需求需求变更线程池 总结 ThreadLocal源码分析Thread、ThreadLocal、…

区块链——hardhat使用

一、引入hardhat yarn add --dev hardhat // 引入验证合约的插件 yarn add --dev nomicfoundation/hardhat-verify 二、创建hardhat项目 yarn hardhat 三、编写我们的合约 四、编译我们的合约 yarn hardhat compile 五、编写脚本部署合约以及验证合约 // 获取hardhat环境对象 c…

Flutter大型项目架构:私有组件包管理

随着项目功能模块越来越多,怎么去管理这些私有组件包是一个不得不面对的问题,特别对于团队开发来讲,一些通用的公共组件往往会在多个项目间使用,多的有几十个,每个组件包都有有自己的版本,组件包之间还有依…

AI的欺骗游戏:揭示多模态大型语言模型的易受骗性

人工智能咨询培训老师叶梓 转载标明出处 多模态大型语言模型(MLLMs)在处理包含欺骗性信息的提示时容易生成幻觉式响应。尤其是在生成长响应时,仍然是一个未被充分研究的问题。来自 Apple 公司的研究团队提出了MAD-Bench,一个包含8…

漏洞复现-F6-11泛微-E-Cology-SQL

本文来自无问社区,更多漏洞信息可前往查看http://www.wwlib.cn/index.php/artread/artid/15575.html 0x01 产品简介 泛微协同管理应用平台e-cology是一套企业级大型协同管理平台 0x02 漏洞概述 该漏洞是由于泛微e-cology未对用户的输入进行有效的过滤&#xff0…

CentOS_7.9历史版本官网下载

文章目录 1. 官网下载1.1. 打开官网1.2. download1.3. Older Versions-click here1.4. RPMs1.5. Vault mirror1.6. 7.9.2009/1.7. isos1.8. x86_641.9. 选择安装包下载 2. 阿里云镜像站下载 1. 官网下载 下载地址(如果下载地址已失效,参考下面的步骤) iso是安装包…

【前端】一文带你了解 CSS

文章目录 1. CSS 是什么2. CSS 引入方式2.1 内部样式2.2 外部样式2.3 内联样式 3. CSS 常见选择器3.1 基础选择器3.1.1 标签选择器3.1.2 类选择器3.1.3 id 选择器3.1.4 通配符选择器 3.2 复合选择器3.2.1 后代选择器 4. CSS 常用属性4.1 字体相关4.2 文本相关4.3 背景相关4.4 设…

基于sklearn的机器学习 — 决策树与随机森林

基于树的学习算法是一种广泛而流行的非参数、有监督的分类和回归方法。 基于树的学习算法的基础是决策树(decision tree),它将一系列决策规则串联起来,看起来像一棵倒立的树,第一条决策规则位于树顶,称之为…

第十四篇——军争篇:怎样在行军中设计战场

目录 一、背景介绍二、思路&方案三、过程1.思维导图2.文章中经典的句子理解3.学习之后对于投资市场的理解4.通过这篇文章结合我知道的东西我能想到什么? 四、总结五、升华 一、背景介绍 通过不利的战场,用方式方法,让战场逐渐转化成对自…

[JS]同事:这次就算了,下班回去赶紧补补内置函数,再犯肯定被主管骂

【版权声明】未经博主同意,谢绝转载!(请尊重原创,博主保留追究权) https://blog.csdn.net/m0_69908381/article/details/140754278 出自【进步*于辰的博客】 参考笔记一,P10.4、P13.2;笔记三&am…

城市交通工具目标检测数据集自行车、公交车、小汽车、行人

数据整理不易,下载地址点这里; yolo格式数据集之交通工具检测5种; 数据集已划分好|可以直接使用|yolov5|v6|v7|v8|v9|v10通用; 本数据为交通工具检测检测数据集,数据集数量如下: 总共有:6633张 训练集&…

尚庭公寓(四)

房间基本属性管理共有五个接口,分别是**保存或更新属性名称**、**保存或更新属性值**、**查询全部属性名称和属性值列表**、**根据ID删除属性名称**、**根据ID删除属性值**。下面逐一是实现。 首先在AttrController中注入AttrKeyService和AttrValueService&#xf…

计数器与阻塞队列

目录 一:阻塞队列 模拟阻塞队列 二:线程池: 三:计数器: 定时器模拟实现 一:阻塞队列 阻塞队列是在原有的普通队列上做了扩充,标准库中原有的队列和子类都是线程不安全的。 1.线程安全 2.…

OSMDroidOfflineDemo源码调试记录

文章目录 源码下载环境配置尝试不同离线加载遇到的问题 尝试安卓端加载离线地图,下载了使用osmdroid的离线版项目源码,更改JDK环境、gradle环境,一顿操作下来,踉踉跄跄的把程序跑起来了,但是离线的地图一直加载不出来。…

49.TFT_LCD液晶屏驱动设计与验证(2)

(1)Visio视图: (2)控制模块Verilog代码: module tft_ctrl(input clk_33M ,input reset_n ,input [23:0] data_in ,output [9:0] hang…

如何使用 SQLite ?

SQLite 是一个轻量级、嵌入式的关系型数据库管理系统(RDBMS)。它是一种 C 库,实现了自给自足、无服务器、零配置、事务性 SQL 数据库引擎。SQLite 的源代码是开放的,完全在公共领域。它被广泛用于各种应用程序,包括浏览…