微软Azure OpenAI支持数据微调啦!可打造专属ChatGPT

news2024/12/23 4:44:11

10月17日,微软在官网宣布,现在可以在Azure OpenAI公共预览版中对GPT-3.5-Turbo、Babbage-002 和Davinci-002模型进行数据微调。

使得开发人员通过自己的数据集,便能打造独一无二的ChatGPT。例如,通过海量医疗数据进行微调,构建专注医疗领域的ChatGPT助手,可询问与医疗相关的病历、专业术语、治疗方案等内容。

目前,全球各行业积累了几年甚至几十年的巨量优质数据,如何高效利用、查询这些数据成为一大难题。

通过自有数据微调打造的AI助手可有效解决这一痛点,同时提升内容的准确性、安全性,是组织实现降本增效的利器。

详细微调教程:https://learn.microsoft.com/en-us/azure/ai-services/openai/tutorials/fine-tune?tabs=command-line

微软Azure服务:https://azure.microsoft.com/en-us/products/ai-services/openai-service/

在这里插入图片描述

什么是数据微调

大模型数据微调(Fine-tuning)是一种迁移学习方法,用于深度学习和机器学习。通常数据微调是基于一个预训练好的模型(例如,GPT-3.5-Turbo)作为基石,然后在特定的任务数据集(例如,法律、医疗、营销)上进行额外的训练,使模型能生成特定业务领域的内容。

例如,你想训练一个模型来回答法律相关的问题,首先在大量的通用文本数据上进行预训练,然后在医学问答数据集上进行微调。

简单来说,微调功能就是让ChatGPT,完全按照你的数据来生成内容。

在这里插入图片描述

需要注意的是,即便你有高质量的数据集,但选择的微调模型性能很差,生成的内容也不会很理想。

而微软提供基于OpenAI的GPT-3.5-Turbo,是一个经过全球数百万开发者验证的高性能成熟模型。

Azure OpenAI新功能

Babbage-002和Davinci-002是微软最新推出的GPT-3基础模型,可生成文本、代码等,没有接受过遵循指令的训练。但在微调、托管服务费用方面更便宜。

Babbage-002取代了已弃用的Ada和Babbage 模型, Davinci-002 则取代了Curie和 Davinci。

在这里插入图片描述

GPT-3.5-Turbo是OpenAI性能最成熟模型之一,支持多轮深度对话、创建微调数据集、训练和部署等一站式开发服务。

Azure OpenAI微调功能演示

上传数据:微软在Azure OpenAI内置了数据过滤功能,当检测到用户上传的数据集包含非法、歧视等有害信息时,会自动删除这些内容。以下是上传数据集代码示例。

在这里插入图片描述

预训练:使用指定模型、训练和验证数据,并设置相应的参数。开发者可将Azure OpenAI Studio用于简单的GUI,或者使用微软的REST API或OpenAI Python SDK。

在这里插入图片描述

开始启动微调功能。

在这里插入图片描述

完成微调后,将返回评估指标,例如,训练和验证损失等参数。
在这里插入图片描述

目前,微软提供数据微调托管服务,用户无需担心任何算力资源问题,只需要选择时间即可。

收费标准:Babbage-002为34美元/小时;Davinci-002为68美元/小时;GPT-3.5-Turbo为102美元/小时。

3)Azure OpenAI 服务中的推理托管:当用户完成微调后,就可以使用模型生成专属内容了。
在这里插入图片描述

如果你没有足够的算力资源平台来支撑模型的日常输出,微软同样提供了托管服务。

收费标准:Babbage-002托管每小时1.7美元,Davinci-002每小时1.7美元,GPT-35-Turbo,每小时7美元。

在这里插入图片描述

本文素材来源微软官网,如有侵权请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1110207.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

零基础搭建个人网站详细流程

最近两天,为了给自己的工具类APP备案,买了阿里云ECS和域名。虽然很想说离线工具APP不用联网,但是现实就很无语。言归正传,既然买了总不能将它们闲置着,就诞生了建站的想法,至少还能放个用户协议和隐私协议。…

潮玩宇宙:收藏、交流与竞技的数字乐园

最近爆火的新项目潮玩宇宙,想必有很多人入场了,代理商宣传投资147一个月回本,确实是现在做到了,现在平台一颗宝石的价格已经超过美金了,还有一大部分人在等待进场,潮玩宇宙旗下奖券世界和养猪农场已经做了有…

学习编程语言需要熟悉库函数吗?

学习编程语言需要熟悉库函数吗? 我想答案肯定是需要的。 但不是盲目的挨个去记,几乎各个语言的库函数都极为丰富,逐个记忆的话是十分劝退的,而且也不可能全部熟悉,到用的时候该忘还是忘。最近很多小伙伴找我,说想要一…

Python数据分析实战-使用replace方法精确匹配替换某列的值(附源码和实现效果)

实现功能 将DataFrame中某一列的指定的两个值分别替换为0和1,而将其他值替换为2 实现代码 import pandas as pd# 创建一个示例DataFrame data {A: [1, 2, 3, 4, 5],B: [a, b, c, d, e]} df pd.DataFrame(data)# 打印替换前的DataFrame print("替换前的Dat…

[游戏开发][Unity] ScriptableObject数据创建与各种加载方式

前言 ScriptableObject支持把类对象数据序列化成Unity asset文件,同时支持反序列化成类对象。本文章通过两个案例讲解ScriptableObject的使用方式,第一个是简单案例,序列化简单的bool值和Sting数据。第二个是复杂案例,在类对象里嵌…

2.IDEA的安装使用指南

学习Java的第二步应该是从IDEA下手,这篇博文介绍了它的安装及使用,希望大家看完后可以独立安装 ~ 文章目录 一、下载安装包二、安装 IDEA三、IDEA 初步上手 一、下载安装包 安装包可以从官网下载,也可以直接私信我拿取。这里主要介绍如何在官…

了解远程连接工具

什么是远程连接 远程连接就是在远程连接另外一台计算机。当某台计算机开启了远程桌面连接功能后我们就可以在网络的另一端控制这台计算机了,通过远程桌面功能我们可以实时的操作这台计算机,在上面安装软件,运行程序,所有的一切都…

TOPDON获评2023年度“汽车后市场科技创新企业”,研发实力被认可

近期,由《环球时报》社、中国企业网主办的2023(第六届)中国经济大会在北京召开,本次大会以“迈向高质量,问道新发展”为主题,政商产学研嘉宾同襄盛会,交流发展理念,分享创新经验,为推动产业变革…

最佳买股票的时机------题解报告

题目&#xff1a; 暴力双循环会时间超限 一次循环&#xff0c;不断更新min和sum值 时间复杂度为O(n),空间复杂度为O(1) 写完之后看了一眼题解&#xff0c;发现没有更好的方法 public int maxProfit(int[] prices) {int sum 0,minprices[0];for(int i1;i <prices.length;i…

在Kubernetes(k8s)上部署整个SpringCloud微服务应用

文章目录 项目准备打成使用Docker打成镜像准备Docker仓库打包项目为Docker镜像 部署应用到k8s创建nfs挂载目录创建一些基本资源创建命名空间创建拉取镜像的secret创建java运行环境的profile 部署mysql创建持久化的pv和pvc创建mysql root密码的secret创建mysql配置文件部署有状态…

Ubuntu小知识总结

Ubuntu相关的小知识总结 Ubuntu系统下修改用户开机密码Vmware虚拟机和主机之间复制、粘贴内容、拖拽文件的详细方法问题描述Vmware tools灰色不能安装解决方法小知识点&#xff1a;MarkDown的空格 Ubuntu系统下修改用户开机密码 在 Ubuntu 中修改用户密码 —— 通过命令行 在 U…

Python 机器学习入门之K-Means聚类算法

系列文章目录 第一章 Python 机器学习入门之线性回归 K-Means聚类算法 系列文章目录前言一、K-Means简介1、定义2、例子3、K-Means与KNN 二、 K-Means实现1、步骤2、优化2.1 初始化优化之K-Means2.2 距离优化之elkan K-Means 三、优缺点1、优点2、缺点 前言 学完K近邻算法&a…

UWB十个知识点

UWB是一直被基于厚望的高精度定位技术 1&#xff1a;定位技术及UWB特点 位置空间感知技术包括了GNSS、RFID、蓝牙和UWB&#xff0c;在室内和区域空间测量最具技术优势的技术是UWB。 GNSS是广域定位技术&#xff0c;室内以及建筑物旁边等场景&#xff0c;GNSS无法实现定位&am…

PHP-FFMpeg 操作音视频

✨ 目录 &#x1f388; 安装PHP-FFMpeg&#x1f388; 视频中提取一张图片&#x1f388; 视频中提取多张图片&#x1f388; 调整视频大小&#x1f388; 视频添加水印&#x1f388; 生成音频波形&#x1f388; 音频转换&#x1f388; 给音频添加元数据&#x1f388; 拼接多个音视…

印刷包装经营小程序商城的作用是什么

印刷包装业的市场需求度非常高&#xff0c;如礼品盒、标签、购物袋、企业宣传物料、周边等大小服务&#xff0c;线下各城市从业者与线上行业电商数量也很多。 然而随着线下竞争激烈、用户线上消费度提升&#xff0c;同时线上第三方平台入驻商家面临抽成/入驻费/流量费、难以打…

最近邻插值的原理及实现

1. 介绍 插值算法一般用来做上采样和下采样,最邻近插值算法,是插值算法中最简单的一种。 最邻近插值:将每个目标像素找到距离它最近的原图像素点,然后将该像素的值直接赋值给目标像素。 优点: 实现简单,计算速度快 缺点:插值结果缺乏连续性,可能会产生锯齿状的边缘,对…

docker 配置mongoDB

## 拉取镜像 docker pull mongo## 设置默认账号密码 test:test 默认数据 test docker run -d --name mongo-container -e MONGO_INITDB_ROOT_USERNAMEtest -e MONGO_INITDB_ROOT_PASSWORDtest -e MONGO_INITDB_DATABASEtest -p 27017:27017 mongo

nginx优先级和匹配方式

在http模块有server server中才有location location匹配的是uri Nginx正则表达式&#xff1a; ^&#xff1a;字符串的起始位置 $&#xff1a;字符串的结束位置 *&#xff1a;匹配所有 &#xff1a;匹配前面的字符一次或多次 &#xff1f;&#xff1a;匹配前面的字符0次或…

redhat配置本地yum源(超详细,超简单)

目录 ​编辑 1、硬件配置 2、配置本地yum源 1、硬件配置 注意这里要使用is

2023年浙大MEM考前80天上岸经验分享

时间过得真快&#xff0c;转眼间已经是十月份了。回想起去年这个时候&#xff0c;我还在为考研而感到焦虑不安。然而&#xff0c;如今我已经在浙大MEM项目学习了一个多月的时间了。在这一个月的学习过程中&#xff0c;我不仅学到了许多专业知识&#xff0c;还结识了很多志同道合…