全能大模型GPT-4o体验和接入教程

news2024/11/25 14:56:12

GPT-4o体验和接入教程

  • 前言
  • 一、原生API
  • 二、Python Langchain
  • Spring AI
  • 总结


前言

Open AI发布了产品GPT-4o,o表示"omni",全能的意思。

GPT-4o可以实时对音频、视觉和文本进行推理,响应时间平均为 320 毫秒,和人类之间对话相当。

也就是,以后跟你进行文字聊天、语音聊天、视频聊天的都可能是AI,当然,这样强大的模型,应用场景肯定不止聊天。

如何使用GPT-4o呢?目前可以通过API的方式来使用GPT-4o,但也只能使用到它的文字生成和图像理解的能力,后续会逐步开发音频和视频的能力。

那我们来看看以下几种接入和使用GPT-4o的方式。

一、原生API

在Python环境下,先安装openai依赖

pip install openai

运行以下代码即可体验gpt-4o:

from openai import OpenAI

from config import BASE_URL, API_KEY

client = OpenAI(base_url=BASE_URL, api_key=API_KEY)

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "这张图片里有什么?"},
                {
                    "type": "image_url",
                    "image_url": {
                        "url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg",
                    },
                },
            ],
        }
    ],
    max_tokens=300,
)

print(response.choices[0])

图片为:
在这里插入图片描述
得到的答案为:

Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='这张图片展示了一条木板路,通向一片开阔的草地。周围长满了绿草和一些灌木,远处可以看到一些树木。天空晴朗,蓝天上有一些白云,整个场景显得非常宁静和自然。', role='assistant', function_call=None, tool_calls=None))

怎么样,描述的还不错吧。

如果把model换成:

model="gpt-4-turbo"

我自己体验下来,确实速度要慢很多,生成的描述上,GPT-4o给我的感觉确实更好一些,更加文艺一些。

Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='这张图片展示了一条穿过绿色草地的木板路。图片背景是广阔的蓝天和些许白云,木板路两旁是高高的草丛和散布的灌木。整个景象给人一种平静和自然的感觉。这是一个很好的户外散步或自然探索的场所。', role='assistant', function_call=None, tool_calls=None))

二、Python Langchain

python版本的langchain可以不更新版本就直接使用GPT-4o,先安装依赖:

pip install langchain
pip install langchain-openai

代码如下:

from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

from config import API_KEY, BASE_URL

model = ChatOpenAI(model_name="gpt-4o", openai_api_base=BASE_URL, openai_api_key=API_KEY)

prompt = ChatPromptTemplate.from_messages([
    ("system", "解析图片链接,并告诉我这张图片里有什么?"),
    ("human", "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg")
])


chain = prompt | model

print(chain.invoke({}))

结果为:

content='这张图片显示的是一个自然步道(Nature Boardwalk)。步道由木材建造,穿越一个自然区域,看起来像是湿地或湖泊边缘。周围有茂密的绿色植被,包括草地和树木。步道上有几个人在散步,享受自然风光。天空蓝蓝的,天气看起来很好。总体来说,这张图片展现了一个宁静、绿意盎然的户外环境,非常适合散步和休闲活动。' response_metadata={'token_usage': {'completion_tokens': 113, 'prompt_tokens': 68, 'total_tokens': 181}, 'model_name': 'gpt-4o', 'system_fingerprint': 'fp_729ea513f7', 'finish_reason': 'stop', 'logprobs': None} id='run-d863e902-5b10-4cd3-a47e-daf414a1c92b-0'

Spring AI

@GetMapping("/chat")
public String generate() {
    Prompt prompt = new Prompt(
        List.of(new SystemMessage("解析图片链接,并告诉我这张图片里有什么?"),
                new UserMessage("https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg")),
        OpenAiChatOptions.builder().withModel("gpt-4o").build());
    return chatClient.call(prompt).getResult().getOutput().getContent();
}

结果为
在这里插入图片描述
当然,也有可能是测试的场景比较简单,没有发现问题。

总结

个人体验而言,GPT-4o确实在速度和效果上都非常不错,特别是速度上比GPT-4-turbo要快很多,效果上。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2221322.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C++篇】深度解析类与对象(上)

目录 引言 一、类的定义 1.1类定义的基本格式 1.2 成员命名规范 1.3 class与struct的区别 1.4 访问限定符 1.5 类的作用域 二、实例化 2.1 类的实例化 2.2 对象的大小与内存对齐 三、this 指针 3.1 this指针的基本用法 3.2 为什么需要this指针? 3.3 t…

Java毕业设计 基于SpringBoot发卡平台

Java毕业设计 基于SpringBoot发卡平台 这篇博文将介绍一个基于SpringBoot发卡平台,适合用于Java毕业设计。 功能介绍 首页 图片轮播 商品介绍 商品详情 提交订单 文章教程 文章详情 查询订单  查看订单卡密 客服   后台管理 登录 个人信息 修改密码 管…

成都爱尔胡建斌院长讲解年纪大眼花?小心黄斑变性!

中老年朋友觉得年龄增加后,眼睛出现模糊是常态,但是眼花不止“老花眼”一种,要小心的是眼底病变! 眼花的形式有很多种,如果视线中间出现暗点视物变得模糊,很难看清周围的人脸,在看书看手机这种…

MATLAB(Octave)混电动力能耗评估

🎯要点 处理电动和混动汽车能耗的后向和前向算法模型(simulink),以及图形函数、后处理函数等实现。构建储能元数据信息:电池标称特性、电池标识符等以及静止、恒定电流和恒定电压等特征阶段。使用电流脉冲或要识别的等效电路模型类型配置阻抗…

jmeter学习(6)逻辑控制器-循环

循环执行 1、循环读取csv文件的值 2、foreach 读取变量,变量数字后缀有序递增,通过counter实现 ${__V(typeId${typeIdNum})} beansell断言 String typeIdNum vars.get("typeIdNum"); String response prev.getResponseDataAsString(); …

MAC 安装HomeBrew-亲自尝试,100%会成功

文章来自这里: https://zhuanlan.zhihu.com/p/620975942 安装指令: /bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"执行完成后,输入下列命令验证 brew --version

AcWing 875:快速幂

【题目来源】https://www.acwing.com/problem/content/877/【题目描述】 给定 组 ,对于每组数据,求出 的值。【输入格式】 第一行包含整数 。 接下来 行,每行包含三个整数 。【输出格式】 对于每组数据,输出一个结果&#xff0…

初阶数据结构【3】--单链表(比顺序表还好的一种数据结构!!!)

本章概述 前情回顾单链表实现单链表彩蛋时刻!!! 前情回顾 咱们在上一章博客点击:《顺序表》的末尾,提出了一个问题,讲出了顺序表的缺点——有点浪费空间。所以,为了解决这个问题,我…

计算机网络-RSTP快速生成树基础概念

一、STP概念复习 在之前的学习中我们已经学习了STP的概念与作用。参考文章:计算机网络-生成树基础 STP(Spanning Tree Protocol,生成树协议) 是一种用于在局域网中消除数据链路层物理环路的协议。主要作用是防止交换机冗余链路产生…

app端文章列表查询-详细教程(上)

app端文章列表查询 一、数据库方面 有关文章的表垂直拆分成了三张表:文章基本信息表(字段有文章id、文章作者、文章标题、发布时间等)、文章配置表(字段有文章id、文章是否可评论、文章可转发、是否已下架、是否已删除等&#x…

MySQL 基础查询

1、DISTINCT select DISTINCT EMPLOYEE_ID ,FIRST_NAME from employees 按照ID去重,DISTINCT的字段要放在前面,不会再继续在FIRST_NAME上去重判断; 如果需要多字段去重,需要用到group by,这个后面讲; …

【Fargo】11: pacing 参数不生效:同步调整采集码率

发送侧参数改变 接收测没感觉到 还是2秒收到60个不变: 果然,发送侧的参数设置没生效 发送的码率终于正确了

【C++、数据结构】二叉排序树(二叉查找树、二叉搜索树)(图解+完整代码)

目录 [⚽1.什么是二叉排序树] [🏐2.构建二叉排序树] [🏀3.二叉排序树的查找操作] [🥎4.二叉排序树的删除] [🎱5.完整代码] ⚽1.什么是二叉排序树 二叉搜索树又称二叉排序树,它或者是一棵空树,或者是…

【慕伏白教程】将 Windows11 装进口袋 -- 便携式 Windows 11 制作教程

目录 下载 Windows 11 镜像下载 Rufus开始安装 Windows 11 下载 Windows 11 镜像 打开微软 Windows 11 官方下载网站,找到 下载适用于 x64 设备的 Windows 11 磁盘映像 (ISO) 根据个人情况选择要下载的磁盘镜像,选择多版本 ISO 的话可在安装系统开始时进…

多IP连接

一.关闭防火墙 systemctl stop firewalld setenforce 0 二.挂在mnt mount /dev/sr0 /mnt 三.下载nginx dnf install nginx -y 四.启动nginx协议 systemctl start nginx 五.修改协议 vim /etc/nginx/nginx.conf 在root前加#并且下一行添加 root /www:(浏…

基于图像拼接开题报告

选题的背景与意义 在日常生活中,使用普通相机获取宽视野的场景图像时,必须通过调节相机的焦距才可以提取完整的场景。由于相机的分辨率有限,拍摄场景越大,得到的图像分辨率就越低,因此只能通过缩放相机镜头减小拍摄的…

应对 .DevicData-X-XXXXXXXX 勒索病毒:防御与恢复策略

引言 随着信息技术的快速发展,网络安全问题愈发严峻。勒索病毒作为一种恶性网络攻击手段,已成为企业和个人面临的重大威胁之一。尤其是 .DevicData-X-XXXXXXXX 勒索病毒,其通过加密用户数据并勒索赎金,给受害者带来了巨大的经济损…

dolphinscheduler创建工作流及工作流中DataX的使用(简单操作)

一、在项目管理中创建项目:点击创建项目 用哪个用户登录的,所属用户就是哪个,直接输入项目名即可 二、点击项目,在项目中创建工作流,用DataX同步数据 按照图片的步骤依次填写完成,注意 图片中的第九步是写…

个税自然人扣缴客户端数据的备份与恢复(在那个文件夹)

一,软件能够正常打开,软件中的备份与恢复功能 1,备份 您按照下面的方法备份一下哦~ 进入要备份的自然人软件,点击左侧系统设置→→系统管理→→备份恢复; 在备份设置里,点击“备份到选择路径”,…

小白向的源码开发详解:直播带货系统与电商平台搭建指南

本篇文章,笔者将为小白们提供一份详细的源码开发指南,帮助你轻松搭建自己的直播带货系统和电商平台。 一、了解直播带货系统的基本构成 直播带货系统主要由以下几个部分组成: 1.前端界面 2.后端服务器 3.数据库 4.直播平台 二、技术选型…