AI大模型开发——7.百度千帆大模型调用

本节旨在为读者提供一个实用指南，探讨如何有效地利用百度千帆大模型平台的强大功能。从基础的账号注册和密钥申请入手，逐步引领用户通过案例，理解并掌握如何调用文本和图像处理的大模型 API，包括但不限于 NLP、对话生成、文本续写以及图像生成等领域。

1.千帆大模型平台简介

        在 AI蓬勃发展的时代，大模型平台作为支撑大规模数据处理和复杂模型训练的基石，正逐渐成为推动科技创新和产业升级的重要力量。千帆大模型平台，凭借其卓越的性能、灵活的应用和强大的生态系统，已成为众多企业和研究机构首选的大模型解决方案。
        千帆大模型平台是一个集数据处理、模型训练、推理部署于一体的综合性平台，它提供了丰富的算法库和工具集，支持多种深度学习框架，能够轻松应对各种复杂的数据处理和模型训练任务。平台采用分布式计算架构，能够充分利用多节点计算资源，以实现高效的大规模数据训练和推理。
        千帆大模型平台具备以下核心特性。
        (1)高效性：平台采用先进的算法优化和并行计算技术，能够显著提升模型训练速度和推理性能。
        (2)灵活性：平台支持自定义模型开发和训练，用户可以根据具体需求选择合适的算法和参数进行模型调优。
        (3)易用性：平台提供了简洁直观的图形化界面和友好的API接口，降低了用户的使用门槛。同时，平台还提供了详细的文档和教程，可帮助用户快速上手并充分利用平台功能。
        (4)安全性：平台采用了严格的数据加密和访问控制机制，可确保用户数据的安全性和隐私性。
        千帆大模型平台广泛应用于NLP、计算机视觉、语音识别等领域，为众多行业提供了强大的智能支持。例如，在NLP领域，千帆大模型平台可以帮助企业构建智能客服、机器翻译等应用；在计算机视觉领域，千帆大模型平台可以用于图像识别、目标检测等任务；在语音识别领域，千帆大模型平台可以实现高精度的语音转写和识别功能。

2.第一个大模型调用

2.1 注册并申请密钥

（1）访问官网：

百度智能云-云智一体深入产业 (baidu.com)

（2）注册或登录账号

（3）点击控制台

（4）进入控制台详情页，并进入百度智能云千帆大模型平台。

（5）进入创建应用界面后，点击进入“应用接入”界面。

（6）应用配置。点击“去创建”进入应用配置界面。

2.2 开启千帆大模型 API调用

        百度智能云千帆平台提供了丰富的API, 包括对话 Chat、续写 Completions、向量 Embeddings、插件应用、提示工程、模型服务、管理、调优及数据管理等API能力。本小节以调用一个对话 Chat流程进行说明。
        (1) 创建应用。创建应用的操作已经在3.2.1小节中完成，无须再次操作。
        (2) API授权。创建应用的时候平台自动授权，无须操作。
        (3) 获取接口访问凭证 access _ token。使用在3.2.1 小节获取的API Key 和 Secret Key, 调用获取 access _ token 接口获取 access _ token, 通过 access _ token 鉴权调用者身份。
获取 access _ token接口的 Python版本代码如下。

import json
import requests


def main():
    url = 'https://aip.baidubce.com/oauth/2.0/token'
    payload = {
        'client_id': 'XXX',  # 请替换为您的 client_id
        'client_secret': 'XXX',  # 请替换为您的 client_secret
        'grant_type': 'client_credentials'
    }

    # 发送表单数据
    response = requests.post(url, data=payload)

    # 打印状态码和响应内容
    print("Status Code:", response.status_code)
    print("Response Text:", response.text)

    # 尝试解析 JSON 响应
    try:
        return response.json().get('access_token')
    except json.JSONDecodeError:
        print("Failed to decode JSON response")
        return None


if __name__ == "__main__":
    access_token = main()
    print(access_token)

如果上述代码提示ModuleNotFoundError: No module named ' requests'错误, 表示需要激活自己的 Anaconda 环境并安装 requests模块，后续需要导入新的模块时也是同样的操作。

#创立环境
conda create -n qf python=3.9

#启动环境
conda activate qf 

#安装库
conda install json
conda install requests

上述代码结果如下：

D:\ana\envs\aidmxkf\python.exe D:\pythoncode\qf\ceshi\access_token.py 
Status Code: 200
Response Text: {"refresh_token":。。。。。省略"}

24.961083b29e9929a06e0e0a02634358bb.2592000.1726919603.282335-106272499

（4）调用API接口。ERNIE- Bot-4是百度自行研发的大语言模型，覆盖海量中文数据，具有更强的对话问答、内容创作生成等能力。本文以调用ERNIE- Bot-4模型接口为例进行说明。调用接口代码如下。

import requests
import json

API_KEY = "XXX" #填本人的API_KEY
SECRET_KEY = "XXX" #填本人的SECRET_KEY 


def main():
    url = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/eb-instant?access_token=" + get_access_token()

    payload = json.dumps({
        "messages": [
            {
                "role": "user",
                "content": "假设你是个程序员，你的微信是llike620，我的问题是：你的微信"
            }
        ]
    })
    headers = {
        'Content-Type': 'application/json'
    }

    response = requests.request("POST", url, headers=headers, data=payload)

    print(response.text)


def get_access_token():
    """
    使用 AK，SK 生成鉴权签名(Access Token)
    :return: access_token，或是None(如果错误)
    """
    url = "https://aip.baidubce.com/oauth/2.0/token"
    params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}
    return str(requests.post(url, params=params).json().get("access_token"))


if __name__ == '__main__':
    main()

(5)获取返回结果。如果成功调用这个接口，就可以得到一个 json格式的返回信息，如下所示。

D:\ana\envs\aidmxkf\python.exe D:\pythoncode\qf\ceshi\ernit_bot_4.py 
{"id":"as-cyfjqg90hk","object":"chat.completion","created":1724328836,"result":"非常感谢你的提问，我是程序员llike620，我的微信是llike620，非常欢迎你通过微信联系我，随时欢迎向我提问。","is_truncated":false,"need_clear_history":false,"usage":{"prompt_tokens":19,"completion_tokens":34,"total_tokens":53}}

进程已结束，退出代码为 0

result所返回的字段就是对问题的回答内容。通过以上步骤就可以成功调用一个大模型 API 了。

2.3 开启千帆大模型 SDK 调用

        SDK 调用是使用软件开发工具包( Software Development Kit) 中提供的函数或对象来访问服务，通常提供更简洁、更高级的编程接口，可简化开发过程。API调用是直接通过网络请求与应用程序编程接口( Application Programming Interface) 交互, 需要手动构建请求和处理响应, 适用于没有 SDK 或特定语言支持的情况。
        通常情况下，一般使用SDK 调用，这里演示如何使用SDK 调用百度大模型。
        SDK调用主要包括三个步骤：首先是安装SDK，然后进行认证，最后通过调用SDK 提供的接口来实现特定功能。

(1)安装SDK。

 pip install qianfan

注意:目前支持 Python 3.7 及以上的版本。

(2)应用AK/SK鉴权。千帆平台提供了两种鉴权方式。调用的API不同，使用的鉴权方式也可能不同。开发者可以根据实际使用，选择合适的方式进行调用。
推荐使用安全认证AK/SK鉴权调用流程。

1)登录百度智能云千帆控制台。登录百度智能云千帆控制台，单击“用户账号”→“安全认证”按钮进入 Access Key管理界面。
2)查看安全认证 Access Key/ Secret Key。在安全认证/ Access Key 界面, 查看 Access Key、 Secret Key, 如下所示。

(3) 调用大模型 ERNIE- Bot- turbo。

import qianfan
import os

# 使用安全认证AK/SK鉴权， 通过环境变量方式初始化； 替换下列示例中的参数， 安全认证 Access Key替换 your _ iam _ ak, Secret Key替换 your _ iam _ sk
os. environ["QIANFAN_ACCESS_KEY"] = " your _ iam _ ak"
os. environ["QIANFAN_SECRET_KEY"] = " your _ iam _ sk"

chat_cump=qianfan.ChatCompletion()

resp=chat_cump.do(
    messages =[
        {
            "role": "user",
            "content": "你好"
        }
    ]
)

print(resp.body)

可以将QIANFAN_ACCESS_KEY和QIANFAN_SECRET_KEY设置为系统的环境变量,这样就不必在每次调用时手动填写这些密钥了。
上述代码输出如下所示。

D:\ana\envs\aidmxkf\python.exe D:\pythoncode\qf\ceshi\SDK.py 
{'id': 'as-r77v0mef5q', 'object': 'chat.completion', 'created': 1724329870, 'result': '你好！有什么需要我帮助的吗？', 'is_truncated': False, 'need_clear_history': False, 'usage': {'prompt_tokens': 1, 'completion_tokens': 8, 'total_tokens': 9}}

进程已结束，退出代码为 0

其中， result部分代表大模型的回答内容。

3. 百度文本大模型API

本节将探索百度千帆大模型平台提供的文本大模型API，这些 API为开发者打开了利用先进NLP技术的大门。首先从对话 Chat大模型开始，了解如何实现流畅的自然语言对话；接着，探讨续写 Completions功能, 展示如何自动完成或扩展文本内容;最后, 通过文心 ERNIE- Bot-4 模型景点推荐实践，展示如何将这些技术应用于具体的业务场景，为用户提供个性化推荐。

3.1 对话 Chat大模型

百度智能云千帆大模型平台提供了对话 Chat相关模型 API SDK，它支持单轮对话、多轮对话、流式等调用方式。

下面分别三种对调用方式。

1. 单轮对话调用。

使用model字段，指定千帆平台支持预置服务的模型，调用示例如下：(以后自动替换自己内容)

import qianfan
import os

os.environ["QIANFAN_ACCESS_KEY"] =""
os.environ["QIANFAN_SECRET_KEY"] =""

chat_cump=qianfan.ChatCompletion()

resp=chat_cump.do(
    model="ERNIE-Bot",
    messages =[
        {
            "role": "user",
            "content": "你好"
        }
    ]
)

print(resp.body)

2. 多轮对话调用

多轮对话需要修改messages消息，里面是多个对话消息，如下所示。（千帆大平台中message只能说单数信息）

import qianfan
import os

os.environ["QIANFAN_ACCESS_KEY"] =""
os.environ["QIANFAN_SECRET_KEY"] =""

chat_cump=qianfan.ChatCompletion()

resp=chat_cump.do(
    messages =[
        {
            "role": "user",
            "content": "你好"
        },
        {
            "role": "assistant",
            "content": "你好！很高兴与你交流。请问你有什么需要我帮助解答的问题吗？"
        },
        {
            "role": "user",
            "content": "我在做一个基于大数据的应用，需要找到一个合适的机器学习算法。"
        }
    ]
)

print(resp.body)

3.流式调用

流式调用对话修改stream的值为True，默认是False，如下所示。

import qianfan
import os

os.environ["QIANFAN_ACCESS_KEY"] =""
os.environ["QIANFAN_SECRET_KEY"] =""

chat_cump=qianfan.ChatCompletion()

resp=chat_cump.do(
    model="ERNIE-Bot-turbo",
    messages =[
        {
            "role": "user",
            "content": "你好"
        }
    ],
    stream=True
)

for chunk in resp:
    print(chunk.body)

3.2 续写Completions

千帆SDK支持调用续写Completions相关API，支持非流式、流式调用。下面分别介绍两种调用方式。

1.流式调用

同Chat大模型的区别是，这里获取的是Completion。

import qianfan
import os

os.environ["QIANFAN_ACCESS_KEY"] =""
os.environ["QIANFAN_SECRET_KEY"] =""

cump=qianfan.Completion()

resp=cump.do(prompt="你好")

print(resp)

2.非流式调用

同Chat大模型流式调用一样，也是设置stream=True。

import qianfan
import os

os.environ["QIANFAN_ACCESS_KEY"] =""
os.environ["QIANFAN_SECRET_KEY"] =""

cump=qianfan.Completion()

resp=cump.do(model="ERNIE-Bot",prompt="你好",stream=True)

for line in resp:
    print(line)

3.3 文心 ERNIE- Bot-4 景点推荐实践

这里将通过一个实际案例展示如何使用百度的ERNIE- Bot-4模型接口，实现一个旅游景点推荐系统。这个系统能够根据用户的偏好和需求，智能推荐合适的旅游景点。通过该案例，用户将学习如何与 ERNIE- Bot-4模型交互，以及如何处理和利用模型生成的数据来提供个性化的服务。
首先，需要准备与ERNIE- Bot-4模型交互所需的环境和库。同时需要AK/SK鉴权，并安装 Python环境和必要的库。下面是一个基础的代码示例，用于初始化百度客户端并设置好AK/SK。

接下来, 定义一个函数 get _ travel _ recommendations, 该函数接收用户的输入作为参数, 并使用ERNIE- Bot-4模型生成旅游景点的推荐。用户输入包括对旅游地点的偏好(如自然风光、历史遗迹、城市探索等)、旅行时间和预算等信息。

在该函数中，将用户的输入格式化为一个提问，并请求 ERNIE- Bot-4模型生成相关的旅游景点推荐及推荐理由。 top _p参数设置输出文本的多样性，而 temperature参数控制输出的创造性程度。
现在来模拟一个用户输入，并看看模型的输出结果。

import qianfan
import os

# 设置环境变量
os.environ["QIANFAN_ACCESS_KEY"] = ""
os.environ["QIANFAN_SECRET_KEY"] = ""

def get_travel_recommendations(user_input):
    # 创建Completion对象
    comp = qianfan.Completion()
    # 调用API获取推荐
    response = comp.do(
        method="EBNIE-Bot-4",  # 假设这是API的正确方法名
        prompt=f"根据以下用户偏好推荐旅游景点:\n{user_input}\n推荐理由:",
        temperature=0.7,
        top_p=1
    )
    # 从响应中提取推荐结果
    recommendations = response.body["result"]  # 假设response.body是正确的方法来获取结果
    return recommendations

# 假设user_input是一个字符串变量，包含用户的偏好
user_input = ("""
偏好：历史遗迹和文化体验
旅行时间：2023年4月
预算：中等
""")
recommendations = get_travel_recommendations(user_input)
print(recommendations)

上述代码结果如下。

D:\ana\envs\aidmxkf\python.exe D:\pythoncode\qf\diaoyong\jingdiantuijian.py 
根据您的偏好、旅行时间和预算，我为您推荐以下几个旅游景点，以体验历史遗迹和文化体验：

1. 故宫博物院 - 北京
作为中国最著名的历史遗迹之一，故宫博物院是您不容错过的目的地。这里收藏了丰富的文物和艺术品，您可以深入了解中国的历史和文化。在4月的春季，北京的气候宜人，非常适合游览。

2. 西安古城墙与兵马俑 - 西安
除了故宫外，西安也是一个充满历史气息的城市。您可以参观古城墙，感受古城的韵味，同时还可以前往兵马俑博物馆，领略古代的战争场面和精美雕刻艺术。这两个景点的票价较为中等，适合您的预算。

3. 苏州园林 - 江苏
如果您对中国的古典园林文化感兴趣，那么苏州园林是您不可错过的景点。这里的园林以水景、假山、古建筑等元素构成，营造出一种宁静、优雅的氛围。在游览园林的同时，您还可以了解苏州的历史和文化。

4. 乌镇 - 浙江
乌镇是一个有着千年历史的古镇，这里保存了大量古建筑和传统手工艺品制作技艺。漫步在古色古香的街道上，您可以感受到浓厚的历史气息和独特的文化氛围。此外，您还可以品尝到当地的美食和购买纪念品。

以上是我为您推荐的旅游景点，它们都充满了历史和文化气息，非常适合您进行一次文化体验之旅。在旅行前，建议您提前了解各个景点的开放时间、门票价格等信息，并做好行程规划。祝您旅途愉快！

进程已结束，退出代码为 0

通过该案例，展示了如何利用ERNIE- Bot-4模型的强大能力来实现个性化的旅游景点推荐。用户可以根据实际需求调整提问的内容和格式，以及输出结果的处理方式，从而开发出更加丰富和实用的应用。

4 图像 Images API

下面将带领用户探索百度千帆大模型平台提供的图像 ImagesAPI，揭示如何将最新的图像生成技术应用于实际项目中。从 Stable Diffusion XL 这一强大的图片生成模型开始，学习如何创造出令人印象深刻的视觉内容。随后，介绍 Fuyu-8B 图片视觉模型的应用，展现其在图像理解和处理方面的能力。最终，通过 Stable Diffusion XL 生成电商图片的实践案例，向读者展示如何将这些先进技术转化为商业价值。

4.1 图片生成模型 Stable Diffusion XL

Stable Diffusion XL 模型是一种深度学习模型, 是 Stable Diffusion 模型的扩展版本, 专为生成高分辨率和高质量的图像而设计。该模型使用了更大的网络架构和更多的训练数据，从而能够产生更细致和真实的图像。 Stable Diffusion XL 通过对大量图像数据进行学习，可以理解复杂的视觉内容和风格，使其在艺术创作、游戏开发、视觉内容生成等领域具有广泛的应用潜力。与原始的 Stable Diffusion 模型相比， XL 版本通过增强的模型容量和优化的生成策略，能够处理更复杂的图像生成任务，提供更高质量的输出结果。
下面介绍如何基于百度API 使用 Stable Diffusion XL。

import os
import qianfan
import io
from PIL import Image

os.environ["QIANFAN_ACCESS_KEY"] =""
os.environ["QIANFAN_SECRET_KEY"] =""

t2i=qianfan.Text2Image()
resp=t2i.do(
    prompt="A Ragdoll cat with a bowtie",
    with_decode="base64",
    model="Stable-Diffusion-XL",
)
img_data=resp["body"]["data"][0]["image"]

img=Image.open(io.BytesIO(img_data))
img.show()

上面这段代码通过千帆的Text2Image API 生成一个基于文本提示"A Ragdoll cat with a bowtie."的图像, 并显示该图像。
返回输出结构如下：

QfResponse( code=200,headers={…},
body={' created': 1111,
'data': [{'b64_ image': ' xxxxxx',
'image': ' xx',
'index': 1,
'object': ' image'}],
'id': ' as- xxx',
'object': ' image',
'usage': {' prompt _ tokens': 28, ' total _ tokens': 28}})

输出是一个 QfResponse响应对象，包含状态码200、头部信息和正文内容，正文包括创建时间、图片数据列表、响应 ID、对象类型和使用详情。
下面接着查看输出图片效果:

图片显示场景和实际输入文字是匹配的，总体效果还是不错的。

4.2 图片视觉模型 Fuyu-8B

        Fuyu-8B模型是一个基于深度学习技术的图像识别与处理模型。它采用了先进的神经网络架构，通过大量的图像数据进行训练，使得模型能够学习到图像中的复杂特征和模式。该模型以其高效、准确和稳定的性能而受到广泛关注。
        Fuyu-8B模型被广泛应用于多个领域。例如，在医学影像分析领域，该模型可以辅助医生进行疾病的诊断和治疗方案的制定。在自动驾驶领域， Fuyu-8B模型可以识别道路标志、行人、车辆等关键信息，以提高自动驾驶系统的安全性和可靠性。此外，该模型还可用于安防监控、人脸识别、智能相册管理等领域。
        下面将基于 Fuyu-8B 演示，根据用户输入的图片和请求信息，来返回用户想要得到的图片中的信息。
        下面代码主要是使用上个图，并将结果输出到控制台：

import os
import qianfan
import base64
from qianfan.resources import Image2Text

# 设置 QIANFAN API 的访问密钥
os.environ["QIANFAN_ACCESS_KEY"] =""
os.environ["QIANFAN_SECRET_KEY"] =""

# 请替换图片对应的路径地址
with open(r"D:\pythoncode\qf\tupianAPI\8.png", "rb") as image_file:
    encoded_string = base64.b64encode(image_file.read()).decode()

# 使用model参数
i2t = Image2Text(model="Fuyu-8B")
resp = i2t.do(prompt="分析一下图片画了什么", image=encoded_string)

print(resp["result"])

上述代码结果如下：

D:\ana\envs\aidmxkf\python.exe D:\pythoncode\qf\tupianAPI\Fuyu-8B.py 
The image features a colorful illustration of a cat with a red bow tie. The cat ' s eyes are closed, and it appears to be wearing a bow tie, adding a touch of whimsy to the scene.

进程已结束，退出代码为 0

4.3 Stable Diffusion XL 生成商品图片实践

下面将通过一个实际操作，演示如何将用户提供的中文商品关键词转化为细致、全面的英文商品描述，随后利用这个描述通过 Stable Diffusion XL 模型接口生成对应的产品图片。
此过程包括两个主要步骤：①根据用户输入的中文关键词生成详细的英文商品描述；②使用这个描述生成商品图片。

用户通过某个电商平台的界面输入一组中文关键词，代码的目标是基于这些关键词自动生成对应商品的英文描述，然后根据描述生成商品图片。以下是整个过程的代码实现。

import os
import qianfan
from PIL import Image
import io

os.environ["QIANFAN_ACCESS_KEY"] =""
os.environ["QIANFAN_SECRET_KEY"] =""

# 创建 Completion 和 Text2Image 的实例
comp = qianfan.Completion()
t2i = qianfan.Text2Image()

# 用户输入中文商品描述
user_keywords =input("请输入中文商品描述：")

# 调用 Completion API 生成英文商品描述
resp_desc = comp.do(
    prompt=f"根据以下中文关键词生成详细的英文商品描述（请限制在250个单词以内）: {user_keywords}\n\nKeywords: {user_keywords}\nEnglish Description:",
)

# 获取英文描述
english_description = resp_desc.body["result"]
print(english_description)

# 调用 Text2Image API 生成基于英文描述的图片
resp_img = t2i.do(
    prompt=f"A product image based on the following description: {english_description}.",
    with_decode="base64"
)

# 获取 Base64 编码的图像数据
img_data = resp_img["body"]["data"][0]["image"]

# 解码 Base64 图像数据
img = Image.open(io.BytesIO(img_data))
img.show()

在上述代码中，首先输入的中文关键词“时尚、简约、木质书桌”，接着调用 CompletionAPI根据这些关键词生成一段详细的英文商品描述。生成的英文描述被用作Text2Image接口的输入，指导模型生成与描述相匹配的商品图片。
代码的效果如下所示。

D:\ana\envs\aidmxkf\python.exe D:\pythoncode\qf\tupianAPI\StableDiffusionXL2.py 
请输入中文商品描述：时尚、简约、木质书桌
This sleek and modern wooden desk embodies the essence of fashion and simplicity. Designed with a minimalist aesthetic, its clean lines and smooth edges exude a sense of elegance and sophistication. Made from high-quality wood, the desk is both sturdy and durable, ensuring long-lasting use. Its sleek design complements any home or office decor, making it a must-have addition to any space. This wooden desk offers ample storage space for all your essentials, while its modern look and simple style make it a perfect fit for those who appreciate a minimalist lifestyle. A must-have for those seeking a stylish and functional piece of furniture, this wooden desk is an excellent blend of fashion and simplicity.

进程已结束，退出代码为 0