我“开发“了一款大模型应用,AI门槛这么低了吗?

news2024/11/27 16:33:06

现在国产大模型多如牛毛。虽然可选的大模型产品很多,但普遍存在同质化、高分低能、实用性差、专业性不足的问题,哪怕是诸如ChatGPT、Gemini这样全球顶尖的大模型也会存在这种情况。

还有一点比较重要的是,由于大模型需要算力、算法、数据的基础支持,一般被大公司所把控,小企业和个人很难去参与,大公司普遍缺乏想象力的,而小企业和个人才是创新的底层动力。所以大模型需要有足够低的门槛让更多人参与进来,才能真正的走向商业化。

同时,也需要有硬实力。前段时间有粉丝和我说,他正在“BigModel开放平台”上在构建一款小说解读应用-小说神器,专门用来解读长篇小说,并提炼生成短篇故事脚本,然后再剪辑成自媒体视频,一整套的流程完全可以交给AI。我觉得这个还是蛮有意思的,让开发者自己去构建垂直应用。

他用的模型是GLM-4-Long,可以用于处理长文本。整个流程大概是:先构建知识库,比如各种小说文本。然后构建Ai应用,选择模型并微调,最后进行测试并上线。

长文本神器-GLM-4-Long模型

我特地查了下GLM-4-Long,这是智谱AI BigModel开放平台推出的一款专为处理超长文本和记忆型任务设计的大模型。

看了下文档介绍,GLM-4-Long具有高达100万字符的上下文长度支持,可以进行多文档分析、长篇幅内容生成等。

开发AI汽车选购应用

接下来,我尝试用GLM-4-Long模型构建了一个AI汽车选购建议工具-名叫“帮帮选车”,并提供一个具体的构建过程,包括使用Python接入API的示例代码。

  • 需求分析

每次构建AI应用首先确定应用的目标用户和核心功能,“帮帮选车”是为不同需求的用户提供个性化的汽车推荐,你只需要提出自己的买车需求,它就可以针对性的给出建议。

比如prompt: “我是一名刚毕业的大学生,想买一辆经济实惠且皮实的轿车,预算有限10万左右,用于平时上班代步,周末自驾短途出游。请你推荐一款符合我需求的车”。

  • 数据准备

“帮帮选车”是汽车类应用,所以必须学习汽车相关的知识,比如车型、参数、技术、价格、用户口碑等等,就需要收集汽车相关的长文本数据,如汽车说明书、用户评价、汽车参数等,用于GLM-4-Long大模型的学习。

  • 环境配置

这里需要注册BigModel开放平台账号并获取API Key,然后安装BigModel 的Python库,用于连接接口,进行数据交互。


  • 新建知识库

有了数据之后,可以新建一个知识库,由于我要搭建汽车选购类应用,因此新建了汽车类的知识库,里面包括我收集的汽车相关文档。


  • 新建AI应用

创建好知识库后,新建AI应用,这里选择问答机器人



接着配置prompt格式和选择模型,这里选择GLM-4-Long模型,你可以对模型进行微调,选择适合对话场景的配置。

最后发布应用。

  • 应用测试

模型发布后,可以在应用内进行测试,编写选车相关的prompt,看看它怎么回答。


以下是给到的提示和模型返回的答案。

  • 功能开发和用户界面设计

如果模型成熟的话,可以将其产品化,基于模型输出结果,开发汽车推荐、问答等功能,然后设计用户友好UI界面,允许用户输入他们的汽车选购需求。接着对应用进行测试,根据反馈进行优化。

最后将应用部署到服务器,供用户使用。

  • 模型API调用

在Python中使用API Key调用GLM-4-Long模型API,进行问答。

首先,确保你已经安装了BigModel的Python库-zhipuai,如果没有,你可以直接使用HTTP请求库(如requests)来调用API。

# 导入所需的库
import requests
import json
# 填写你的API Key
API_KEY = '你的API_KEY'
ENDPOINT = 'https://open.bigmodel.cn/api/paas/v4/chat/completions'
# 准备请求数据
headers = {
    'Authorization': f'Bearer {API_KEY}',
    'Content-Type': 'application/json'
}
data = {
    "model": "GLM-4-Long",
    "messages": [
        {"role": "system", "content": "你是一个汽车专家,能够提供购车建议。"},
        {"role": "user", "content": "我想要购买一辆家用轿车,预算在20万左右。"}
    ],
    "stream": True
}
# 发送请求
response = requests.post(ENDPOINT, headers=headers, json=data)
# 检查响应
if response.status_code == 200:
# 解析响应内容
    response_json = response.json()
    for chunk in response_json.get('choices', []):
        if chunk.get('finish_reason') == 'stop':
            print(f"汽车选购建议: {chunk['message']['content']}")
else:
    print(f"请求失败,状态码:{response.status_code}")

这里要注意下,以上代码只是示例,实际使用时需要根据BigModel开放平台提供的API文档进行相应的调整。然后有几个注意事项,确保处理好API Key,不要在公共代码库中暴露你的API Key。

另外,在生产环境中使用时,要考虑错误处理和日志记录,确保应用的稳定性和可维护性。

如何开发小说阅读神器呢?

前面讲了一个粉丝用BigModel开发了一款小说生成故事脚本并制作成视频的应用,这个是当前自媒体领域的热门项目,可以自动化的产出脚本。

首先创建知识库,我们上传小说合集到知识库里。


然后创建应用-小说神器,选择GLM-4-Long,并对模型进行微调。

最后测试模型的对话效果,让它解读一篇小说,并生成故事脚本。

prompt:总结小说《孔乙己》主要内容生成短视频解说文本,要求保留主要情节和人物,能体验冲突、转折和内涵,文本风格轻松有趣。


以下是给到的提示和模型返回的答案。

什么是BigModel开放平台?

前面讲了几个在BigModel开放平台上构建大模型应用的案例,这个平台和OpenAI GPTS、以及字节Coze有点类似,它是由智谱AI开发的大模型开发平台。

你可以把这类平台想象成一个大厨房,里面提供各种智能工具、模型、API接口、安全、财务管理等等一系列服务,开发者可以根据行业知识来构建自己的AI应用,就像厨师烧菜一样,锅碗瓢盆、油盐酱醋都给你准备好了,烧什么菜由你来决定。

比如说开发者关心的API接口,它能接入GLM-4、GLM-4V等主流模型,而且支持各种语言调用。你可以独立部署模型,进行模型微调。

每个行业都有一定的专业壁垒,垂直大模型也一样,需要专业知识库训练,BigModel开放平台支持注入开发者自己的专业知识,进行定制化训练。

总结

总的来说,如今国内的大模型行业还处于同质化较严重的阶段,大家都在卷算力算法,但应用创新比较少,我觉得可能是门槛太高,参与的人太少的缘故。

像BigModel这样的开放平台可能会起到一定的促进作用,毕竟作为个人或小企业开发者,你能用很低的成本能创建大模型应用,唯一需要担心的是数据和应用场景。但从整个行业来说参与的人越多越好,量变会产生质变。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2060599.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

干货:2024年四大翻译工具新体验!

在全球化的今天,语言的障碍似乎越来越小,这得益于各种翻译工具的飞速发展。从简单的在线翻译到复杂的AI翻译技术,我们有了更多的选择来跨越语言的鸿沟。以下是几款备受推崇的翻译工具,推荐给大家 福昕在线翻译 链接:…

onlyoffice连接器(connector)开发使用精讲 二次开发 深入开发【一】

连接器是onlyoffice调用web api的一个基础工具,可以方便开发者或者用户与业务系统结合使用web功能。 关于connector官方说明文档在这里:Automation API - ONLYOFFICE Api Documentation 注意:该功能针对开发者版、企业版,社区版常…

高考杂志社《高考》杂志社高考杂志社编辑部2024年第22期目录

高考论坛 高考内容改革背景下的高中数学教学策略探究 高琳琳; 3-5 新高考背景下高中数学教学中核心素养的培养路径 王芳芳; 6-8 教改研究 任务型教学在高中语文大单元教学中的应用 蔡莎; 9-11 大单元教学在高中思想政治教学中的应用探究 陈玲; 12-14 高中语文班…

局部整体(三)利用python绘制饼图

局部整体(三)利用python绘制饼图 饼图( Pie Plot)简介 饼图是一个将整体划分为几个扇形的圆形统计图表,用于描述数量、频率或百分比之间的相对关系。饼形图适合用来快速展示数据比例分布,但不利于展示较多…

华为手机相册的照片丢失或误删怎么恢复?

手机已经成为了生活中极其重要的一部分,尤其是华为手机用户,一定深知其出色的拍照功能和丰富的相册管理功能。然而,常有意外出现,如误删除、格式化、备份覆盖等情况导致手机相册的照片丢失,那么华为手机相册的照片怎么…

企业级WEB应用服务器——TOMCAT

一、WEB技术 1.1、HTTP协议和B/S 结构 最早出现了CGI(Common Gateway Interface)通用网关接口,通过浏览器中输入URL直接映射到一个 服务器端的脚本程序执行,这个脚本可以查询数据库并返回结果给浏览器端。这种将用户请求使用程…

今年暑期渗透测试面试经验分享

吉祥知识星球http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247485367&idx1&sn837891059c360ad60db7e9ac980a3321&chksmc0e47eebf793f7fdb8fcd7eed8ce29160cf79ba303b59858ba3a6660c6dac536774afb2a6330#rd 《网安面试指南》http://mp.weixin.qq.com/s?…

arthas源码刨析:启动 (1)

文章目录 arthas-bootBootstrap Created with Raphal 2.3.0 开始 检查监听端口 jps 列表java应用 下载 lib 依赖 功能移交给 arthas-core 结束 arthas-boot 该module 的代码只有3个类: Bootstrap 启动类 Bootstrap ,开头的注解就是 alibaba 的 cli 中…

蛇优化算法(Snake Optimization, SO)优化RBF神经网络的扩散速度实现多数入多输出数据预测,可以更改数据集(MATLAB代码)

一、蛇优化算法优化RBF神经网络的扩散速度原理介绍 RBF神经网络的扩散速度通常与它的径向基函数的宽度参数(σ)有关,这个参数控制了函数的径向作用范围。在高斯核函数中,当σ值较大时,函数的扩散速度较快,…

Prometheus3: 监控CPU

1. 查看监控CPU所需的key [rootlocalhost node_exporter]# curl http://localhost:9100/metrics | grep -i node_cpu | head% Total % Received % Xferd Average Speed Time Time Time CurrentDload Upload Total Spent Left Speed0 0 0 0 …

达梦数据库的系统视图v$db_cache

达梦数据库的系统视图v$db_cache 在达梦数据库(DM Database)中,V$DB_CACHE 是一个系统视图,提供了数据库缓存的相关信息。数据库缓存是数据库系统用来加速数据访问的关键组件,通过缓存常用数据来减少对磁盘操作的依赖…

《机器学习》—— 使用过采样方法实现逻辑回归分类问题

文章目录 一、什么是过采样方法?二、使用过采样方法实现逻辑回归分类问题三、过采样的优缺点 本篇内容是 基于Python的scikit-learn库中sklearn.linear_model 类中的 LogisticRegression()逻辑回归方法实现的,其内容中只是在处理…

进程与线程(7)

IPC通信方式: 一、共享内存 system v : 共享内存 是一块,内核预留的空间 最高效的通信方式 (避免了用户空间 到 内核空间的数据拷贝) 二、IPC对象操作通用框架: key值 > 申请 》读写 》关闭 》卸载 1.ftok函数:…

【Dash】Dash中@callback() 回调函数的Output() 参数

一、Dash 中的 callback() 在Python中,callback是一个用于注册回调函数的装饰器 Dash 的回调机制允许开发者创建交互式的Web应用,通过回调函数可以实现前端界面与后端逻辑的交互。 二、callback() 的概念、定义和应用场景 概念 callback 是 Dash 框…

视觉表征学习中的世界模型:自监督方法的新篇章

人工智能咨询培训老师叶梓 转载标明出处 计算机视觉中,表征学习是一个核心问题。如何让机器像人类一样理解图像内容,是实现高级视觉任务的关键。传统的自监督学习方法往往依赖于数据的变换来预测其变化,例如遮蔽图像建模(Masked …

SpringBoot:将单体项目拆分成微服务项目

💥 该系列属于【SpringBoot基础】专栏,如您需查看其他SpringBoot相关文章,请您点击左边的连接 目录 一、项目准备 二、拆分商品服务和购物车服务 1. 商品服务 (1)创建模块 (2)填写依赖 &a…

数学生物学-1-指数增长与衰退(Exponential Growth and Decay)

我们注意到数学专业的学生往往没有生物学系统的思维,而生物专业的学生则常常对数学感到恐惧。许多生物专业的学生可能一直对科学感兴趣,部分原因是他们认为生物学是一个不需要任何数学技能或背景就可以研究的科学领域。我认为这是不对的思维。 虽然大多…

Fortify相比其他扫描工具的优势在哪里?

最新发布的 Fortify 22.1.0 版本,不仅能高度兼容最新的软件技术,同时继续保持对运营环境常见的应用安全用例的广泛兼容性。经过强化的 Fortify 进一步提升了性能、准确性、可扩展性和易用性。 无论是运行 DevSecOps、开展云计算转型,还是确保…

Mac移动硬盘选什么格式最好 Mac怎么用ntfs移动硬盘

在使用Mac电脑的过程中,很多用户可能有需要扩展存储空间的需求。选择合适的移动硬盘格式对于数据传输的效率和兼容性至关重要。本文将详细介绍Mac移动硬盘选什么格式好,以及Mac怎么用ntfs移动硬盘,帮助用户优化Mac的使用体验。 一、Mac移动硬…

【具体数学 Concrete Mathematics】1.1.2 平面上的直线

【具体数学 Concrete Mathematics】1.1.2 平面上的直线