【最后203篇系列】014 AI机器人-1

news2025/3/13 10:03:28

说明

终于开张了,我觉得AI机器人是一件真正正确,具有商业价值的事。

把AI机器人当成一笔生意,我如何做好这笔生意?一端是业务价值,另一端是技术支撑。如何构造高质量的内容和服务,如何确保技术的广度和深度?

正好在做这件事,所以我想不太多谈技术,把核心的理念和故事串一串。为技术而技术是没有价值的,为商业价值而产品又是没有生命力的,怎么让商业背后自然衔接到技术,而技术又如何自然衍生出商业价值,这是最为关键的。

内容

1 Manus

最近这个话题很火,就不多说了。有一点是,大家都模模糊糊的有了大致的方向,而且其实很多都是殊途同归的。不管怎么样,manus炒作了一把,我觉得也算是一个poc,大家可以有一些共识。

2 AI机器人

我现在的应用,是在现在的产品中嵌入一个机器人,精确基于产品的数据,而非大模型的通用能力回答问题。

时间非常紧张,大约在2周时间,完成了从poc,到上线的过程。整体上还是属于达到且稍微超过预期的一个状态,还有不少缺点,但能够用了。

还是挺感谢老板理解的,因为时间这么短,里面有很多东西是非常粗糙的,但正如马斯克说的:东西先做出来最重要,慢慢会改好的。

然后在这段时间内发现按常规方法是行不通的:anythingllm, dify, langchain, 这些成熟的套件工具没有那么熟,其实尝试过,发现在很多地方“不听话”,很难控制好。另外,关于数据应该怎么整合,如何描述给大模型完成对接,也没法按教科书那样去做。

整个过程我就奔着一个上线目标,想想第一性原理,然后迅速推进。然后我觉得有很多东西 (还有待验证)可能也如马斯克说的:世界就是一群草台班子构成的。

我用自己零散的工具和知识,也完成类似RAG和Agent Flow这样的效果,而且,似乎这个是可以不断叠加,最后由强化学习去自我优化的。我想用那些成熟工具也许是更浪费时间,而且可能是没法达到我的目标的。

自己用零件进行开发和拼装,争取在半年左右把AI机器人作出高度

这又回到我的二八理论,最终要登顶还是要靠自己。

3 结构

还是会稍微提到一点技术

  • 1 向量化。为了 更好的进行语义相似性匹配,还是需要把用户的问题转为向量。
  • 2 向量数据库。用于存储和检索近似的问题。
  • 3 FastAPI。构造流式响应服务。
  • 4 Redis。存储各种缓存,包括当前的知识数据。
  • 5 Kafka。保存会话数据。
  • 6 大模型接口。完成逻辑判断,数据整合分析。

其实可以看到,这个结构是非常简陋的,但是可以行得通。

4 问题

  • 1 服务的并发性。这个算是部分解决了,但还不够彻底。向量化的服务本来是处理批量数据的,但是在问答情况下只能一次一条,影响并发。
  • 2 当前的会话,前端没有带历史消息,回答有时看起来就会很傻。
  • 3 要问的很具体才有效。由于数据是简单糅合的,如果用户的问题偏了,机器人不会拉回来对齐,然后回答的质量就很低。
  • 4 很慢。简单问题1-3秒开始输出,中等问题大约要5-10秒才会看到回复,复杂问题可能会30秒, 这个从体验上很糟糕。
  • 5 没有过程输出。除了一个思考中的提示,没有给到中间过程。

5 第一期的改进

  • 1 让前端带2轮历史会话。
  • 2 用session_id的方式,让前端可以轮询到整个任务框架和任务完成情况
  • 3 确保能够统计到用户访问和使用的各种情况。

小步快跑,后面我再持续更新。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2314232.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ctfshow做题笔记—栈溢出—pwn69~pwn72

目录 前言 一、pwn69(可以尝试用ORW读flag flag文件位置为/ctfshow_flag) 二、pwn70(可以开始你的个人秀了 flag文件位置为/flag) 三、pwn71(32位的ret2syscall) 四、pwn72 前言 学了一些新的东西,pwn69的文档忘保存了(悲)&#xff0c…

同盾v2 2025版 blackbox , wasm加解密,逆向协议算法生成,小盾安全

声明 本文章中所有内容仅供学习交流,抓包内容、敏感网址、数据接口均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关,若有侵权,请联系我立即删除! # 欢迎交流 wjxch1004

c++领域展开第十六幕——STL(vector容器的了解以及模拟实现、迭代器失效问题)超详细!!!!

文章目录 前言一、vector的介绍和使用1.1 vector的介绍1.2 vector的使用1.2.1 vector的定义1.2.2 vector iterator 的使用1.2.3 vector的空间增长问题1.2.4 vector的增删改查 二、vector在 oj 中的使用只出现一次的数删除有序数组中的重复项杨辉三角 总结 前言 在c专栏的上一篇…

ubuntu2404 安装 过程中 手动设置网络

ubuntu2404 安装 过程中 手动设置网络 https://blog.csdn.net/2401_83947353/article/details/138454379 6.1 可以直接Done(不配置P) 6.2 可以配置ip地址,选择manual 6.2.1 search domains填 6.2.2 search domains不填 6.3 更深层次的…

去北京的前端实习经历

趁现在对这部分还有深刻的感受记忆,赶紧记录下来。因为工作久了会发现真的对以前的事记不起来了。 公司: 北京的实习公司首先有学长学姐在,而且这个公司知名度还挺高的,但是工资比较低,3k左右吧,但是管2顿…

力扣热题 100:动态规划专题经典题解析

系列文章目录 力扣热题 100:哈希专题三道题详细解析(JAVA) 力扣热题 100:双指针专题四道题详细解析(JAVA) 力扣热题 100:滑动窗口专题两道题详细解析(JAVA) 力扣热题 100:子串专题三道题详细解析(JAVA) 力…

变量赋值汇编

一、核心概念 寄存器:CPU内部的高速存储单元(如EAX、EBX、x86中的RAX、ARM中的R0等) 内存地址:变量存储在内存中的位置(如 0x1000) 指令:操作寄存器和内存的命令(如 MOV, STR, LDR…

页面白屏出现的原因

🤖 作者简介:水煮白菜王,一位前端劝退师 👻 👀 文章专栏: 前端专栏 ,记录一下平时在博客写作中,总结出的一些开发技巧和知识归纳总结✍。 感谢支持💕💕&#…

【大模型统一集成项目】让 AI 聊天更丝滑:WebSocket 实现流式对话!

🌟 在这系列文章中,我们将一起探索如何搭建一个支持大模型集成项目 NexLM 的开发过程,从 架构设计 到 代码实战,逐步搭建一个支持 多种大模型(GPT-4、DeepSeek 等) 的 一站式大模型集成与管理平台&#xff…

【2025】Electron Git Desktop 实战一(上)(架构及首页设计开发)

源代码仓库: Github仓库【electron_git】 Commit : bb40040 Github Desktop 页面分析 本节目标: 1、实现类似Github Desktop的「空仓库」提示页 2、添加本地仓库逻辑编写从 Github Desktop 我们看到 他的 主要页面分为三个区域 Head头部区域…

14 | fastgo 三层架构设计

提示: 所有体系课见专栏:Go 项目开发极速入门实战课; 在实现业务代码之前,还需要先设计一个合理的软件架构。一个好的软件架构不仅可以大大提高项目的迭代速度,还可以降低项目的阅读和维护难度。目前,行业中…

【机器学习-基础知识】统计和贝叶斯推断

1. 概率论基本概念回顾 1. 概率分布 定义: 概率分布(Probability Distribution)指的是随机变量所有可能取值及其对应概率的集合。它描述了一个随机变量可能取的所有值以及每个值被取到的概率。 对于离散型随机变量,使用概率质量函数来描述。对于连续型随机变量,使用概率…

面向对象Demo01

面向对象 什么是面向对象 回顾方法的定义 package oop; ​ import java.io.IOException; ​ public class Demo01 {public static void main(String[] args) {}//public String sayHello() {return "hello, world!";}public void sayHi() {return;}public int max(i…

C++设计模式-抽象工厂模式:从原理、适用场景、使用方法,常见问题和解决方案深度解析

一、模式基本概念 1.1 定义与核心思想 抽象工厂模式(Abstract Factory Pattern)是创建型设计模式的集大成者,它通过提供统一的接口来创建多个相互关联或依赖的对象族,而无需指定具体类。其核心思想体现在两个维度: …

solana区块链地址生成

solana官网地址:https://solana.com 先引入相关依赖solana/web3.js;bip39;ethereumjs/wallet 生成助记词 const mnemonic bip39.generateMnemonic(); 生成种子 const seed bip39.mnemonicToSeedSync(mnemonic); 生成密钥对 const root hdkey.EthereumHDKey.from…

基于python的升级队列加速决策

a-f大等级是3级 a-c建筑每升1级分别需要8天 d-f建筑每升1级分别需要10天 目前以下建筑队列正在从0级升至1级 建筑A升级需要7天05:16:20 建筑b升级需要06:06:54 建筑c升级需要00:37:00 建筑d升级需要…

Ragflow技术栈分析及二次开发指南

Ragflow是目前团队化部署大模型+RAG的优质方案,不过其仍不适合直接部署使用,本文将从实际使用的角度,对其进行二次开发。 1. Ragflow 存在问题 Ragflow 开源仓库地址:https://github.com/infiniflow/ragflow Ragflow 当前版本: v0.17.0 Ragflow 目前主要存在以下问题: …

1.7 双指针专题:三数之和(medium)

1.题目链接 15. 三数之和 - 力扣(LeetCode)https://leetcode.cn/problems/3sum/submissions/609626561/ 2.题目描述 给你⼀个整数数组 nums ,判断是否存在三元组 [nums[i], nums[j], nums[k]] 满⾜ i ! j、i ! k 且 j ! k ,同时…

【JavaEE】Spring Boot配置文件

目录 一、Spring Boot配置文件简介二、properties 配置⽂件说明2.1 properties 基本语法2.2 value("${}")读取配置⽂件 三、yml 配置文件说明3.1 yml 基本格式3.2 yml 配置数据类型 及 读取3.3 yml配置对象及读取ConfigurationProperties(prefix "")3.4 配…

行为模式---策略模式

概念 策略模式是一种行为设计摸是,它的核心思想是将一些列的算法封装成独立的对象,并使它们可以相互替换,通过上下文进行调用。 策略模式通过算法抽象为独立的策略类,客户端可以根据自身需求选择不同的策略类来完成任务、这种方…