atypica.AI:用「语言模型」为「主观世界」建模

news2025/4/16 1:44:21

人们不是在处理概率,而是在处理故事。

 —— 丹尼尔·卡尼曼

People don't choose between things, they choose between descriptions of things. 

—— Daniel Kahneman

商业研究是一门理解人类决策的学问。人并不只是根据纯粹理性做决策,而是受到叙事、情感和认知偏见的影响。所以,理解影响决策的机制是商业研究的核心。我们开发了一个商业研究智能体「atypica.AI」:

  • 通过构建「用户智能体」来「模拟」消费者的个性和认知;
  • 通过「专家智能体」与「用户智能体」的「访谈」来分析消费者的行为和决策,并产生报告。

如果,「物理」为「客观世界」建模;

那么,「语言模型」则有机会为「主观世界」建模。

atypica.AI能够捕捉数据分析无法处理的人类决策机制,为个人和商业决策问题提供深度洞察。

图片

体验地址:https://atypica.ai/

使用 atypica.AI

登陆atypica.AI,你只需要提出一个具体商业研究问题,atypica.AI会通过10-20分钟的「长推理」给出一份详尽的调研报告。

在这10-20分钟的长推理中,atypica.AI会自动做如下的工作:

1. <atypica.AI>追问你1-5个问题,把研究问题弄清楚;

2. <atypica.AI>设计一系列工作任务;

3. <atypica.AI>按照工作任务浏览社交媒体(现在仅浏览小红书,未来会有更丰富来源);

4. <atypica.AI>按照浏览结果建立多种「用户智能体」;

5. <atypica.AI>采访这些「用户智能体」,如没有得到答案,会继续建立「智能体」;

6. <atypica.AI>总结采访结果;

7. <atypica.AI>生成指定视觉风格报告;

「Nerd Stats」会记录工作过程中耗费多少时间、步骤、有多少个智能体角色、耗费多少token等,这也是一种智能体的「工作证明」(Proof of Work)。

图片

注:atypica.AI的nerd stats

atypica.AI的使用场景

  • 测试 / Testing:快速、低成本测试取消费者的反馈

<罗技鼠标>在<小红书>上选题,哪个会更受欢迎?

a.【轻薄如羽,性能如虎】罗技MX Keys迷你版陪我高效办公的日常

b. 从按键到芯片:揭秘罗技键盘的静音科技是如何实现的

c. 一键多设备切换:我用罗技FLOW技术让工作效率翻倍的小技巧

d. 30天续航不是梦:罗技键盘背后的节能技术大揭秘

e. 人体工学设计背后的故事:罗技ERGO K860如何拯救我的腕隧道综合症

图片

  • 洞察 / Insight:获取开放性的消费者需求

I am the General Manager of LV (Louis Vuitton) Shanghai. What feedback do customers have about the in-store experience at our Shanghai LV boutiques? What areas need improvement, and what aspects are working well that we should continue to enhance? Please give me a holistic report.

图片

  • 共创 / Co-create:与消费者共同创造新的商业想法

和一线城市的年轻父母,一起共创Mars的<脆香米>的新产品想法?

图片

  • 规划 / Planning:按照市场需求进行商业规划

INAH 银那无醇葡萄饮市场营销策划书

图片

欢迎体验atypica.AI

atypica.AI还没有设计好如何商业化,先发布一个「体验版」。

用户可以免费进行3个研究,之后每个请我们一杯咖啡如何 ☕️?

图片

atypica.AI「深入研究」和「企业版」功能

针对产生的研究结果可以继续下钻、追问,触发「深度研究」功能,该功能将在「atypica.AI企业版」上线。这一功能使用户能够将初步分析作为起点,而非终点,从而开启更加深入的探索旅程。当研究人员发现初步结果中的关键洞察时,可以通过特定提示或命令激活深度研究模式,系统将自动展开多层次分析。

「atypica企业版」部分规划能力如下,感兴趣请在头像下面点击「了解企业版」留资。

调用工具能力

  • 多模态内容分析、洞察(文字、图、视频、富文本等)
  • 更强的报告推理能力
  • 针对报告内容进行深度下钻研究
  • 定制化报告结构设计

调用数据能力

  • 接入企业私有数据(通过DAM)
  • 接入抖音
  • 接入互联网
  • 接入海外社媒平台(Ins、FB、TT等)

权限安全管理

  • 团队协作功能(分享、协作)
  • 数据安全功能(指定可见、有效期)

atypica.AI也可以用在个人场景

虽然atypica.AI是以商业研究分析的智能体,但是也可以进行一些个人决策研究,下面👇是我们的小伙伴千奇百怪的问题:

  • 开放问题:

为生日晚餐选合适的中餐餐馆?

图片

  • 选择问题:

便携式显示器该怎么选?

图片

  • 规划问题:

游泳特长生,该怎么规划去美国或英国读高中?

图片

atypica.AI的局限性

  • 输入问题的质量:输入问题的准确度,很大程度上决定了报告的质量;
  • 模型精确度局限:斯坦福的研究中表明这种方法可以80%准确模拟消费者的复杂决策过程,对高度情感化或情境依赖的决策预测有局限,对新兴小众消费群体的模拟不够准确(合成橙汁还是和天然橙汁不一样);
  • 数据整合复杂性:数据质量和结构差异大,整合难度高,数据干净度问题可能导致模型扭曲;这种方法更善于模拟用户的正向和负向反馈,但是不擅长模拟用户的偏见和局限。
  • 创新性预测困难:难以预测真正突破性的创新反应。

atypica.AI的缘起

多智能体:

2023年,斯坦福小镇的论文(《Generative Agents: Interactive Simulacra of Human Behavior》)让我们第一次见识了多智能体互动的概念,但是这篇文章并没有真正的展示智能体是如何进行交互的;

图片

注:斯坦福小镇研究团队《Generative Agents: Interactive Simulacra of Human Behavior》

语言模型为主观世界建模:

2024年11月,斯坦福小镇研究团队发表了题为《Generative Agent Simulations of 1,000 People》的开创性论文,该研究成功模拟了1000个随机美国人的行为模式。研究人员通过AI对真实人类进行深入采访,构建了能够准确反映个体行为和决策模式的智能体。令人瞩目的是,这些智能体与真人的行为一致性高达85%以上,展现出前所未有的模拟精度。

这项研究揭示了智能体模拟真实人类行为和进行有效访谈的巨大潜力。我们可以用一个比喻来理解其创新之处:传统研究用户(如同研究橙汁)的方法是分析其组成元素(标签),但即使掌握了全部标签,也难以完整重构用户的复杂性。而这种新方法则相当于将橙汁提炼为精华粉末,再通过语言模型作为"水"将其重新冲调成橙汁。

虽然这种「合成橙汁」并非完全天然,但它尽量模拟了真实橙汁的口感、色彩和营养特性。这种方法突破了传统用户画像中简化、标签化的局限,转而采用更为丰富、语境化的方式来建模人类的主观世界,为我们理解和预测人类行为提供了崭新视角。

图片

注:斯坦福小镇研究团队《Generative Agent Simulations of 1,000 People》

让模型调用工具:

2023年12月,OpenAI发布了GPT-4的Function Calling功能,让模型能够调用外部工具;2024年11月,Claude的MCP协议,让我们看到了模型操作工具(比如我们做的内容管理工具)的可能性。这种技术进步开创了全新的应用场景,使模型不再局限于对话框内的交互,而是能够主动与外部世界建立连接。例如,模型现在可以浏览小红书,自主发掘有趣的内容,筛选潜在的热点话题,甚至能够分析内容表现和用户反馈。

发散优先的长推理模型:

2025年2月,Deepseek R1让我们看到透明的推理过程,因此知道了怎么来设计在基座模型基础上的推理架构。与针对客观世界 / 科学问题的推理方法强调“收敛”不同,主观世界 / 商业问题的推理需要强调“发散”。我们定义为四个维度:

1)学习过去的案例

2)灵光乍现

3)反馈的质量

4)迭代的数量

因此我们基于这四个维度,开始进行多步骤、长发散的推理模型架构“Creative Reasoning”的开发,从而形成对通用商业问题思考、分析、研究的调优;

图片

多智能体的产品形态:

2025年3月,Manus、Claude的Artefacts、Devin的发布,让我们看到了多智能体产品设计的可能性。尤其是Manus在如何把智能体工作过程表达出来,并可以进行回放上的产品创新。看到智能体如何工作,确实可以让人对其产生的结果更有同理心。

图片

注:Claude的Artefacts

图片

注:Manus

atypica.AI的皮肤:

来自于代表极客精神的快乐嬉皮鬼社区HippyGhosts.io,每一个「智能体」的物理化身都是一枚「hippy ghost」。

图片

体验地址:https://atypica.ai/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2334779.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LLaMA-Factory双卡4090微调DeepSeek-R1-Distill-Qwen-14B医学领域

unsloth单卡4090微调DeepSeek-R1-Distill-Qwen-14B医学领域后&#xff0c;跑通一下多卡微调。 1&#xff0c;准备2卡RTX 4090 2&#xff0c;准备数据集 医学领域 pip install -U huggingface_hub export HF_ENDPOINThttps://hf-mirror.com huggingface-cli download --resum…

【WPF】自定义控件:ShellEditControl-同列单元格编辑支持文本框、下拉框和弹窗

需要实现表格同一列&#xff0c;单元格可以使用文本框直接输入编辑、下拉框选择和弹窗&#xff0c;文本框只能输入数字&#xff0c;弹窗中的数据是若干位的二进制值。 本文提供了两种实现单元格编辑状态下&#xff0c;不同编辑控件的方法&#xff1a; 1、DataTrigger控制控件的…

Seq2Seq - GRU补充讲解

nn.GRU 是 PyTorch 中实现门控循环单元&#xff08;Gated Recurrent Unit, GRU&#xff09;的模块。GRU 是一种循环神经网络&#xff08;RNN&#xff09;的变体&#xff0c;用于处理序列数据&#xff0c;能够更好地捕捉长距离依赖关系。 ⭐重点掌握输入输出部分输入张量&#…

从零开始学Python游戏编程19-游戏循环模式1

在《从零开始学Python游戏编程18-函数3》中提到&#xff0c;可以对游戏代码进行重构&#xff0c;把某些代码写入函数中&#xff0c;主程序再调用这些函数&#xff0c;这样使得代码程序更容易理解和维护。游戏循环模式实际上也是把代码写入到若干个函数中&#xff0c;通过循环的…

Java获取终端设备信息工具类

在很多场景中需要获取到终端设备的一些硬件信息等&#xff0c;获取的字段如下&#xff1a; 返回参数 参数含义备注systemName系统名称remoteIp公网iplocalIp本地ip取IPV4macmac地址去掉地址中的"-“或”:"进行记录cpuSerialcpu序列号hardSerial硬盘序列号drive盘符…

【Linux网络与网络编程】08.传输层协议 UDP

传输层协议负责将数据从发送端传输到接收端。 一、再谈端口号 端口号标识了一个主机上进行通信的不同的应用程序。在 TCP/IP 协议中&#xff0c;用 "源IP"&#xff0c;"源端口号"&#xff0c;"目的 IP"&#xff0c;"目的端口号"&…

没音响没耳机,把台式电脑声音播放到手机上

第一步&#xff0c;电脑端下载安装e2eSoft VSC虚拟声卡&#xff08;安装完成后关闭&#xff0c;不要点击和设置&#xff09; 第二步&#xff0c;电脑端下载安装&#xff08;SoundWire Server&#xff09;&#xff08;安装完成后不要关闭&#xff0c;保持默认配置&#xff09; 第…

XDocument和XmlDocument的区别及用法

因为这几天用到了不熟悉的xml统计数据&#xff0c;啃了网上的资料解决了问题&#xff0c;故总结下xml知识。 1.什么是XML?2.XDocument和XmlDocument的区别3.XDocument示例1示例2&#xff1a;示例3&#xff1a; 4.XmlDocument5.LINQ to XML6.XML序列化(Serialize)与反序列化(De…

Blender安装基础使用教程

本博客记录安装Blender和基础使用&#xff0c;可以按如下操作来绘制标靶场景、道路标识牌等。 目录 1.安装Blender 2.创建面板资源 步骤 1: 设置 Blender 场景 步骤 2: 创建一个平面 步骤 3: 将 PDF 转换为图像 步骤 4-方法1: 添加材质并贴图 步骤4-方法2&#xff1a;创…

【Git】从零开始使用git --- git 的基本使用

哪怕是野火焚烧&#xff0c;哪怕是冰霜覆盖&#xff0c; 依然是志向不改&#xff0c;依然是信念不衰。 --- 《悟空传》--- 从零开始使用git 了解 Gitgit创建本地仓库初步理解git结构版本回退 了解 Git 开发场景中&#xff0c;文档可能会经历若干版本的迭代。假如我们不进行…

Android 中支持旧版 API 的方法(API 30)

Android 中最新依赖库的版本支持 API 31 及以上版本&#xff0c;若要支持 API30&#xff0c;则对应的依赖库的版本就需要使用旧版本。 可通过修改模块级 build.gradle 文件来进行适配。 1、android 标签的 targetSdk 和 compileSdk 版本号 根据实际目标设备的 android 版本来…

[特殊字符] Hyperlane:Rust 高性能 HTTP 服务器库,开启 Web 服务新纪元!

&#x1f680; Hyperlane&#xff1a;Rust 高性能 HTTP 服务器库&#xff0c;开启 Web 服务新纪元&#xff01; &#x1f31f; 什么是 Hyperlane&#xff1f; Hyperlane 是一个基于 Rust 语言开发的轻量级、高性能 HTTP 服务器库&#xff0c;专为简化网络服务开发而设计。它支…

RIP V2路由协议配置实验CISCO

1.RIP V2简介&#xff1a; RIP V2&#xff08;Routing Information Protocol Version 2&#xff09;是 RIP 路由协议的第二版&#xff0c;属于距离矢量路由协议&#xff0c;主要用于中小型网络环境。相较于 RIP V1&#xff0c;RIP V2 在功能和性能上进行了多项改进&#xff0c…

《LNMP架构+Nextcloud私有云超维部署:量子级安全与跨域穿透实战》

项目实战-使用LNMP搭建私有云存储 准备工作 恢复快照&#xff0c;关闭安全软件 [rootserver ~]# setenforce 0[rootserver ~]# systemctl stop firewalld搭建LNMP环境 [rootserver ~]# yum install nginx mariadb-server php* -y# 并开启nginx服务并设置开机自启 [r…

3DMAX笔记-UV知识点和烘焙步骤

1. 在展UV时&#xff0c;如何点击模型&#xff0c;就能选中所有这个模型的uv 2. 分多张UV时&#xff0c;不同的UV的可以设置为不同的颜色&#xff0c;然后可以通过颜色进行筛选。 3. 烘焙步骤 摆放完UV后&#xff0c;要另存为一份文件&#xff0c;留作备份 将模型部件全部分成…

【新人系列】Golang 入门(十三):结构体 - 下

✍ 个人博客&#xff1a;https://blog.csdn.net/Newin2020?typeblog &#x1f4dd; 专栏地址&#xff1a;https://blog.csdn.net/newin2020/category_12898955.html &#x1f4e3; 专栏定位&#xff1a;为 0 基础刚入门 Golang 的小伙伴提供详细的讲解&#xff0c;也欢迎大佬们…

Spring Boot 自定义商标(Logo)的完整示例及配置说明( banner.txt 文件和配置文件属性信息)

Spring Boot 自定义商标&#xff08;Logo&#xff09;的完整示例及配置说明 1. Spring Boot 商标&#xff08;Banner&#xff09;功能概述 Spring Boot 在启动时会显示一个 ASCII 艺术的商标 LOGO&#xff08;默认为 Spring 的标志&#xff09;。开发者可通过以下方式自定义&a…

Ubuntu虚拟机Linux系统入门

目录 一、安装 Ubuntu Linux 20.04系统 1.1 安装前准备工作 1.1.1 镜像下载 1.1.2 创建新的虚拟机 二、编译内核源码 2.1 下载源码 2.2 指定编译工具 2.3 将根文件系统放到源码根目录 2.4 配置生成.config 2.5 编译 三、安装aarch64交叉编译工具 四、安装QEMU 五、…

【蓝桥杯】2025省赛PythonB组复盘

前言 昨天蓝桥杯python省赛B组比完&#xff0c;今天在洛谷上估了下分&#xff0c;省一没有意外的话应该是稳了。这篇博文是对省赛试题的复盘&#xff0c;所给代码是省赛提交的代码。PB省赛洛谷题单 试题 A: 攻击次数 思路 这题目前有歧义&#xff0c;一个回合到底是只有一个…

【数据结构_4下篇】链表

一、链表的概念 链表&#xff0c;不要求在连续的内存空间&#xff0c;链表是一个离散的结构。 链表的元素和元素之间&#xff0c;内存是不连续的&#xff0c;而且这些元素的空间之间也没有什么规律&#xff1a; 1.顺序上没有规律 2.内存空间上也没有规律 *如何知道链表中包…