人们不是在处理概率,而是在处理故事。
—— 丹尼尔·卡尼曼
People don't choose between things, they choose between descriptions of things.
—— Daniel Kahneman
商业研究是一门理解人类决策的学问。人并不只是根据纯粹理性做决策,而是受到叙事、情感和认知偏见的影响。所以,理解影响决策的机制是商业研究的核心。我们开发了一个商业研究智能体「atypica.AI」:
- 通过构建「用户智能体」来「模拟」消费者的个性和认知;
- 通过「专家智能体」与「用户智能体」的「访谈」来分析消费者的行为和决策,并产生报告。
如果,「物理」为「客观世界」建模;
那么,「语言模型」则有机会为「主观世界」建模。
atypica.AI能够捕捉数据分析无法处理的人类决策机制,为个人和商业决策问题提供深度洞察。
体验地址:https://atypica.ai/
使用 atypica.AI
登陆atypica.AI,你只需要提出一个具体商业研究问题,atypica.AI会通过10-20分钟的「长推理」给出一份详尽的调研报告。
在这10-20分钟的长推理中,atypica.AI会自动做如下的工作:
1. <atypica.AI>追问你1-5个问题,把研究问题弄清楚;
2. <atypica.AI>设计一系列工作任务;
3. <atypica.AI>按照工作任务浏览社交媒体(现在仅浏览小红书,未来会有更丰富来源);
4. <atypica.AI>按照浏览结果建立多种「用户智能体」;
5. <atypica.AI>采访这些「用户智能体」,如没有得到答案,会继续建立「智能体」;
6. <atypica.AI>总结采访结果;
7. <atypica.AI>生成指定视觉风格报告;
「Nerd Stats」会记录工作过程中耗费多少时间、步骤、有多少个智能体角色、耗费多少token等,这也是一种智能体的「工作证明」(Proof of Work)。
注:atypica.AI的nerd stats
atypica.AI的使用场景
- 测试 / Testing:快速、低成本测试取消费者的反馈
<罗技鼠标>在<小红书>上选题,哪个会更受欢迎?
a.【轻薄如羽,性能如虎】罗技MX Keys迷你版陪我高效办公的日常
b. 从按键到芯片:揭秘罗技键盘的静音科技是如何实现的
c. 一键多设备切换:我用罗技FLOW技术让工作效率翻倍的小技巧
d. 30天续航不是梦:罗技键盘背后的节能技术大揭秘
e. 人体工学设计背后的故事:罗技ERGO K860如何拯救我的腕隧道综合症
- 洞察 / Insight:获取开放性的消费者需求
I am the General Manager of LV (Louis Vuitton) Shanghai. What feedback do customers have about the in-store experience at our Shanghai LV boutiques? What areas need improvement, and what aspects are working well that we should continue to enhance? Please give me a holistic report.
- 共创 / Co-create:与消费者共同创造新的商业想法
和一线城市的年轻父母,一起共创Mars的<脆香米>的新产品想法?
- 规划 / Planning:按照市场需求进行商业规划
INAH 银那无醇葡萄饮市场营销策划书
欢迎体验atypica.AI
atypica.AI还没有设计好如何商业化,先发布一个「体验版」。
用户可以免费进行3个研究,之后每个请我们一杯咖啡如何 ☕️?
atypica.AI「深入研究」和「企业版」功能
针对产生的研究结果可以继续下钻、追问,触发「深度研究」功能,该功能将在「atypica.AI企业版」上线。这一功能使用户能够将初步分析作为起点,而非终点,从而开启更加深入的探索旅程。当研究人员发现初步结果中的关键洞察时,可以通过特定提示或命令激活深度研究模式,系统将自动展开多层次分析。
「atypica企业版」部分规划能力如下,感兴趣请在头像下面点击「了解企业版」留资。
调用工具能力
- 多模态内容分析、洞察(文字、图、视频、富文本等)
- 更强的报告推理能力
- 针对报告内容进行深度下钻研究
- 定制化报告结构设计
调用数据能力
- 接入企业私有数据(通过DAM)
- 接入抖音
- 接入互联网
- 接入海外社媒平台(Ins、FB、TT等)
权限安全管理
- 团队协作功能(分享、协作)
- 数据安全功能(指定可见、有效期)
atypica.AI也可以用在个人场景
虽然atypica.AI是以商业研究分析的智能体,但是也可以进行一些个人决策研究,下面👇是我们的小伙伴千奇百怪的问题:
- 开放问题:
为生日晚餐选合适的中餐餐馆?
- 选择问题:
便携式显示器该怎么选?
- 规划问题:
游泳特长生,该怎么规划去美国或英国读高中?
atypica.AI的局限性
- 输入问题的质量:输入问题的准确度,很大程度上决定了报告的质量;
- 模型精确度局限:斯坦福的研究中表明这种方法可以80%准确模拟消费者的复杂决策过程,对高度情感化或情境依赖的决策预测有局限,对新兴小众消费群体的模拟不够准确(合成橙汁还是和天然橙汁不一样);
- 数据整合复杂性:数据质量和结构差异大,整合难度高,数据干净度问题可能导致模型扭曲;这种方法更善于模拟用户的正向和负向反馈,但是不擅长模拟用户的偏见和局限。
- 创新性预测困难:难以预测真正突破性的创新反应。
atypica.AI的缘起
多智能体:
2023年,斯坦福小镇的论文(《Generative Agents: Interactive Simulacra of Human Behavior》)让我们第一次见识了多智能体互动的概念,但是这篇文章并没有真正的展示智能体是如何进行交互的;
注:斯坦福小镇研究团队《Generative Agents: Interactive Simulacra of Human Behavior》
语言模型为主观世界建模:
2024年11月,斯坦福小镇研究团队发表了题为《Generative Agent Simulations of 1,000 People》的开创性论文,该研究成功模拟了1000个随机美国人的行为模式。研究人员通过AI对真实人类进行深入采访,构建了能够准确反映个体行为和决策模式的智能体。令人瞩目的是,这些智能体与真人的行为一致性高达85%以上,展现出前所未有的模拟精度。
这项研究揭示了智能体模拟真实人类行为和进行有效访谈的巨大潜力。我们可以用一个比喻来理解其创新之处:传统研究用户(如同研究橙汁)的方法是分析其组成元素(标签),但即使掌握了全部标签,也难以完整重构用户的复杂性。而这种新方法则相当于将橙汁提炼为精华粉末,再通过语言模型作为"水"将其重新冲调成橙汁。
虽然这种「合成橙汁」并非完全天然,但它尽量模拟了真实橙汁的口感、色彩和营养特性。这种方法突破了传统用户画像中简化、标签化的局限,转而采用更为丰富、语境化的方式来建模人类的主观世界,为我们理解和预测人类行为提供了崭新视角。
注:斯坦福小镇研究团队《Generative Agent Simulations of 1,000 People》
让模型调用工具:
2023年12月,OpenAI发布了GPT-4的Function Calling功能,让模型能够调用外部工具;2024年11月,Claude的MCP协议,让我们看到了模型操作工具(比如我们做的内容管理工具)的可能性。这种技术进步开创了全新的应用场景,使模型不再局限于对话框内的交互,而是能够主动与外部世界建立连接。例如,模型现在可以浏览小红书,自主发掘有趣的内容,筛选潜在的热点话题,甚至能够分析内容表现和用户反馈。
发散优先的长推理模型:
2025年2月,Deepseek R1让我们看到透明的推理过程,因此知道了怎么来设计在基座模型基础上的推理架构。与针对客观世界 / 科学问题的推理方法强调“收敛”不同,主观世界 / 商业问题的推理需要强调“发散”。我们定义为四个维度:
1)学习过去的案例
2)灵光乍现
3)反馈的质量
4)迭代的数量
因此我们基于这四个维度,开始进行多步骤、长发散的推理模型架构“Creative Reasoning”的开发,从而形成对通用商业问题思考、分析、研究的调优;
多智能体的产品形态:
2025年3月,Manus、Claude的Artefacts、Devin的发布,让我们看到了多智能体产品设计的可能性。尤其是Manus在如何把智能体工作过程表达出来,并可以进行回放上的产品创新。看到智能体如何工作,确实可以让人对其产生的结果更有同理心。
注:Claude的Artefacts
注:Manus
atypica.AI的皮肤:
来自于代表极客精神的快乐嬉皮鬼社区HippyGhosts.io,每一个「智能体」的物理化身都是一枚「hippy ghost」。
体验地址:https://atypica.ai/