遗忘曲线告诉我们,绝大部分新掌握的知识约在一周后被遗忘,一个月左右基本忘光。「好记性不如一个烂笔头」,借助AI还真能做出这样「烂笔头」。
提升个人的记忆力-个人搜索引擎
个人搜索引擎的想法是一个强大而诱人的想法。如果有一个应用程序可以了解我的会议、我的任务、我的浏览器历史记录、我的电子邮件和其他所有内容,并帮助我梳理它以找到我关心的东西,那会怎样?听起来超级有帮助!
也许是年纪大了容易忘事,对个人信息的记录非常感兴趣,我的母亲已经九十岁了,她有一句常挂在嘴边的话,“好记心不如烂笔头”,她保留了许多的笔记本,有什么事情都记下来,包括家里的开支,电脑中邮件,微信的各种口令,用户名。同事,亲戚的电话号码,吃什么药,怎么吃等等。家里的东西放在哪里也都记录下来。
但是,使用笔记本记录事件毕竟是费劲的事情。不可能记录太多的事情。当chatGPT 出现后,我的第一个反应就是十分能够为老人做一个AI 的记事本呢?尽可能地自动记录个人事件。
其实,个人信息的记忆的作用远不止笔记本。它的功能具有想象空间非常大,比如你的购物喜好,你购买的牙膏,运动鞋品牌是那些?本质上,个人信息的记忆是构建了个人信息模型(personal information model),个人转变成为一个“数字孪生”,可以以数字人的方式融入数字化社会。在AI 的支撑下,利用个人信息模型可以带来便捷,让生活更加美好,例如你发现牙膏没有了,可以告诉AI助手,帮我买一个牙膏。AI能够根据你个人信息模型中的记录,自动到你喜欢的网络店铺,购买一支你喜欢的牙膏。在线购物时,能够比较精准地为你匹配合适的商品。当你购买一种药物时,AI 助手可以根据你过往的身体状况,吃药,看病记录,给你一些辅助的建议。
我的初步尝试
尽管我是一个AI 菜鸟。但是还是尽力地做了一些记录个人信息模型的尝试性实验。
基于RAG 技术
第一步,我编写了一个个人自传,记录了个人的基本信息,爱好,教育和工作精力。然后利用RAG技术,将个人信息存储在矢量数据库中,在个人与AI对话时,从矢量数据库中个人信息的内容。
第二步,不断地插入个人的信息的文本中(Recording.txt) .通过RAG 读入矢量数据库。
这种方式的缺点是每次都要读入Recording.txt 生成vector_retriver>
两种方法实验下来的结果并不理想。某些简单的记录不能提取出来。 另外一个问题是个人的称谓,是姓名,还是“我”。有时后会搞混。比如:
记录:我是姚家湾
记录:姚家湾爱吃西瓜
提问: 我爱吃西瓜吗?
AI回答:不知道
基于memory
另一种方法是利用langchain的记忆功能(memory),永久性地将我与AI 的对话记录在基于矢量数据库的memory 中。对话时,将相关的chat_History 读出来。
这种方法也并不理想,因为与chatbot 对话中包含了大量没有必要记忆的内容。他们扰乱了AI的信息提取。
估计不能用这些现成的方法,需要另辟蹊径。在本文的后面,我将谈一些其它的方法。
微软AI PC 和苹果AI的重点都是个人
微软Build 开发者前瞻大会中,推出了 Windows 11 Recall 全新工具,它能记录你在电脑上看到和做过的所有事情,并能让你搜索和检索你在设备上做过的任何事情。
6 月 11 日消息,苹果公司在今天召开的 2024 年度 WWDC 全球开发者大会上,正式宣布“苹果智能”(Apple Intelligence),将会为 iPhone、Mac 等设备提供一系列 AI 功能。,给人印象深刻的也是个人信息记录和提取技术。
由此看来,IT 巨头几乎都在个人信息方面发力,也可以看出,在终端设备上构建本地个人信息模型在AI时代的重要地位。这种服务即将成为一个大产业。
其它一些AI 项目
Rewind- 赋予人类超能力
Rewind是去年为Apple Silicon驱动的Mac推出的一款应用程序。它会记录您在计算机上所做的一切(例如,一切),并为您提供您参加过的每次会议、访问过的每个网站以及您在计算机上键入或单击的所有内容的时间表。
该公司的落脚点是接受你的 ChatGPT 提示——比如“我上周五做了什么”——并首先查询你的 Rewind 数据库以获取相关信息列表。然后,该信息以文本形式发送到 OpenAI 的 ChatGPT 服务器。
Rewind的“你生活的搜索引擎”一直是一个有争议的想法,尽管Siroker说越来越多的人一直在出现。随着模型变得越来越好,随着我们的数字生活变得越来越分散和复杂,我们将需要工具来帮助我们理解这一切。事实上,Siroker 说,几个月来,Rewind 用户一直在呼吁 ChatGPT 集成。“我们拥有最有价值的数据,可以用来帮助回答问题,”他说。“他们有一个了不起的模型,可以帮助你进行推理并回答它们。只要我们能在隐私和便利之间取得适当的平衡,我认为我们这里就有一个杀手级产品。
简单的一个问题“我今天早上干了什么”,Rewind就能准确的输出我今天早上在Mac上所做的所有事情,并加以分析。如果愿意的话,甚至还可以让Rewind AI给你的一天打个分。这给我的感觉就像是,一个助理24小时坐在电脑旁边盯着你的屏幕一样,令人有点“不寒而栗”。
Rewind的野心绝不止于做“第一款App”,它还要做“第一款硬件”,也就是令我起笔这篇文章的,Rewind最近带来的一款新产品:Rewind Pendant。
Rewind Pendant 是一款可穿戴设备,可以捕捉您在现实世界中所说和听到的内容,然后将其转录、加密并完全存储在您的手机本地。
通过 Pendant,Rewind 成为一种个性化人工智能,真正由您所看到、所说或听到的一切提供支持。
lindy
除了 Rewind 之外,还有 Lindy,这是一款 AI 助手,首席执行官 Flo Crivello 将其描述为“ChatGPT 可以访问您的所有应用程序”。像 Mem 和 Notion 和 Reflect 这样的笔记应用程序已经在集成大型语言模型 (LLM)。 谷歌和 Microsoft,这两家公司可能比其他任何公司都更能访问我们的个人数据,他们肯定正在研究 LLM 如何能够并且应该与你的私人内容进行交互。不管你喜不喜欢,聊天机器人都是来找你的东西的。
背后技术的猜想
网络上没有关于rewind 如何实现技术。我将会继续实验下去。我估计要有一个独立的数据库。传统数据库中能够存储更多的信息,比如时间,消息的类型等等。然后将数据库通过vector 数据库构建与chatGPT 的接口。也就是说,除了信息之外,还需要meta information。这样产生的信息可能更加准确。
消息类型包括个人信息,教育,工作简历,社会关系,个人爱好,购物偏好,活动,思想观点等等。利用AI 的function call 存储相关主题的信息和调用相关的信息。利用结构化数据库精确地存储信息。
这种方式可能要比简单的vector 数据更加精准一些。
本质上我们要建立个人信息模型(personal information model)。利用AI 存取!
结束语
读者有什么建议,欢迎给我提示。