谷歌利用人工智能来推动搜索，显示出其组织信息的方式存在问题

news2026/2/8 16:08:11

谷歌利用人工智能来推动搜索，显示出其组织信息的方式存在问题

从相关文件到新闻报道、商业、音乐和社会互动，世界上的大部分信息现在都在网上。谷歌成立于1998年，其使命是“组织世界上的信息，使其普遍可用和有用”，它是我们接触知识和文化洪流的方式。

2024年4月，谷歌的搜索引擎占据了加拿大搜索市场90%的份额。对于学者来说，其专门的Google Scholar和Google Books是我们研究生活的支柱。

然而，尽管谷歌搜索是必不可少的基础设施，但谷歌自己正在以破坏社会的方式肆无忌惮地破坏它，这需要强有力的监管反应。

一次搜索

5月14日，谷歌宣布将对其核心搜索网站进行改造，为生成式人工智能内容提供一个中心位置，目标是“重塑”搜索。该公司首批推出的产品之一是AI Overviews，这是一款聊天机器人，它使用大型语言模型(LLM)对问题做出听起来很权威的回答，而无需用户点击到另一个网站。

在这里插入图片描述

OpenAI于2022年11月推出ChatGPT，点燃了生成式人工智能的热潮。但到目前为止，大多数用户应该意识到，llm驱动的聊天机器人是不可靠的信息来源。这是因为它们仅仅是高性能的模式识别机器。它们为响应查询而生成的输出是通过概率生成的:图像的每个单词或部分是根据它在其数据库中类似图像或短语中出现的可能性来选择的。

明确地说，LLMs不是一种人工或其他形式的智能。他们不能“推理”。对于LLMs来说，唯一的真理是其数据库内容之间的相关性。

这就是为什么当AI Overview用户开始报告谷歌告诉他们，除其他外，要在披萨酱中添加“大约1/8杯无毒胶水”以防止奶酪从披萨上滑落，地质学家建议人们每天吃一块小岩石，以及没有非洲国家的名字以字母K开头时，这既有趣又完全可以预见。

这些都不是报告错误信息意义上的“错误”。AI Overviews正在做LLMS一直在做的事情:根据数据库中的内容报告统计上可能的文本或图像链接。他们不会，也不可能评估真理的主张。

在这一连串的嘲讽之后，谷歌最终承认了这些批评。尽管它声称它将致力于改进人工智能概述，但LLMs作为统计机器的本质可能意味着，正如《连线》杂志所说，“人工智能概述总是会被打破。”

尽管这些故事很有趣，尽管谷歌做出了反应，但它们也提出了令人不安的问题，即我们依赖一家公司来提供我们过去委托给公共图书馆的服务:组织世界上的信息并使其易于获取。

剧烈的影响

谷歌搜索有两个根深蒂固的根本缺陷，随着它们的影响变得越来越严重，它们正变得越来越难以忽视。

首先，谷歌对广告收入的依赖导致它为了向用户提供付费广告而牺牲了自己的搜索功能。观察人士早就注意到，谷歌在搜索引擎中优先考虑付费广告的做法，对用户来说是一个更糟糕的产品，因为它优先考虑了广告商和谷歌的利益。

这种对广告的关注也对整个(广告驱动的)知识生态系统产生了连锁反应，因为它使谷歌与依靠谷歌搜索来帮助潜在读者找到他们的媒体公司直接竞争广告收入。

这种冲突是加拿大联邦政府有争议的《在线新闻法案》(Online News Act)的主要理由，该法案要求谷歌和Meta等公司就向加拿大新闻媒体机构付款进行谈判。这种冲突只会变得更糟：像AI Overview这样的产品显然是为了确保用户花更多的时间在谷歌上，而不是点击到底层网站。

人们较少认识到的是，谷歌获取知识的方式本身，导致了它对搜索结果的准确性和真实性的不计后果的漠视。谷歌和硅谷的许多公司都认同一种被荷兰媒体学者约瑟•范•迪克(jossour van Dijck)称为“数据主义”的意识形态:相信数据可以为自己说话，可以在不参考任何外部背景的情况下进行解释。

正如我和我的合著者娜塔莎·图西科夫(Natasha Tusikov)在我们的书《新知识:信息、数据和全球权力的重塑》(The New Knowledge: Information, Data and reaking of Global Power)中所探索的那样，对数据主义者来说，相关性等同于真理。这是一种反科学的世界观，它忽视了有效性(我们如何知道某件事是真的?)和可靠性(我们能复制结果吗?)的基本科学方法标准。

在这里插入图片描述
“相关性即真理”的理念是谷歌搜索算法的核心。简单地说，搜索结果不是客观的:Google搜索根据它们的受欢迎程度对(非付费)结果进行排名，这取决于链接到它们的页面的数量和数量。请注意，这种受欢迎程度的竞赛与图书管理员在为图书馆选择图书并将其分类到卡片目录中所使用的专家判断是非常不同的。