谷歌利用人工智能来推动搜索,显示出其组织信息的方式存在问题

news2025/1/13 10:22:30

谷歌利用人工智能来推动搜索,显示出其组织信息的方式存在问题

从相关文件到新闻报道、商业、音乐和社会互动,世界上的大部分信息现在都在网上。谷歌成立于1998年,其使命是“组织世界上的信息,使其普遍可用和有用”,它是我们接触知识和文化洪流的方式。

2024年4月,谷歌的搜索引擎占据了加拿大搜索市场90%的份额。对于学者来说,其专门的Google Scholar和Google Books是我们研究生活的支柱。

然而,尽管谷歌搜索是必不可少的基础设施,但谷歌自己正在以破坏社会的方式肆无忌惮地破坏它,这需要强有力的监管反应。

一次搜索

5月14日,谷歌宣布将对其核心搜索网站进行改造,为生成式人工智能内容提供一个中心位置,目标是“重塑”搜索。该公司首批推出的产品之一是AI Overviews,这是一款聊天机器人,它使用大型语言模型(LLM)对问题做出听起来很权威的回答,而无需用户点击到另一个网站。

在这里插入图片描述

OpenAI于2022年11月推出ChatGPT,点燃了生成式人工智能的热潮。但到目前为止,大多数用户应该意识到,llm驱动的聊天机器人是不可靠的信息来源。这是因为它们仅仅是高性能的模式识别机器。它们为响应查询而生成的输出是通过概率生成的:图像的每个单词或部分是根据它在其数据库中类似图像或短语中出现的可能性来选择的。

明确地说,LLMs不是一种人工或其他形式的智能。他们不能“推理”。对于LLMs来说,唯一的真理是其数据库内容之间的相关性。

这就是为什么当AI Overview用户开始报告谷歌告诉他们,除其他外,要在披萨酱中添加“大约1/8杯无毒胶水”以防止奶酪从披萨上滑落,地质学家建议人们每天吃一块小岩石,以及没有非洲国家的名字以字母K开头时,这既有趣又完全可以预见。

这些都不是报告错误信息意义上的“错误”。AI Overviews正在做LLMS一直在做的事情:根据数据库中的内容报告统计上可能的文本或图像链接。他们不会,也不可能评估真理的主张。

在这一连串的嘲讽之后,谷歌最终承认了这些批评。尽管它声称它将致力于改进人工智能概述,但LLMs作为统计机器的本质可能意味着,正如《连线》杂志所说,“人工智能概述总是会被打破。”

尽管这些故事很有趣,尽管谷歌做出了反应,但它们也提出了令人不安的问题,即我们依赖一家公司来提供我们过去委托给公共图书馆的服务:组织世界上的信息并使其易于获取。

剧烈的影响

谷歌搜索有两个根深蒂固的根本缺陷,随着它们的影响变得越来越严重,它们正变得越来越难以忽视。

首先,谷歌对广告收入的依赖导致它为了向用户提供付费广告而牺牲了自己的搜索功能。观察人士早就注意到,谷歌在搜索引擎中优先考虑付费广告的做法,对用户来说是一个更糟糕的产品,因为它优先考虑了广告商和谷歌的利益。

这种对广告的关注也对整个(广告驱动的)知识生态系统产生了连锁反应,因为它使谷歌与依靠谷歌搜索来帮助潜在读者找到他们的媒体公司直接竞争广告收入。

这种冲突是加拿大联邦政府有争议的《在线新闻法案》(Online News Act)的主要理由,该法案要求谷歌和Meta等公司就向加拿大新闻媒体机构付款进行谈判。这种冲突只会变得更糟:像AI Overview这样的产品显然是为了确保用户花更多的时间在谷歌上,而不是点击到底层网站。

人们较少认识到的是,谷歌获取知识的方式本身,导致了它对搜索结果的准确性和真实性的不计后果的漠视。谷歌和硅谷的许多公司都认同一种被荷兰媒体学者约瑟•范•迪克(jossour van Dijck)称为“数据主义”的意识形态:相信数据可以为自己说话,可以在不参考任何外部背景的情况下进行解释。

正如我和我的合著者娜塔莎·图西科夫(Natasha Tusikov)在我们的书《新知识:信息、数据和全球权力的重塑》(The New Knowledge: Information, Data and reaking of Global Power)中所探索的那样,对数据主义者来说,相关性等同于真理。这是一种反科学的世界观,它忽视了有效性(我们如何知道某件事是真的?)和可靠性(我们能复制结果吗?)的基本科学方法标准。

在这里插入图片描述
“相关性即真理”的理念是谷歌搜索算法的核心。简单地说,搜索结果不是客观的:Google搜索根据它们的受欢迎程度对(非付费)结果进行排名,这取决于链接到它们的页面的数量和数量。请注意,这种受欢迎程度的竞赛与图书管理员在为图书馆选择图书并将其分类到卡片目录中所使用的专家判断是非常不同的。

获取知识

不得不依赖于一个腐败的知识组织过程所造成的社会损害是很难夸大的。获得可靠的知识对社会的每个部分都至关重要。谷歌对广告的依赖和数据主义意识形态已经把它推向了积极破坏我们的知识生态系统的地步。

这种破坏需要严格的监管反应。坦率地说,谷歌搜索需要由具有图书馆员道德的人来运营,而不是由技术兄弟来运营。

为了实现这一目标,政府需要为搜索建立最低限度的可接受标准,以确保它产生足够高质量的结果。这些标准应该包括禁止广告和搜索结果之间的联系,以及使用搜索数据来推动个性化广告。

此外,搜索公司和所有全球平台都需要置于国内民主监督之下,但在与志同道合的民主国家协调下,保持跨境互操作。

这些步骤都不容易。但是,除非我们同意继续将世界信息的组织委托给一家不计后果的、以利润为导向的公司,而这家公司并不认为发布一款告诉人们吃石头有益健康的产品有什么问题,否则我们别无选择,只能让谷歌就义。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1817239.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

UML相关2

内容 说明 用例编号 UC-1 用例名称 客户注册 用例说明 客户参与者通过注册获得进入彬使用系统的权限 参与者 客户 前置条件 无 后置条件 系统正确接收用户信息并保存到数据库 基本路径 发布注册申请系统显示注册页面客户填写相应信息并提交注册成功后可以进行其…

PCL 点云最小二乘法拟合圆(二维)

文章目录 一、简介二、实现代码三、实现效果参考资料一、简介 不同于之前的迭代法,这里利用点到中心的平方长度和圆的平方半径之间差值进行拟合,误差模型如下所示: 基于E的梯度为零最小化误差模型,关于 r 2 r^2 r

C语言详解(预编译)

Hi~!这里是奋斗的小羊,很荣幸您能阅读我的文章,诚请评论指点,欢迎欢迎 ~~ 💥💥个人主页:奋斗的小羊 💥💥所属专栏:C语言 🚀本系列文章为个人学习…

【vue-8】记事本案例

小知识点&#xff1a; 列表末尾插入数据&#xff1a; list.push("lihua") 列表删除数据&#xff1a; # index要删除数据的索引值&#xff0c;1为删除数据长度 list.splice(index,1) 完整示例代码&#xff1a; <!DOCTYPE html> <html lang"en&quo…

Leetcode刷题笔记10

14. 最长公共前缀 14. 最长公共前缀 - 力扣&#xff08;LeetCode&#xff09; 首先&#xff0c;检查边界条件 如果输入的字符串数组为空&#xff0c;直接返回空字符串。 然后使用minmax_element函数找到数组中字典序最小和最大的字符串。 因为公共前缀一定会出现在字典序最…

Python:基础爬虫

Python爬虫学习&#xff08;网络爬虫&#xff08;又称为网页蜘蛛&#xff0c;网络机器人&#xff0c;在FOAF社区中间&#xff0c;更经常的称为网页追逐者&#xff09;&#xff0c;是一种按照一定的规则&#xff0c;自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字…

用 KV 缓存量化解锁长文本生成

很高兴和大家分享 Hugging Face 的一项新功能: KV 缓存量化 &#xff0c;它能够把你的语言模型的速度提升到一个新水平。 太长不看版: KV 缓存量化可在最小化对生成质量的影响的条件下&#xff0c;减少 LLM 在长文本生成场景下的内存使用量&#xff0c;从而在内存效率和生成速度…

.net 调用海康SDK以及常见的坑解释

📢欢迎点赞 :👍 收藏 ⭐留言 📝 如有错误敬请指正,赐人玫瑰,手留余香!📢本文作者:由webmote 原创📢作者格言:新的征程,我们面对的不仅仅是技术还有人心,人心不可测,海水不可量,唯有技术,才是深沉黑夜中的一座闪烁的灯塔 !序言 在工控领域,很多时候需要…

【博士每天一篇文献-算法】Progressive Neural Networks

阅读时间&#xff1a;2023-12-12 1 介绍 年份&#xff1a;2016 作者&#xff1a;Andrei A. Rusu,Neil Rabinowitz,Guillaume Desjardins,DeepMind 研究科学家,也都是EWC(Overcoming catastrophic forgetting in neural networks)算法的共同作者。 期刊&#xff1a; 未录用&am…

.NET MAUI Sqlite数据库操作(一)

一、安装 NuGet 包 安装 sqlite-net-pcl 安装 SQLitePCLRawEx.bundle_green 二、配置数据库&#xff08;数据库文件名和路径&#xff09; namespace TodoSQLite; public static class Constants {public const string DatabaseFilename "TodoSQLite.db3";//数据库…

ModuleNotFoundError: No module named ‘MySQLdb‘

python项目运行遇到报错&#xff1a;ModuleNotFoundError: No module named ‘MySQLdb’ 解决办法 1、安装依赖 pip install pymysql2、新增配置 在项目的__init__.py文件中添加以下代码即可解决。 import pymysql pymysql.install_as_MySQLdb()

tim定时器 输入捕获模式下 TIM–ICStructinit(TIM–ICStructinit) 这个值 解析

主要需要看着图来理解 1.这是stm中文手册的图 2.这是解析 我觉得写的不错 注&#xff1a;有个很坑的地方 我觉得是stm32中文手册的问题 他写的解释只写了tim输入2 3 4和ic1 2 3 4&#xff0c;少写了一个输入1 第一次看见很不好理解

vue2动态路由实现

实现一个简单的动态路由&#xff1a; 1、先定义菜单页面组件的结构&#xff0c;使用的是elementUI的NavMenu 导航菜单 <template><div><el-menu default-active"1" router><el-submenu :index"item.path" v-for"item in menu_…

Android14音频进阶之CarAudioManager::getOutputDeviceForUsage流程分析(七十七)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒体系统工程师系列【原创干货持续更新中……】🚀 优质视频课程:AAOS车载系统+AOSP…

C数据结构:排序

目录 冒泡排序 选择排序 堆排序 插入排序 希尔排序 快速排序 hoare版本 挖坑法 前后指针法 快速排序优化 三数取中法 小区间优化 快速排序非递归 栈版本 队列版本 归并排序 归并排序非递归 ​编辑 计数排序 各排序时间、空间、稳定汇总 冒泡排序 void Bub…

嵌入式linux系统中设备树的经典使用方法

第一:设备树简介 大家好,今天主要给大家分享一下,如何使用linux系统里面的设备树,详细分析如下。 可以参考的官方文档有: 官方文档(可以下载到 devicetree-specification-v0.2.pdf): https://www.devicetree.org/specifications/ 内核文档: …

MNIST手写字符分类

MNIST手写字符分类 文章目录 MNIST手写字符分类1 数据集2 模型构建3 训练4 模型保存5 推理6 模型导出7 导出模型测试 1 数据集 MNIST手写字符集包括60000张用于训练的训练集图片和10000张用于测试的测试集图片&#xff0c;所有图片均归一化为28*28的灰度图像。其中字符区域为白…

LabVIEW水箱液位控制系统

介绍了如何使用LabVIEW软件和硬件工具开发水箱液位控制系统。系统集成了数据采集、实时控制和模拟仿真技术&#xff0c;展示了高精度和高可靠性的特点&#xff0c;适用于需要精细水位调节的工业应用。 项目背景 在制造和化工行业&#xff0c;液位控制是保证生产安全与效率的关…

第3章 Unity 3D着色器系统

3.1 从一个外观着色器程序谈起 新建名为basic_diffuse.shader的文件&#xff0c;被一个名为basic_diffuse.mat的材质文件所引用&#xff0c;而basic_diffuse.mat文件则被场景中名为Sphere的game object的MeshRenderer组件所使用。 basic_diffuse.shader代码文件的内容如下所示…

51.Python-web框架-Django开始第一个应用的增删改查

目录 1.概述 2.创建应用 创建app01 在settings.py里引用app01 3.定义模型 在app01\models.py里创建模型 数据库迁移 4.创建视图 引用头 部门列表视图 部门添加视图 部门编辑视图 部门删除视图 5.创建Template 在app01下创建目录templates 部门列表模板depart.ht…