许多主要新闻媒体正屏蔽 OpenAI 爬虫

许多主要新闻媒体正屏蔽 OpenAI 爬虫

news2026/2/11 4:50:33

自OpenAI的内容生成式人工智能模型面世以来，大量互联网数据成为了不断训练和优化模型的“饵料”，但据路透社研究所的一项调查，有越来越多的新闻媒体已对OpenAI的数据爬取说“不”，在传统媒体领域，这一比例甚至超过了50%。

路透社研究所分析了《纽约时报》、《华尔街日报》、《华盛顿邮报》、CNN、NPR 等多家主流新闻媒体，涵盖美国、英国、德国、印度等10个国家，并将其归为传统印刷媒体（纸媒）、广播电视媒体、数字媒体三大类。研究发现，57%的传统印刷媒体屏蔽了OpenAI 的爬虫程序，广播电视媒体和数字媒体的比例分别为48%和 31%。

研究还发现，屏蔽 OpenAI 的新闻网站比例因国家和地区差异而存在很大不同，在美国，这一比例高达79%，而在墨西哥和波兰仅为 20%。

所研究调查的10个国家新闻媒体对 OpenAI爬虫采取屏蔽措施的比例差异

此外，在屏蔽了OpenAI 爬虫的新闻媒体中，有97%也同样屏蔽了谷歌人工智能的爬虫。

研究揭示了一些新闻媒体不希望他们的内容被人工智能使用，如果人们使用人工智能从网络上获取新闻，这些媒体会认为自己将被抛弃或取代。Gartner 副总裁、杰出分析师安德鲁·弗兰克 (Andrew Frank) 表示：“路透社的研究强调了生成式人工智能面临的一个根本挑战：它依赖于真实的人生成的真实内容，而这些人将其视为对他们生计的威胁。”

与此同时，康奈尔大学最近的一项研究发现，当新的人工智能模型根据先前模型而不是人类输入的数据进行训练时，它们往往会趋向于“模型崩溃”或退化，导致越来越多地生成错误信息。

OpenAI 于去年 8 月初推出了人工智能爬虫，谷歌也于 9 月紧随其后。根据这项研究，一旦这些媒体做出屏蔽决定，恐将很难改变立场对其进行解除。

参考来源：

How many news websites block AI crawlers?

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1476416.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

数仓模型设计方法论

数仓模型设计方法论

在当今大数据时代，数据已经成为企业最重要的资产之一。而数据仓库作为企业数据管理和分析的核心基础设施，其设计方法论对于企业的数据治理和决策分析至关重要。本文将探索数仓模型设计的方法论，帮助读者更好地理解和应用数仓模型设计。一、…

阅读更多...

仿牛客网项目---社区首页的开发实现

仿牛客网项目---社区首页的开发实现

从今天开始我们来写一个新项目，这个项目是一个完整的校园论坛的项目。主要功能模块：用户登录注册，帖子发布和热帖排行，点赞关注，发送私信，消息通知，社区搜索等。这篇文章我们先试着写一下用户的…

阅读更多...

EAP-TLS实验之Ubuntu20.04环境搭建配置（FreeRADIUS3.0）(四)

EAP-TLS实验之Ubuntu20.04环境搭建配置（FreeRADIUS3.0）(四)

该篇主要介绍了利用配置ca.cnf、server.cnf、client.cnf在certs路径下生成证书文件（非执行bootstrap脚本，网上也有很多直接通过openssl命令方式生成的文章），主要参考（概括中心思想）官方手册，以及…

阅读更多...

2024年阿里云2核4G配置服务器测评_ECS和轻量性能测评

2024年阿里云2核4G配置服务器测评_ECS和轻量性能测评

阿里云2核4G服务器多少钱一年？2核4G服务器1个月费用多少？2核4G服务器30元3个月、85元一年，轻量应用服务器2核4G4M带宽165元一年，企业用户2核4G5M带宽199元一年。本文阿里云服务器网整理的2核4G参加活动的主机是ECS经济型e实例和u1…

阅读更多...

安卓之ContentProvider的应用场景以及优劣分析

安卓之ContentProvider的应用场景以及优劣分析

摘要本文旨在对Android开发中的ContentProvider进行深入探讨。ContentProvider是Android系统中四大组件之一，主要用于在不同的应用程序之间共享数据。本文首先对ContentProvider进行概述，然后分析其应用场景，接着对其优势和劣势进行分析&…

阅读更多...

简单模板2（HTML)

简单模板2（HTML)

紧接上回，简单模板2又来了，喜欢赶紧点个赞吧，希望大家喜欢！ 效果图： CODE： <!DOCTYPE html> <html> <head><title>我的第一个网页</title> </head> <body><…

阅读更多...

微信小程序订阅消息前后端示例

微信小程序订阅消息前后端示例

微信小程序的订阅消息， 必须是由弹框，弹框，弹框来调起了，单纯的在页面上调用 wx.requestSubscribeMessage是没有效果的小程序端的代码 <view class"sub" bindtap"dinyuxiaoxi">订阅消息</view>…

阅读更多...

【深度学习】SDXL-Lightning 体验，gradio教程，SDXL-Lightning 论文

【深度学习】SDXL-Lightning 体验，gradio教程，SDXL-Lightning 论文

文章目录资源SDXL-Lightning 论文资源 SDXL-Lightning论文：https://arxiv.org/abs/2402.13929 gradio教程：https://blog.csdn.net/qq_21201267/article/details/131989242 SDXL-Lightning ：https://huggingface.co/ByteDance/SDXL-Light…

阅读更多...

SpringCloud Eureka（注册中心）

SpringCloud Eureka（注册中心）

一、spring cloud简介 spring cloud 为开发人员提供了快速构建分布式系统的一些工具，包括配置管理、服务发现、断路器、路由、微代理、事件总线、全局锁、决策竞选、分布式会话等等。它运行环境简单，可以在开发人员的电脑上跑。另外说明spring cloud是基…

阅读更多...

sql基本语法+实验实践

sql基本语法+实验实践

sql语法注释： 单行 --注释内容# 注释内容多行 /* 注释内容 */数据定义语言DDL 查询所有数据库 show databases;注意是databases而不是database。查询当前数据库 select database();创建数据库 create database [if not exists] 数据库名 [default charset 字符…

阅读更多...

Qt中关于信号与槽函数的思考

Qt中关于信号与槽函数的思考

信号与槽函数的思考以pushbutton控件为例，在主界面上放置一个pushbutton控件，点击右键选择关联槽函数，关联一个click函数，如下图所示： 在该函数中，实现了一个点击pushbutton按钮后，弹出一个窗…

阅读更多...

复制策略深入探讨

复制策略深入探讨

在之前的博客中，我们讨论了复制最佳实践和不同类型的复制，例如批量、站点和存储桶。但是，随着所有这些不同类型的复制类型的出现，人们不得不想知道在哪里使用哪种复制策略？从现有 S3 兼容数据存储迁移数据时&#xff0…

阅读更多...

部署PhotoMaker通过堆叠 ID 嵌入自定义逼真的人物照片

部署PhotoMaker通过堆叠 ID 嵌入自定义逼真的人物照片

PhotoMaker只需要一张人脸照片就可以生成不同风格的人物照片，可以快速出图，无需额外的LoRA培训。安装环境 python 3.10gitVisual Studio 2022 安装依赖库 git clone https://github.com/bmaltais/PhotoMaker.git cd PhotoMaker python -m venv venv…

阅读更多...

借助 Aspose.Words，使用 C#、Java、Python 和 C++ 创建 Word 文档

借助 Aspose.Words，使用 C#、Java、Python 和 C++ 创建 Word 文档

以编程方式创建和操作 Word 文档是许多应用程序的常见要求。幸运的是，有各种编程语言的强大库可以简化此任务。Aspose.Words 就是此类多功能解决方案之一，它是强大的 API，使开发人员能够无缝生成、修改和转换 Word 文件。在这篇博文中&#x…

阅读更多...

tomcat下载安装配置教程

tomcat下载安装配置教程

tomcat下载安装配置教程我是使用tomcat下载安装及配置教程_tomcat安装-CSDN博客此贴来进行安装配置，原文21年已经有些许不同。下载tomcat 官网：http://tomcat.apache.org/ 我们老师让安装8.5以上，所以我直接选择版本9 点击9页面之后…

阅读更多...

定制开发一款家政小程序，应知应会

定制开发一款家政小程序，应知应会

引言在这个快节奏的现代生活中，人们对高效、便捷的家政服务的需求日益增加。随着社会结构的变化和职业生活的繁忙，许多家庭面临着时间不足、精力不济的挑战。在这种情况下，家政服务成为解决问题的有效途径。然而，传统的家政服务…

阅读更多...

SD-WAN助力企业数据传输安全

SD-WAN助力企业数据传输安全

随着企业网络需求的不断增长，SD-WAN成为企业网络组网的首选方案，能够实现多种网络拓扑结构的无缝连接，其中包括总部-分支、总部-分支-数据中心、总部-数据中心、总部-分支-云服务等。如何确保企业数据在传输过程中的安全性成为企业关注的重要…

阅读更多...

微软广告和网络服务CEO承认OpenAI的Sora将加入Copilot,但需要一些时间

微软广告和网络服务CEO承认OpenAI的Sora将加入Copilot,但需要一些时间

事情的起因是一名网友询问 Sora 是否会加入 Copilot，微软广告和网络服务CEO首席执行官——Mikhail Parakhin 回应说：“最终，但这需要时间。”毕竟投了几十个亿美金进去，不亏是金主爸爸。图为Mikhail Parakhin Sora是OpenAI开发的…

阅读更多...

论文设计任务书学习文档|基于智能搜索引擎的图书管理系统的设计与实现

论文设计任务书学习文档|基于智能搜索引擎的图书管理系统的设计与实现

文章目录论文（设计）题目：基于智能搜索引擎的图书管理系统的设计与实现1、论文（设计）的主要任务及目标2、论文（设计）的主要内容3、论文（设计）的基本要求4、进度安排论文（设计）题目：基于智能搜索引擎的图书管理系统的设计与实现 1、论文（设计）的主要任务及目标 …

阅读更多...

03OpenCV图像的掩膜操作

03OpenCV图像的掩膜操作

文章目录掩膜操作提高图像的对比度获取图像像素制作图像掩膜算子防止像素溢出算子全部代码掩膜操作提高图像的对比度红色是中心像素，从上到下，从左到右对每个像素做同样的处理操作，得到最终结果就是对比度提高之后的输出图像Mat对象注&am…

阅读更多...

推荐文章

最新文章