论文AI率:检测原理是什么?该如何降低论文AI率?

news2025/1/17 17:30:02

我是娜姐 @迪娜学姐 ,一个SCI医学期刊编辑,探索用AI工具提效论文写作和发表。

图片

上一篇介绍了10个检测AI率的在线工具。本篇来说说AI率到底是如何检测出来的?该如何有效降低论文的AI率?

和AI大模型一样,AI检测的核心也是机器学习模型,它们在包含人类创作和AI生成文本样本的大型数据集上进行训练,通过学习每种文本中存在的模式和特征,以此来区分人类创作的文本和AI生成文本。

AI检测器查找的一些关键特征包括:

单词分布和重复性:

与人类写作相比,AI语言模型有时会过度使用某些单词或短语,使得单词频率分布显得不自然。比如,之前有个调查,pubmed数据库中自2023年以来,delve into的使用频次剧增,而这个词组正是ChatGPT的使用偏好之一。



此外,在同行评审中,某些词语(如“commendable值得称赞的”、“meticulous细致的”和“intricate复杂的”)的使用频率发生了显著变化。

详见:斯坦福最新研究:ChatGPT除了写论文,竟有17%的同行评审也是AI生成。


2 连贯性和逻辑性

虽然AI生成的文本在语法上可能是正确的,但它有时可能缺乏人类写作所自然具备的深层次语义理解、逻辑连贯性。比如,中文写作中出现的“首先、其次、然而、并且”等读起来很生硬的转折和连词。

逻辑性方面,有时候AI生成的文本并不具备意思上的因果关系,也就是它在“一本正经的胡说八道”。需要人类来确认这些内容的合理性。


3 创造力和原创性的局限:

在人类擅长的创造性隐喻、类比或提出真正新颖的观点方面,AI生成的内容逊色很多,因为这些内容超出了它的训练数据范畴。


4 内容的可预测性和困惑度:

这个检测指标是说,比如困惑度分数这样的统计指标可以反映一段文本内容的可预测性或意外性。与AI生成的文本相比,人类写作往往更加多样化和充满惊喜。而AI生成的文本则会显得很平淡和稍显乏味。


5 句子结构的单一性:

人类作者的文本在句子长度和结构上表现出更大的变化性,比如长句短句结合,各种语气的句子结合,而AI生成的文本则可能较为单一。


6 风格和语调一致性:

人类作者的写作通常风格、语调和语气在一篇文章中是一致的,而AI生成的文本则可能在同一篇文章中会出现风格上的突然转变。

AI检测工具的可靠性如何?

我在对比那10款AI检测工具的时候就发现,同样的一段文本内容,不同的工具显示出的AI率有很大差异。其实最早ChatGPT也生产过一款AI检测工具,后来下架了,因为它也发现测不准。

因为,一方面,AI能够生成文本也是在大量人类文本预训练的基础上获得的,只要提示语用得好,它可以无限接近人类风格。比如我的课程中的“论文润色提示语”,AI检测率为0.

另一方面,它也可能出现误报。一个精心润色、结构化的人类写作文本,可能因为其完美无瑕的特性而被错误标记为AI生成。

此外,AI检测器需要不断追赶快速发展的生成AI技术。随着AI模型变得更加先进,曾经容易识别的机器生成内容现在越来越接近人类的个性化特征,AI文本检测器的可靠性在很大程度上取决于检测算法的持续开发和改进。


如何有效降低论文的AI率?

1 使用更精细化的提示语prompt:

简单的改写可能不足以绕过AI检测器,它们能够识别出典型的生成式AI的模式。

但是,使用更加精细化的提示语,让AI更深度的在句子结构、语法、风格上模仿并生成人类语言,从而更贴近人类写作风格。

2 混合数据来源:

从多个多样化的来源获取数据或研究内容,可以有效地掩盖AI检测工具追踪的数字足迹。

数据来源的多样性不仅丰富了内容的真实性和复杂性,而且让AI检测器更难检测。

3 增强人类元素:

即使是使用AI写作工具,融入独特的人类洞察力和经验也至关重要。

为了降低AI检测率,尝试将你的个人独特风格融入写作,比如:独特语气语调,展示细节的真实生活的例子。

4 融入习语语言:

AI生成的内容往往缺乏人类写作中特有的习语、行话和口语表达。通过融入口语和地区习语,让你的内容显得更真实、更易于得到人类的认同。

5 在修改过程中使用AI检测器:

这种预防性检测,帮助你找出容易被标记为AI生成的文本元素,比如某些重复的模式或不自然的措辞。然后再通过重构句子、改变词序、替换同义词和重组段落的方式,来针对性降低AI率。

6 持续跟踪AI技术的发展:

随着AI能力的增长,检测此类内容的技术也在不断发展。持续保持对AI进展的关注,可以有效提升你利用AI的创作效率,并避免AI检测过高。

随着AI大模型的不断进化,这些AI检测工具也需要不断改进。

AI大模型和AI检测工具的具备竞赛在不断升级。对于我们人类创作者来说,跟上技术的进展,左右大模型,右手检测工具,让这些效率工具都为“我”所用,提升论文产出效率和质量,就对了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1668091.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数据结构与算法】递归

// 计算 1-100 累加 function add(a, b) {return a b ? a : add(a, b - 1) b }console.log(add(1, 100))// 计算阶乘 function factorial(n) {return n < 1 ? 1 : n * factorial(n - 1) }console.log(factorial(5)) // 120理论上所有递归都可以用循环实现。 注意防止栈…

电商技术揭秘营销相关系列文章合集(4)

相关系列文章 电商技术揭秘相关系列文章合集&#xff08;1&#xff09; 电商技术揭秘相关系列文章合集&#xff08;2&#xff09; 电商技术揭秘相关系列文章合集&#xff08;3&#xff09; 文章目录 引言集合说明集合文章列表 引言 在数字化浪潮的推动下&#xff0c;电商行…

数据可视化第五天(读取文件获得男生女生身高信息,并且可视化在一个图像)

文件 需要学生文件的可以私信我 过程 利用numpy的loadtxt文件读取学号&#xff0c;性别&#xff0c;和身高。 import numpy as np import matplotlib.pyplot as pltfilename/Users/oommnn/Desktop/python学习/数据分析/网课资料/第04天/student-data.txtuser_infonp.dtype(…

哈希表Hash table

哈希表是根据关键码的值而直接进行访问的数据结构。 数组就是⼀张哈希表。 哈希表中关键码就是数组的索引下标&#xff0c;然后通过下标直接访问数组中的元素&#xff0c;如下图所示&#xff1a; 那么哈希表能解决什么问题呢&#xff0c;一般哈希表都是用来快速判断⼀个元素是…

车载测试:为什么你投十份简历,只有一两家公司约你?

最根本的原因&#xff0c;就是一方在汲汲渴求&#xff0c;而恰恰另一方呈现出的关键点让其怦然心动。求者心中有所想&#xff0c;而应者恰恰展现了求者所想的那一面。这就是个中奥妙。 程序员在找工作时&#xff0c;在一开始有三件事情会对能否获得面试机会至关重要&#xff1…

适合优化yaml文件编辑效果的.vimrc简单配置

yaml文件编辑最重要的就是缩进对齐&#xff08;一个tab键对应2个空格&#xff09;&#xff0c;最后加上添加横&#xff0c;纵线的效果 某xx.yaml文件或者xx.yml在vim编辑器中效果如图所示&#xff1a;&#xff1a; 简单的~/.vimrc文件配置内容&#xff1a; vim ~/.vimrc set…

【进程通信】了解信号以及信号的产生

文章目录 0.前言1.信号的基本概念1.1中断1.1.1 软中断1.1.2硬中断 1.2异步1.2.1异步和同步的比较 2.信号的主要用途3.信号的特点4.查看信号4.1Core和Term的区别4.2生成Core文件 5.初识捕捉信号5.1signal函数 6.产生信号的方式6.1.通过终端按键产生信号6.2.调用系统函数向进程发…

手撕C语言题典——反转链表

目录 前言 一.思路 1&#xff09;创建新链表 2&#xff09;创建三个指针 二.代码实现 搭配食用更佳哦~~ 数据结构之单单单——链表-CSDN博客 数据结构之单链表的基本操作-CSDN博客 前面学了单链表的相关知识&#xff0c;我们来尝试做一下关于顺序表的经典算法题~ 前言 反转…

新能源行业网间数据交换,更好用更专业的工具是什么?

新能源行业涵盖了多个方面&#xff0c;包括但不限于新能源汽车、可再生能源技术等。新能源行业发展具有重要的意义&#xff0c;新能源企业的研发数据极其重要&#xff0c;为了保障网络安全和数据安全&#xff0c;许多新能源企业采用逻辑隔离的方式进行网络隔离&#xff0c;此时…

llama3 发布!大语言模型新选择 | 开源日报 No.251

meta-llama/llama Stars: 53.0k License: NOASSERTION llama 是用于 Llama 模型推理的代码。 提供了预训练和微调的 Llama 语言模型&#xff0c;参数范围从 7B 到 70B。可以通过下载脚本获取模型权重和 tokenizer。支持在本地快速运行推理&#xff0c;并提供不同规格的模型并…

基于STM32的IIC通信

IIC通信 • I2C&#xff08;Inter IC Bus&#xff09;是由Philips公司开发的一种通用数据总线 • 两根通信线&#xff1a;SCL&#xff08;串行时钟线&#xff09;、SDA&#xff08;串行数据线&#xff09; • 同步&#xff0c;半双工 • 带数据应答 • 支持总线挂载多…

TCP(TCP客户端、服务器如何通信)

一、TCP介绍 TCP的特点&#xff1a; 面向连接的协议&#xff1a;TCP是一种可靠的、面向连接的协议&#xff0c;在通信之前需要建立连接&#xff0c;以确保数据的可靠传输。这意味着在传输数据之前&#xff0c;发送方和接收方之间需要建立一条可靠的连接通道。流式协议&#x…

第 1 天_二分查找【算法基础】

第 1 天_二分查找 前言34. 在排序数组中查找元素的第一个和最后一个位置题解官方33. 搜索旋转排序数组题解官方74. 搜索二维矩阵 前言 这是陈旧已久的草稿2021-11-09 19:33:44 当时在学习数据结构&#xff0c;然后再LeetCode上找了一个算法基础。 但是后来又没做了。 现在20…

WEB后端复习——监听器、过滤器

Listener监听器 是Servlet规范中定义的一种特殊类&#xff0c;它用于监听web应用程序中的ServletContext, HttpSession和ServletRequest等域对象的创建与销毁事件&#xff0c;以及监听这些域对象中的属性发生修改的事件。 注解WebListener 1.ServletContextListener 监听Serv…

韩顺平0基础学Java——第10天

p202-233 类与对象&#xff08;第七章&#xff09; 成员方法 person类中的speak方法&#xff1a; 1.public表示方法是公开的 2.void表示方法没有返回值 3.speak&#xff08;&#xff09;中&#xff0c;speak表示方法名&#xff0c;括号是形参列表。 4.大括号为方法体&am…

2005-2022年各省居民人均可支配收入数据(含城镇居民人均可支配收入、农村居民人均可支配收入)(无缺失)

2005-2022年各省居民人均可支配收入数据&#xff08;含城镇居民人均可支配收入、农村居民人均可支配收入&#xff09;&#xff08;无缺失&#xff09; 1、时间&#xff1a;2005-2022年 2、来源&#xff1a;国家统计局、统计年鉴 3、指标&#xff1a;全体居民人均可支配收入、…

语言:C#

一、VSCode生成exe 二、

Spring Cloud学习笔记(Nacos):基础和项目启动

这是本人学习的总结&#xff0c;主要学习资料如下 - 马士兵教育 1、基础和版本选择2、启动项目2.1、源码启动项目2.2、命令行启动 1、基础和版本选择 Nacos是用于服务发现和注册&#xff0c;是Spring Cloud Alibaba的核心模块。 根据文档&#xff0c;Spring Cloud Alibaba的版…

ollama离线安装,在CPU运行它所支持的哪些量化的模型

在线安装的链接: Download Ollama on LinuxGet up and running with large language models.https://ollama.com/download/linux 离线安装教程: 下载install.sh: https://ollama.ai/install.sh

算法笔记——数位DP

一、前置知识 1.DP小知识 D P DP DP 是一种算法思想&#xff0c;用递推方程的方式解决问题。但是使用它要满足如下性质&#xff1a; 最优子结构&#xff1a; 子结构优秀&#xff0c;整个就优秀。无后效性&#xff1a;当前决策不会影响后面。 2.DP实现方法 众所周知&#xf…