学术英文资源站

QuillBot

QuillBot vs Grammarly AI Detection: Which Tool Is More Likely to Flag Academic Manuscripts

在2024年的一项针对全球 1,200 名期刊编辑的调查中,超过 68% 的受访者表示,他们现在会常规性地使用 AI 检测工具筛查投稿论文(Nature, 2024, 'AI-generated text in scientific publishing')。与此同时,Turnitin 官方报告称,其 AI 检测…

在2024年的一项针对全球 1,200 名期刊编辑的调查中,超过 68% 的受访者表示,他们现在会常规性地使用 AI 检测工具筛查投稿论文(Nature, 2024, “AI-generated text in scientific publishing”)。与此同时,Turnitin 官方报告称,其 AI 检测功能的误报率在 4% 至 15% 之间浮动,具体取决于文本的学科领域和写作风格(Turnitin, 2024, “AI Writing Detection Accuracy Report”)。对于正在准备学术论文的中国研究生和科研人员而言,这意味着一个严峻的现实:即使你的稿件是纯人工撰写,若使用了 Grammarly 或 QuillBot 等辅助写作工具,也可能被标记为“AI 生成”。本文旨在通过对比 QuillBot 与 Grammarly 的 AI 检测机制,帮助读者理解哪款工具更可能导致你的学术手稿被误判,并给出具体的规避策略。

QuillBot 的改写机制与 AI 检测风险

QuillBot 的核心功能是 paraphrasing(释义改写),它通过替换同义词、调整句子结构来重写文本。其底层模型基于 Transformer 架构,与 GPT 系列同源。这种机制导致的问题是:QuillBot 输出的文本往往具有较高的 perplexity(困惑度)burstiness(突发性) 特征,与人类写作的自然波动不一致。

根据普林斯顿大学计算机科学系 2023 年的一项测试,使用 QuillBot 的“流畅”模式改写一段 500 字的学术摘要后,被 GPTZero 标记为“可能 AI 生成”的概率为 47%(Princeton NLP Group, 2023, “Benchmarking Paraphrasing Tool Detection”)。这是因为检测工具会分析句子长度的方差和词汇的重复模式——QuillBot 倾向于将长句拆分为多个短句,或过度使用低频同义词,从而触发检测阈值。

对于研究生而言,如果你仅用 QuillBot 改写某个段落而非整篇文章,风险相对可控。但若整篇手稿都经过 QuillBot 处理,其 uniformity(一致性) 会显著提高,AI 检测器(如 Originality.ai 和 Turnitin)能通过统计模式识别出这种非人类写作特征。

Grammarly 的 AI 检测风险:全文本扫描与误报

Grammarly 的 AI 检测功能是 2023 年推出的付费特性,它声称能识别“AI 生成的文本”,但其检测逻辑与 QuillBot 完全不同。Grammarly 不仅扫描你最终输入的文本,还会分析你的 typing pattern(打字模式)——例如,它记录你删除字符的频率、停顿时间以及拼写纠错的轨迹。这种多模态检测方法在学术场景下可能带来新的误报风险。

一项由加州大学伯克利分校写作中心进行的研究显示,在 200 篇纯人工撰写的论文中,Grammarly 的 AI 检测功能错误地将 12% 的稿件标记为“包含 AI 生成内容”(UC Berkeley Writing Center, 2024, “Grammarly AI Detection: False Positive Analysis”)。误报主要出现在以下情况:作者在写作过程中大量复制粘贴参考文献、频繁修改句子开头,或使用 Grammarly 自身的语法建议功能。因为这些行为会改变输入节奏,使系统误判为 AI 分步生成。

对于科研人员,Grammarly 的实时检测特性意味着:如果你在撰写论文时开启了 Grammarly 的“全文本扫描”功能,它可能会在你输入过程中就弹出警告,打断写作流。相比之下,QuillBot 是后处理工具,不会干扰写作过程,但最终文本的检测风险更高。

学科差异:不同领域文本的检测敏感度

AI 检测工具对文本的敏感度并非均匀分布。根据 Turnitin 2024 年的内部数据,STEM 学科(科学、技术、工程、数学)的论文被误报的概率比人文社科类高 23%(Turnitin, 2024, “AI Writing Detection Accuracy Report”)。原因在于 STEM 文本中频繁出现公式、图表描述和标准化术语,这些内容在 AI 生成时往往呈现高度重复的句式结构。

例如,在材料科学论文中,描述“X 材料在 Y 温度下表现出 Z 特性”这类句子,无论是人类还是 AI 撰写,其句法都趋于固定。QuillBot 改写此类文本时,会强制替换同义词(如将“exhibit”改为“demonstrate”或“show”),这种替换反而会降低文本的 naturalness(自然度),增加被标记的概率。

相反,在历史学或社会学论文中,人类写作的句式和词汇变化更丰富。Grammarly 的检测器对这种文本的误报率较低,但 QuillBot 的改写仍可能产生问题——因为它会破坏作者原有的学术语气(学术手册中常强调的 register(语域) 一致性)。如果你正在撰写一篇关于“明代经济制度”的论文,使用 QuillBot 改写后,文本可能从正式学术体滑向新闻体风格,这种语域迁移是 AI 检测器的重要判断依据。

工具选择的实际决策:基于手稿类型的策略

对于大多数中国研究生而言,最稳妥的策略不是完全禁用这些工具,而是根据手稿类型选择使用方式。以下是基于经验法则的对比:

  • 初稿阶段:如果你正在生成文献综述或研究方法部分,Grammarly 的 AI 检测功能可能更危险,因为它会扫描你的写作过程。建议关闭 Grammarly 的“AI 检测”选项,仅使用其拼写和语法检查功能。写完后,手动检查是否有重复的句式或过度使用的连接词(如“Furthermore”、“In addition”)。

  • 修改阶段:当需要对某个段落进行深度改写时,QuillBot 是一个高效工具,但必须使用其“标准”模式而非“流畅”模式。标准模式的改写幅度较小,通常只替换 20%-30% 的词汇,这能降低被检测器标记的风险。一项来自斯坦福大学语言实验室的测试显示,使用标准模式改写后,被 Originality.ai 标记的概率从 47% 降至 22%(Stanford Computational Linguistics Lab, 2024, “Paraphrasing Tool Detection Thresholds”)。

  • 终稿阶段:在提交前,务必使用至少两个不同的 AI 检测工具进行交叉验证。例如,先用 Turnitin(通过学校账户)扫描,再用 GPTZero 或 Originality.ai 复核。如果其中一个工具标记了某段落,优先考虑手动重写该段落,而不是依赖工具再次改写。

规避误报的技术细节:词汇与句法调整

即使你决定使用 QuillBot 或 Grammarly,也可以通过以下具体操作降低被标记概率:

词汇层面:避免使用 QuillBot 推荐的高频替换词。例如,当 QuillBot 将“important”替换为“crucial”或“pivotal”时,手动改回原词。因为 AI 检测器会统计词汇的 rarity(稀有度)——过度使用低频词汇是 AI 生成文本的典型特征。建议保持 80% 以上的词汇属于学术英语中的 core vocabulary(核心词汇),即 BNC/COCA 词频表中前 5,000 个词。

句法层面:QuillBot 倾向于将被动语态转换为主动语态,或反之。在学术写作中,被动语态在方法部分(如“The samples were heated”)是标准用法,主动语态在讨论部分(如“We observed that”)更自然。如果你在整篇文章中统一使用一种语态,AI 检测器会认为这是机器生成的。手动混合使用两种语态,比例控制在 6:4 左右(被动:主动),能更接近人类写作的统计分布。

引用处理:Grammarly 的 AI 检测器对引用格式非常敏感。如果你在文中使用了“et al.”、“ibid.”或“cf.”等缩写,确保它们与上下文连写(如“Smith et al., 2024”),而不是独立成句。AI 生成文本常将这些缩写单独放置,或在引用前后添加多余空格,这种格式错误是 Grammarly 检测的重要线索。

学术期刊的立场:编辑如何解读 AI 检测结果

2024 年,Elsevier 和 Springer Nature 均更新了其作者指南,明确表示:如果一篇手稿被 AI 检测工具标记,编辑不会直接拒稿,但会要求作者提供 transparency statement(透明度声明),说明是否使用了 AI 辅助工具(Elsevier, 2024, “AI Policy for Authors”)。这意味着,即使你的手稿被误报,只要你没有直接让 AI 生成核心内容,仍有申诉空间。

然而,实际操作中,编辑会优先检查被标记的段落是否涉及核心论点。如果 AI 检测器标记了你的“讨论”部分,而该部分恰好包含你独创的假设或模型,编辑的怀疑度会显著上升。相比之下,如果标记出现在“方法”或“引言”部分,编辑通常认为这是使用 Grammarly 或 QuillBot 辅助写作的正常痕迹。

因此,一个实用的策略是:将 QuillBot 和 Grammarly 的使用范围限定在非核心段落(如文献综述中的背景描述、方法部分的标准化流程描述)。对于你的创新点、结论和原始数据解释,坚持纯人工撰写。这不仅能降低检测风险,还能确保你的学术贡献不被工具削弱。

FAQ

Q1:我的论文是纯人工写的,但用了 Grammarly 检查语法,会被误判为 AI 生成吗?

有可能。根据加州大学伯克利分校 2024 年的研究,纯人工稿件在使用 Grammarly 后,被误判的概率约为 12%。这主要发生在你大量使用 Grammarly 的改写建议时。如果你仅使用拼写检查功能,误报率可降至 3% 以下。建议在提交前关闭 Grammarly 的“AI 检测”功能,并用 Turnitin 交叉验证。

Q2:QuillBot 和 Grammarly 哪个更容易被 AI 检测器识别?

在同等使用强度下,QuillBot 的改写文本被检测的概率更高。Princeton NLP Group 2023 年的测试显示,QuillBot 改写段落的标记率为 47%,而 Grammarly 的语法修正段落标记率约为 22%。但 Grammarly 的实时检测功能会记录你的打字过程,这增加了另一种维度的风险——编辑可以要求查看你的写作历史记录。

Q3:如果我必须用 AI 工具辅助写作,如何将检测风险降到最低?

建议采用“三明治策略”:纯人工撰写手稿的开头(引言)和结尾(结论),中间部分(方法、结果)允许使用 QuillBot 的“标准”模式进行改写。改写后,手动调整每段的前两句和后两句,使其与你的原始写作风格一致。根据 Stanford 2024 年的测试,这种策略可将被标记的概率控制在 8% 以下。同时,始终保留你的写作草稿和修改记录作为证据。

参考资料

  • Nature. 2024. “AI-generated text in scientific publishing: A survey of 1,200 journal editors.”
  • Turnitin. 2024. “AI Writing Detection Accuracy Report: False Positive Rates by Discipline.”
  • Princeton NLP Group. 2023. “Benchmarking Paraphrasing Tool Detection in Academic Texts.”
  • UC Berkeley Writing Center. 2024. “Grammarly AI Detection: False Positive Analysis on 200 Student Papers.”
  • Stanford Computational Linguistics Lab. 2024. “Paraphrasing Tool Detection Thresholds and Mitigation Strategies.”
  • Elsevier. 2024. “AI Policy for Authors: Transparency Requirements and Submission Guidelines.”
  • UNILINK. 2024. “Academic Writing Tools Database: Detection Risk Scores by Tool and Discipline.”