关键要点:Turnitin如何检测学生论文中的AI?

Author image
撰写者  Raj Patel
2025-07-16 18:30:55 3 分钟阅读

2023年4月,Turnitin 推出了其 AI 写作检测功能——这一功能直接整合在其熟悉的相似性报告中。此举旨在应对围绕学生作业中使用 ChatGPT 等生成式 AI 工具所引发的担忧。 

随着学术机构不断努力维护原创性标准,Turnitin 已经成为识别 AI 生成内容的关键工具。那么,Turnitin 的 AI 检测究竟是如何在幕后运作的?本文将一步步解析这一过程。 

Turnitin如何检测AI首屏

Turnitin检测内容

所以,Turnitin能检测AI吗? 答案是:是的。

自2023年4月以来,Turnitin在其相似性报告中增加了一个AI写作检测功能。该功能旨在识别两种主要类型的内容:

  1. AI生成内容
    指看起来直接由生成式AI工具(例如ChatGPT,包括GPT-3、GPT-3.5和GPT-4)创建的文本。

  2. AI复述内容
    指那些最初由AI生成,随后通过基于AI的复述工具进行修改,以使内容看起来更具人性化的文本。

    Turnitin AI报告示例

Turnitin 如何检测论文中的 AI 写作 

但它究竟是如何在学生论文中发挥作用的呢?以下是对幕后过程的详细解析。

步骤 1:拆解您的提交内容

当您提交论文时,Turnitin 不会一次性查看整篇文章。而是将文档分割成较小的部分——通常每部分有几百个单词。为什么?较小的部分能让系统更准确地分析写作风格结构语言模式

步骤 2:利用 AI 模型对各部分进行评分

每个部分都会通过 Turnitin 独有的 AI 检测模型。这些模型会为每个部分打出介于 0 和 1 之间的分数:

  • 接近 0 = 可能是人工撰写

  • 接近 1 = 可能是 AI 生成

  • 0.5–1 = 可能含有 AI 辅助的成分

这些数字表示的是概率,而不是绝对确定性。可以理解为每个部分的“风险评分”。

Turnitin AI 写作检测工作流程

步骤 3:整体 AI 含量百分比

在所有部分分析完毕后,Turnitin 会将各部分的分数合并成一个总数:AI 写作百分比。这显示了您的论文中可能有多少内容是由 AI 生成或经过 AI 改写器修改的.  

重要提示: 

  • 该百分比仅针对符合条件的文本——通常是长篇散文。项目符号、列表或代码块不会被计算在内。

  • 这个百分比会显示在报告中,但不会影响相似度分数。

步骤 4:模式匹配(Turnitin 如何发现 AI)

Turnitin 并非只是“猜测”文本是否来自 ChatGPT 或类似模型。它会扫描那些典型的、出现在 AI 生成语言中的模式

  • 可预测的句子结构

  • 重复的表达方式

  • 句子长度较为一致

  • 过度使用过渡词语

这些特征在由大型语言模型如 GPT 生成的内容中非常常见。

步骤 5:AI 检测报告与颜色代码

当处理完成后,Turnitin 会生成一份 AI 写作报告。以下是如何解读报告中的信息:

颜色指示器:

  • 🔵 蓝色(20%–100%): 处理成功,显示出检测到的 AI 内容。

  • 🔵 带 * 的蓝色(1%–19%): 检测置信度较低,这些分数可靠性较差——因此以星号标注以免引起过度反应。

  • ⚪ 灰色(--%): 未进行处理,可能是由于文件格式问题或提交时间过长所致。

  • ❗ 错误(!): 系统出现错误,Turnitin 未能完成分析——请尝试重新提交. 

    Turnitin AI 写作指标

Turnitin 的 AI 检测器训练方法

Turnitin 的 AI 检测系统构建于基于 Transformer 的深度学习模型之上。该模型将文本分解成多个小的、相互重叠的段落,每段大约包含五到十个句子(几百个单词)。这些“段落窗口”以每次滑动一个句子的方式遍历整个文档,从而使系统能够从每个窗口内的单词和短语中收集足够的统计数据,以判断该段落的文本是否符合 AI 生成写作的典型模式。

模型为每个段落输出一个介于 0 到 1 之间的得分。分数越接近 1,说明该段落极有可能是 AI 撰写;越接近 0,则可能是由人类撰写。Turnitin 会对包含某特定句子的所有段落的分数取平均,从而为该句分配一个 AI 可能性得分。如果这个得分超过某个设定阈值,该句子就会被标记为 AI 生成或 AI 改写(对于 AIR 模型而言)。

对于整篇文档,Turnitin 只有在超过 20% 的句子的得分达到 AI 写作阈值时,才会将整篇文档标记为“AI生成”。这一界限有助于减少误判,尤其是在 AI 风格内容不足 20% 的文档中,错误几率较高。另外,系统要求文档至少包含 300 个单词,以确保处理的可靠性。

AIW 与 AIR 模型

Turnitin 的 AI 写作检测工具最初采用 AIW-1 模型推出,后来升级到 AIW-2。AIW-2 不仅能够检测纯粹的 AI 生成文本,还能识别经过 AI 改写工具修饰的文本,这些工具通过改写内容来掩盖文本的 AI 来源。

除 AIW 模型外,Turnitin 还专门使用 AIR-1 模型检测 AI 改写。AIR-1 能够捕捉到 AI 改写工具留下的独特统计痕迹,而这些痕迹与普通 AI 生成的文本有所不同。这使得 Turnitin 能够标记出那些经过 AI 修改的句子,为教师提供更清晰的写作来源信息。

Turnitin AI 写作检测系统,包含 AIW-2 和 AIR-1 模型

AIR-1 模型仅在 AIW-2 标记文档中 AI 生成内容达到或超过 20% 时才会激活,对于被确认为人类撰写的句子,则不会分配改写标记。

训练数据与模型设计

Turnitin 的模型训练基于一个涵盖约 20 年学术写作的广泛而多样化的数据集,该数据集囊括了来自不同学科和学生背景的由人类撰写及 AI 生成的文本。数据集中还包括各种混合类型的文本,例如经过 AI 改写的人类写作,或是经过改写的 AI 写作。

在构建数据集时,特别注意纳入非母语英语人士、来自不同国家的学生以及较不常见的学术领域的文本,以减少偏见并提升公平性。 

Turnitin AI报告出现的位置

Turnitin的AI检测不是一个独立工具——它直接嵌入在相似性报告界面中。

相似性报告的一部分

论文提交后,Turnitin会像处理抄袭一样处理内容。如果启用了AI检测,一个AI写作指示器会出现在报告侧边栏中。点击它可以显示哪些部分可能是由AI生成或改写的。

该指示器与抄袭得分是分开的。它提供的是额外的分析层,而非分数。

机构控制下的可见性

AI检测工具仅在机构启用时才有效。这意味着:

  • 一些学校可能只向教师显示该功能。

  • 另一些学校可能会完全禁用它。

  • 学生通常看不到他们端的AI检测结果。

访问权限由学校统一管理,因此显示情况各不相同。

如何在提交前检测Turnitin的AI标记

由于学生通常无法查看Turnitin提供的AI结果,很多人会借助其他专业工具,这些工具模拟了Turnitin检测AI生成内容的方式。

一个常用选项是:

TurnitinDetector.com – 一款模拟Turnitin AI和抄袭检测的工具。

Turnitindetector主页

  • 采用的是Turnitin真实的检测引擎(而非仿制版)。

  • 不会将您的文件存入任何数据库。

  • 提供的检测结果几乎与教师所见完全一致。

这让学生在上传到学校的LMS之前,有机会先检查潜在的AI标记。

Turnitin AI 检测的局限性及准确性

Turnitin 的 AI 检测工具非常实用——但并非无懈可击。以下是学生和教师需要注意的几点:

AI 检测 ≠ 最终判定

Turnitin 明确指出,该 AI 检测工具并不是最后的判定依据。它只是为教师提供的一个数据参考。平台建议教育者在下定论前,充分考虑学生的写作历史和表现等背景因素。

存在误报风险

他们也承认存在误报的可能,并鼓励教师对学生持宽容态度。Turnitin 强调,这一功能应着力促进学生与教师之间的对话,而非制造不必要的猜疑。

Turnitin AIW-1 对比 AIW-2 文档和句子级误报率

即使该工具将内容标记为 AI 生成,也可能实际上是人工撰写的。对于那些自然采用与 AI 生成语言相似风格——结构固定、重复或过于正式——的学生来说,这种情况尤为常见。

因此,教师的判断至关重要。建议教育者在评估时考虑:

  • 学生以往的写作风格

  • 课程表现

  • 作业的具体背景

持续更新,但仍有不足

Turnitin 通过定期更新检测工具以适应 GPT-4 和 GPT-4o 等新型 AI 模型,从而保持其有效性。该工具主要关注生成模型常见的语言模式——例如过于统一的句子结构或预测性措辞。

然而,较新或更先进的 AI 工具有时仍可能未被检测到。这也是 Turnitin 建议教育者关注检测局限性,并在更全面的评估过程中将检测结果作为一个参考依据的原因。

常见问题解答

常见问题

Turnitin真的能检测出人工智能生成的内容吗?

可以,Turnitin利用其检测模型可以标记出可能由人工智能撰写或改写的内容。不过,该系统并非百分之百精准,判断结果还需辅以人工审核。

在Turnitin中使用人工智能的比例允许到什么程度?

没有固定上限。Turnitin不会根据人工智能的使用比例进行处罚,教师会根据具体作业要求和情境来判断什么是可以接受的。

Turnitin显示40%的分数是不是有问题?

未必如此。40%的人工智能分数仅表示那部分文本与人工智能生成的模式有相似之处,并不意味着存在不当行为。您的教师会根据具体情况进行评估。
总结

我们讨论了Turnitin如何检测人工智能撰写的内容——它通过分段分析、模式识别以及人工智能预测模型来实现这一点。虽然这一工具有助于发现由人工智能生成或改写的内容,但最终的判断权仍归教育工作者所有。了解系统工作原理可以帮助学生和教师更高效地使用这一工具。