關鍵見解:Turnitin 如何檢測學生論文中的 AI?

Author image
撰寫者  Raj Patel
2025-07-18 15:48:44 3 分鐘閱讀

在 2023 年 4 月,Turnitin 推出了它的 AI 寫作檢測功能—直接整合到其熟悉的相似性報告中。這一舉措是因應對學生使用生成式 AI 工具,例如 ChatGPT 而日益增加的擔憂。 

隨著學術機構努力維持作品的原創性,Turnitin 已將自己定位為識別 AI 生成內容的重要參與者。但 Turnitin 的 AI 檢測究竟在幕後是如何運作的呢?本文將一步步為您說明。 

Turnitin 如何檢測 AI 第一畫面

Turnitin偵測的內容

那麼,Turnitin能偵測AI嗎?答案是肯定的。

自2023年4月以來,Turnitin在其相似性報告中新增了一項AI寫作偵測功能。該功能旨在識別兩大類內容:

  1. 由AI生成的內容
    意指看似直接由生成式AI工具(如ChatGPT,包括GPT-3、GPT-3.5以及GPT-4版本)所產生的文本。

  2. 由AI改寫的內容
    指的是先由AI生成,接著利用基於AI的改寫工具進行調整,使文本看起來更像人類所寫的內容。

    Turnitin AI報告範例

Turnitin 如何偵測論文中的 AI 寫作 

但究竟它如何在學生的論文中運作呢?以下將逐步解析幕後過程。

步驟 1:拆解您的提交

當您提交論文時,Turnitin 不會一次處理全文。它會先將文件拆分成較小的單位——通常每個單位有數百個字。為什麼要這麼做?因為較小的部分能讓系統更加準確地分析寫作風格結構語言模式

步驟 2:利用 AI 模型對各段落進行評分

每個段落都會通過 Turnitin 自家開發的 AI 偵測模型,這些模型會給每一段打出介於 0 到 1 的分數:

  • 接近 0 = 可能由人類撰寫

  • 接近 1 = 可能由 AI 生成

  • 0.5–1 = 可能混有 AI 影響

這些分數反映的是概率而非絕對確定性,可以理解為每個段落的「風險分數」。

Turnitin AI 寫作偵測運作流程

步驟 3:綜合評估 AI 百分比

在對所有段落進行分析後,Turnitin 會將這些分數整合成一個總體值:AI 寫作百分比。這個數值展示了您的論文中有多少內容可能是由 AI 生成或經過 AI 改寫工具處理過的。

重要提示: 

  • 這個百分比僅針對 符合條件的文字——一般來說是長篇文章內容。項目符號、列表或程式碼區塊則不包括在內。

  • 該百分比會顯示在報告中,但不會影響相似性分數本身。

步驟 4:模式匹配(Turnitin 如何識別 AI)

Turnitin 並非僅僅「猜測」文本是否源自 ChatGPT 或其他類似模型,而是檢測 AI 生成語言中常見的模式

  • 可預測的句子結構

  • 重複的表達方式

  • 句子長度缺乏變化

  • 過度使用轉接語句

這些特徵在由大型語言模型(如 GPT)生成的內容中十分常見。

步驟 5:AI 偵測報告與顏色代碼

處理完成後,Turnitin 會提供一份 AI 寫作報告。以下說明如何解讀所呈現的結果:

顏色指示:

  • 🔵 藍色 (20%–100%): 處理成功,顯示檢測到的 AI 內容。

  • 🔵 帶*藍色 (1%–19%): 偵測信心較低,這些分數較不穩定,因此以星號標記以免引起過度關注。

  • ⚪ 灰色 (--%): 未能處理,可能是文件格式問題或提交時間過久所致。

  • ❗ 錯誤 (!): 系統出現錯誤,Turnitin 未能完成分析——請嘗試重新提交。

    Turnitin AI 寫作指示器

Turnitin 的 AI 偵測器是如何訓練的

Turnitin的 AI 偵測系統 是基於 transformer 深度學習模型所構建。該模型會將文本劃分為若干重疊的小片段,每片段大約包含五到十個句子(約數百個字)。這些「片段窗口」以每次一個句子的方式滑動,從中收集足夠的單詞與短語統計數據,以判斷該片段的內容是否符合 AI 生成文本的典型模式。

模型會對每一片段給出一個介於 0 到 1 之間的分數。分數越接近 1,表示該片段越可能是由 AI 撰寫;反之,接近 0 則表示較可能由人類撰寫。Turnitin 進一步將所有包含同一特定句子的片段的分數進行平均,從而為該句子分配一個 AI 可能性分數。如果這個分數達到預設的門檻,該句子便會被標記為 AI 生成或 AI 改寫(就 AIR 模型而言)。

至於整份文件,Turnitin 僅在超過 20% 的句子達到 AI 寫作門檻時,將其標記為「AI 生成」。這個標準有助於降低誤判,特別適用於 AI 內容比例低於 20% 的文件,因為這類文件更容易出現判斷錯誤。系統同時要求文件至少包含 300 個字,以確保處理結果的可靠性。

AIW 與 AIR 模型

Turnitin 的 AI 寫作偵測工具最初是採用 AIW-1 模型推出的,隨後改進為 AIW-2。AIW-2 不僅可以檢測直接由 AI 生成的文字,還能發現經過 AI 改寫工具處理過的文本,這類工具通常會重寫內容以隱藏其 AI 起源。

此外,Turnitin 還專門使用 AIR-1 模型來檢測 AI 改寫的情況。AIR-1 能夠辨識出由 AI 改寫工具留下的獨特統計痕跡,這與一般 AI 生成的文本有所不同,使得 Turnitin 能夠準確標示出經過 AI 修改的句子,讓教育工作者更清楚地了解文本的來源。

Turnitin AI 寫作偵測系統,搭載 AIW-2 與 AIR-1 模型

AIR-1 模型僅在文件被 AIW-2 標示為具有 20% 或以上 AI 生成內容時啟動,且不會對明顯由人類撰寫的句子進行改寫標籤的分派。

訓練資料與模型設計

Turnitin 的模型是基於一個涵蓋約 20 年學術寫作歷程的廣泛且多元化資料集所訓練,該資料集涵蓋了各學科與不同學生背景下的人類撰寫和 AI 生成的文本。此外,資料集中亦包含了混合類型的文本,如經 AI 改寫後的人類文本或經過改寫處理的 AI 文本。

在資料收集過程中特別注意納入來自非英語母語者、來自不同國家的學生以及較少見的學術領域的文本,以降低偏見並提升公平性. 

Turnitin 的 AI 報告顯示位置

Turnitin 的 AI 偵測並非獨立工具 — 它直接嵌入在 相似性報告 介面中。

相似性報告的一部分

當論文送交時,Turnitin 會像檢測抄襲一樣處理內容。如果啟用了 AI 偵測,就會在報告側邊欄顯示一個 AI 寫作指標。點擊該指標可查看哪些部分可能由 AI 生成或進行了改寫。

這個指標與抄襲分數分開計算。它只是一層額外的分析,而非評分標準。

由學校控制可見性

AI 偵測工具 僅在學校啟用時有效。這意味著:

  • 某些學校可能僅選擇向教師顯示該工具。

  • 其他學校可能會完全停用此功能。

  • 學生通常不會在他們的界面上看到 AI 偵測結果。

存取權限由學校層級管理,因此各校可見性有所不同。

如何在提交前檢查 Turnitin AI 警示

因為學生通常無法直接看到 Turnitin 的 AI 結果,許多人會依賴其他專業工具來模擬 Turnitin 如何檢測 AI 生成的內容。

其中一個常見的選擇是:

TurnitinDetector.com – 一款模擬 Turnitin AI 與抄襲檢查功能的工具。

Turnitindetector 主頁

  • 採用的是 Turnitin 的真正檢測引擎(而非模仿品)。

  • 不會將您的檔案存入任何數據庫。

  • 提供的結果與教師端看到的幾乎完全一致。

這讓學生能在將檔案上傳到學校 LMS 前,有機會檢查潛在的 AI 警示。

Turnitin 的 AI 檢測限制與準確性

Turnitin 的 AI 檢測工具確實很有幫助,但它並非完美無缺。學生與教師應謹記以下幾點:

AI 檢測結果不代表最終定論

Turnitin 明確表示,這項 AI 檢測工具並不是最終的裁決,只是一個供教師參考的數據指標。平台建議在下結論之前,教育者應綜合考量背景因素,例如學生的寫作歷史與表現。

誤判是有可能的

他們也承認可能出現誤判情況,並鼓勵教師在懷疑時多給學生一些信任。Turnitin 強調,此功能的目的是促進學生與教師之間的對話,而非引發不必要的猜疑。

Turnitin AIW-1 與 AIW-2 文件及句子層級 FPR

即便工具將內容標記為 AI 生成,也有可能是人類撰寫。這一點對於那些平時就習慣用結構化、重複或過於正式風格寫作,與 AI 生成語言有相似之處的學生尤其如此。

因此,教師的判斷非常重要。教師應考慮以下因素:

  • 學生過去的寫作紀錄

  • 學習成績

  • 作業的具體背景,再做綜合判斷

持續更新,但依然存在局限

Turnitin 的工具會定期更新,以應對 GPT-4、GPT-4o 等新一代 AI 模型,並專注於檢測生成模型常見的語言模式——譬如過於固定的句子結構或預測型措辭。

然而,更先進或新型的 AI 工具有時仍可能逃過檢測。因此,Turnitin 建議教師應持續了解檢測工具的局限,並將這些結果視為整體評估過程中的一個參考指標。

常見問答

常見問題

Turnitin 真能偵測到 AI 嗎?

可以,Turnitin 利用檢測模型標示出可能由 AI 撰寫或改寫的內容。不過,它的準確度並非百分之百,仍需要人為判斷來確認。

在 Turnitin 中,究竟可以接受多少 AI 內容?

沒有明確的標準。Turnitin 不會根據 AI 的比例進行懲處。老師會根據作業要求和情境來決定什麼情況下是可以接受的。

Turnitin 上的 40% 表示有問題嗎?

未必。40% 的 AI 分數代表該部分文字呈現出 AI 生成的特徵,但這並不代表確定有不當行為。您的老師會根據具體情況進行評估.
摘要

我們已介紹了 Turnitin 如何檢測 AI 寫作——通過區段分析、模式識別以及 AI 預測模型。儘管它在發現 AI 生成或改寫的內容方面很有幫助,但最終的判斷仍由教育者來做。了解系統的運作方式可以幫助學生和老師更有效地使用該工具.