TurnitinはChatGPTを検知できるか?仕組みと精度

これまでに、課題のためにChatGPTを使い、その後「待って… Turnitinで見つかるの?」と考えたことはありませんか?決してあなただけではありません。
この記事では、TurnitinのAI検出機能がどのように働くのかを詳しく解説します。Turnitinが検出できる点とできない点、AIが生成したり言い換えたりされたコンテンツをどう見抜くのか、そしてそれがあなたにとってどんな意味を持つのかを分かりやすく説明します。AIツールを使っている人も、単にリスクが気になる人も、これらのシステムを理解することで賢い選択ができるようになるでしょう!
TurnitinはChatGPTを検出できるのか?
はい、しかし、現在のところ英語、日本語、スペイン語で書かれた文書のみが対象です。
TurnitinのAI文章検出は、これら三つの言語において長文の執筆の中で、AI生成された可能性が高い内容を見分けるために作られています。ただし、文章を言い換えた、いわゆる「スピン」テキストに対してフラグを立てるAIパラフレーズ検出は、英語の提出物に対してのみ利用可能です。
Turnitinの技術は、最初はGPT-3、GPT-3.5やその派生モデル、ChatGPTのようなツールの出力を検出するように訓練されました。その後、機能は拡大され、GPT-4 (ChatGPT Plus)、GPT-4o、Gemini (Pro)、LLaMAなど、同様の大規模言語モデルに基づくより先進的なモデルによる文章も認識できるようになりました。
TurnitinはChatGPTの使用を示すのでしょうか?
必ずしもそうではありません。
Turnitinはどのツールが使われたかを明示せず、「これはChatGPTで書かれた」と表示したり、どのアカウントが作成したかを示したりしません。代わりに、文章のスタイル、語彙の選び方、文の構造、全体の流れを分析します。あまりにも洗練され、一貫性があり、予測しやすい文章は、ChatGPTや同様のAIモデルの特徴とされ、検出が作動することがあります。
Turnitinはどのように検出結果を報告するのか?
Turnitinの検出結果は、色分けされたインジケーターによって表示されます:
文書の20%以上がAI生成と判断される場合、AIインジケーターには青いスコアが出ます。
AIの要素が確認されても20%未満の場合、代わりに控えめなアスタリスク (*%)が表示されます。低いスコアのこの表示は誤検知を防ぎ、講師が重要な結果に注目できるようにしています。
もう一点:
AI文章スコアは、通常講師のみが閲覧できる類似性レポートに表示されます。学校が特別に共有しない限り、学生は通常このAIスコアを目にすることはありません。
Turnitin AIはどんなChatGPTコンテンツを検出するのか?そしてその仕組みは?
TurnitinのAI検出は表面的なものではなく、検出されたコンテンツを2つの明確なタイプに分類することで、教育者が学生の文章にどのようなAIの関与があるかをより深く理解できるようにしています。
1. AI生成コンテンツ
これは最もシンプルな検出タイプです。ChatGPTのような大規模言語モデル(LLM)によって直接生成されたテキストを指します。つまり、大きな修正を加えずに文書にコピー&ペーストされた可能性が高いコンテンツです。
Turnitinはこの種のコンテンツにシアンのマークを付けます。システムは、機械が生成した文章特有の、不自然なほど完璧な文法、非常に予測可能な表現、そして人間ならではの不規則性ではなくアルゴリズムに基づくパターンを検出します。
2. AIパラフレーズコンテンツ
ここでは、Turnitinのシステムがさらに洗練された検出を実現しています。一部の学生はChatGPTなどのAIツールでコンテンツを生成し、その後パラフレーズツールであるQuillbotなどを使用して文章を言い換え、元のAI生成の痕跡を隠そうとします。
Turnitinは、英語のみの提出物において、この2段階のプロセスを検出できるようになりました。レポートでは該当箇所が紫色で示されます。文言が変更されていても、基本的な構造や表現パターン、文の組み立てにLLMの特徴が残っていることを捉えています.
TurnitinがAIコンテンツを分割しスコアを付ける方法
論文を提出すると、Turnitinはテキストを約2〜3文ずつの重なり合う小さなチャンクに分割します。これにより、各文は独立してではなく、前後の文脈と共にチェックされます。
各チャンクに対して、TurnitinのAIモデルは0から1までのスコアを与えます。スコアが0に近ければ人間によって書かれた可能性が高く、1に近ければAIによって書かれた可能性が高いと判断されます。
全てのチャンクのスコアを集計した後、Turnitinはその平均を算出し、論文全体のどの程度がAI生成されているかの大まかな見積もりを行います。
また、AI生成として検出された部分については、QuillbotなどのAIツールによる書き換えやパラフレーズが行われたかどうかを確認する追加のチェックが行われます。この第二のモデルもスコアを付け、単にAIが生成したのか、もしくはAIパラフレーズが施されたのかを判断します。
最終的に、Turnitinはこれらのスコアを総合し、論文全体のどのくらいがAI生成またはAIパラフレーズされたかの全体的な見積もりを提供します.
AIスコアが低い場合はどうなるか?
すべてのAI検出結果が完全なレポートにつながるわけではありません。提出物の20%未満がフラグ付けされた場合、Turnitinは正確なパーセンテージを表示せず、代わりにアスタリスク(*%)を表示します。
これは、AIの関与が検出されたものの、その割合が十分に高くないため、具体的な対応が難しいことを示しています。この仕組みにより、特に一般的な短いフレーズがAI出力に類似する場合の誤検出を防ぎ、公平性を保つことができます。
ChatGPTの検出精度はどうなっているのか?
TurnitinのAIライティング指標は、人間が書いたテキストが誤ってAI生成と判断される事例(偽陽性)を極力抑えつつ、AI生成コンテンツを検出することを目的としています。データによれば、少なくとも20%がAI生成である可能性がある文書の場合、偽陽性率は1%未満に抑えられているとのことです。これは、100本の完全に人間による論文のうち1本が、誤ってAI生成テキストを含むと判断される可能性があるということを示しています。
また、すでにAI生成と識別されたテキストを対象にするAIパラフレーズ検出システムについては、十分な精度を示しているものの、完全無欠ではありません。誤分類が起こるのは、パラフレーズが施されていないAI生成テキストがパラフレーズされたものと誤って識別される場合、もしくはパラフレーズされたAIテキストを見落として単にAI生成と判断される場合の2種類です。
誤判定による不当な告発を避けるため、Turnitinは検出精度に一定の許容誤差を設けており、論文中のAI生成コンテンツの最大15%が見逃される可能性があります。つまり、Turnitinが50%のAIコンテンツを報告した場合、実際の割合は65%に近い可能性があるということです。
さらに、Turnitinは進化し続けるAI技術に対応すべく、ChatGPT以前の学術論文も含む大規模データセットを使用してモデルを定期的に更新し、検出性能の維持・向上に努めています。とはいえ、AI生成テキストの検出は、感度と正確性の間で常にトレードオフが存在する複雑な課題であることに変わりはありません。
よくある質問
TurnitinはChatGPTの会話やブラウザの閲覧履歴を検出できますか?
いいえ。TurnitinはChatGPTのチャットやブラウザの閲覧履歴にアクセスしたり、これを検出することはできません。ただし、宿題や論文の提出中に、非常に速いタイピングや大量のテキストの貼り付けなどの行動を監視するツールは存在します。
Turnitin上にChatGPTは表示されますか?
いいえ。講師がこの機能を有効にしている場合、TurnitinはコンテンツがAIによって生成または言い換えられたかどうかを検出しますが、どのAIツール(ChatGPTなど)が使われたかまでは特定しません。
TurnitinはChatGPTのパラフレーズを検出できますか?
はい、TurnitinはAIによる言い換えテキストを検出できます。信頼性の高い書き換えツールを利用することで、AIによる言い換えが検出される可能性が高まります。
テキストを人間らしく加工した場合でも、TurnitinはChatGPTを検出できますか?
AIモデルとTurnitinの検出方法は常に進化しています。TurnitinがAIを検出するかどうかは、テキストがどれほど「人間らしく」加工されているか、また高度な言い換え技法が使用されているかにかかっています。
最終考察
これで、TurnitinがChatGPT生成のコンテンツを検出でき、その検出手法についても理解できました。AI検出技術はどんどん進化していますが、完璧ではありません。Turnitinは、特に誤検出を防ぐことで、正確さと公正さのバランスを保つことを目指しています。この仕組みを理解することで、課題提出時により賢明かつ責任ある判断を下す助けとなります。