ターンイティンスコアの意味: 割合、色別等を解説

ターンイットインスコアという話題に触れるとき、実はSimilarity Reportの中身、つまり主に類似性スコアと、最近(2023年追加)導入されたAIライティングスコアのことを指しています。
それでは、これらのスコアは一体何を示しているのでしょうか?盗作やAI利用の証拠になるのでしょうか?必ずしもそうとは言えません。この記事では、各スコアが示す内容、読み方、そして、あなたが学生であれ教師であれ次に取るべき行動について分かりやすく解説していきます。
Turnitinの類似性スコアを理解する
類似性レポートは実際に何を検出するのか?
Turnitinの類似性レポートは、しばしば誤解されています。世間一般の認識とは異なり、Turnitinは盗用を直接検出するのではなく、他の情報源と一致するテキストを見つけ出します。これらの情報源には、数十億のウェブページ(ライブとアーカイブの両方)、学術雑誌、本、そして以前に提出された学生の論文が含まれます。もしあなたの作品の一部がデータベース内のコンテンツと一致すれば、Turnitinはそれにフラグを付けて確認を促します。
類似性スコアの色が示す意味
Turnitinは、色分けされたアイコンを使って、提出物中の一致テキストの割合を視覚的に表示します。これらの色は、あなたの課題受信トレイやFeedback Studioの画面に現れ、あなたの文章が他のコンテンツとどの程度重なっているかを一目で把握できるようになっています。
ここでは、2種類のツールとその色分けの仕組みについて説明します:
1. Turnitin Feedback Studio / Feedback Studio w/ Originality
これは最も一般的な表示方法のひとつです。類似性を示す色のインジケーターは、以下の範囲に基づいて、一致するテキストの割合を示します:
青: 0% 一致
緑: 1–24% 一致
黄色: 25–49% 一致
オレンジ: 50–74% 一致
赤: 75–100% 一致
2. オリジナリティチェック / Turnitin類似性 / SimCheck
SimCheckなど、一部のバージョンや統合では、下位の範囲で色の割り当てがやや入れ替わります:
緑: 0% 一致
青: 1–24% 一致
黄色: 25–49% 一致
オレンジ: 50–74% 一致
赤: 75–100% 一致
一致概要パネルの活用法
類似性レポートを開くと、まず目に入るのが一致概要パネルです。このパネルは、スコアを詳細に分解し、あなたのコンテンツがどこで、そしてどのように他の情報源と一致しているのかを示してくれます。
パネル内で確認できる項目は以下の通りです:
一致概要: 全体の類似性パーセンテージを示すとともに、他の情報源と一致しているテキスト部分を強調表示します。各色は、特定の情報源やテキスト部分に対応しています。
すべての情報源: 論文内で一致したすべての情報源(学術雑誌、他の学生の提出物、ウェブページなど)が一覧表示されます。
フィルターと設定: 引用、参考文献、または10語未満などの短い一致を除外することで、重要な類似性にスコアが集中するよう調整できます。
除外された情報源: 手動でレポートから削除された情報源を確認できます。
フラグパネル: ここでは、不可視テキスト、隠し文字、または記号の置換(例として、英語の「e」をキリル文字の「е」に置き換えるなど)を検出し、カンニングの可能性を示唆します。
類似性スコアの範囲が示す実例
ツールの仕組みを理解するのは重要ですが、実際の場面で類似性スコアは具体的に何を意味するのでしょうか?以下の例でその違いを見てみましょう:
例 1: 学生がヘッダーに自分の名前を記載した場合、短い一致が除外されなければ、たとえ自分の名前でもフラグが立つ可能性があります。対策として、講師は10語未満などの短い一致を除外し、誤ったフラグ付けを防ぐことができます。
例 2: 学生が複数のドラフトを提出し、最終版が過去のドラフトと一致して100%のスコアになる場合、講師は先の提出物を除外し、最終版を公平に評価できるようにします。
例 3: ある2人の学生が共に約20%の類似性スコアを得た場合、一方はウェブサイトから段落をコピーし、もう一方は複数の参考文献を正しく利用しています。スコアは似ていても、情報源の使用方法に差があるのです。
例 4: 直接引用が多く、参考文献も長い論文の場合、スコアが53%になることがあります。しかし、引用部分や参考文献を除外すれば、スコアは大幅に下がる可能性があるため、必ずしも問題とは限りません。
Turnitinが学生間の共謀を見抜く仕組み
Turnitinの高度な機能の一つに、学生が類似または同一の内容を提出した場合に、学生間の共謀を検出する能力があります。以下はその典型的な例です:
学生Aは論文を早めに提出し、25%の類似性スコアとなります。
学生Bは後から学生Aと同一の内容を提出し、100%のスコアになります。
Turnitinは締切後にすべての提出物を再スキャンし、遅れて提出されたものと早期の提出物を比較するため、このようなケースを検出します。これにより、提出時期にかかわらずすべての学生にフェアな評価が保証されます。
この機能を利用するには、課題がリポジトリに論文を追加する設定になっており、類似性レポートが「締切日に生成」または「直ちに生成(締切日まで上書き可能)」に設定されている必要があります。
学生にとって類似性スコアが本来意味するもの
高いTurnitinスコアが必ずしも盗用を意味するわけではなく、また低いスコアが安全を保証するわけでもありません。その理由は以下の通りです:
高いスコアは、多くの引用や出典、しばしば繰り返し使われる情報源が影響している場合があります。
非常に低いスコア(例えば0%)は、文章に必要なリサーチや裏付けが不足している可能性を示唆します。
特定の数値を目標とするのではなく、課題で求められる内容に焦点を当てましょう:
シラバスを確認するか、講師に許容される類似性の範囲を問い合わせましょう。
情報源は効果的に利用しつつ、自身の分析もしっかり盛り込み、バランスをとりましょう。
常に情報源を正確に引用し、必要に応じてパラフレーズするよう心がけましょう。
TurnitinのAIスコアリングの仕組みを理解する
インターネットや各種データベース上の情報源と一致するテキストを検出するSimilarity Scoreを確認した後は、Turnitinのもう一つの重要な指標であるAI Scoreについて理解することが大切です。
AI生成コンテンツが一般化する中、Turnitinは、学生の提出物が人工知能ツールによって作成または影響を受けた可能性を検出するシステムを開発しました。これには、直接AIで生成された文章だけでなく、AIによって言い換えられたテキストも含まれます。
TurnitinのAIスコアは何を示しているのか?
TurnitinのAIライティング検出ツールは、AIの影響を受けた2種類のテキストを識別するよう設計されています:
AI生成コンテンツ:ChatGPTなどの大規模言語モデル(LLM)によって直接作成されたテキスト。
AIによる言い換えコンテンツ:もともとAIで生成された可能性があるものの、その後AIパラフレーズツールやQuillBotのような「ワードスピナー」により変更されたテキスト。
つまり、Turnitinは単なるAIによるコピーペースト検出に留まらず、AI生成テキストの微妙な書き換えも見抜くことで、進化するデジタル環境下で教育者が学術的誠実性を保つ手助けをしています。
AIスコアはどこで確認できるのか?
通常、TurnitinのAI検出結果は講師のみに表示されますが、先生がレポートを共有する場合もあります。AIレポートが利用可能な場合、Similarity Reportのサイドパネルに表示されます。AIインジケーターをクリックすると、別ウィンドウでAIライティングレポートが開き、以下の内容が確認できます:
文書全体のパーセンテージスコア:その文書がどの程度AIによって作成または言い換えられた可能性があるかを示します。
提出内訳バー:疑わしいセクションが文書内のどこにあるかを視覚的に示します。
色分けされたハイライト:文書内で該当箇所が強調表示されます。
AI検出パーセンテージは、あなたの提出物中の対象テキストのうち、AIツールの影響を受けたとTurnitinが疑っている部分の割合を示します。
「対象テキスト」とは、リストや表、コード、その他の非標準フォーマットではなく、エッセイやレポートなどの長文テキストを指します。
AI検出スコアテーブル: 色と記号の意味
アイコン/色 | スコア範囲 | 意味 | 表示形式 |
✅ 青 + % | 20%–100% | Turnitinはファイルの処理に成功し、スコアは対象テキストの中でAI生成またはAIによる言い換えが疑われる部分の割合を示します。 | 数字付きの青いバッジ (例:「76%」) |
⚠️ アスタリスクスコア | *% (1%–19%) | AIの影響が認められる場合もありますが、結果はあまり信頼できません。低いスコアは誤検知を引き起こしやすいため、数値は表示せずにアスタリスクのみとなります。 | *%のみ表示 |
🚫 灰色 "--" | スコア非表示 | AIレポートの生成に失敗しました。理由としては、古い提出物(AI検出が実装される前のもの)、サポート外のファイル形式、またはスキャンされたPDFなどが考えられます。 | 「--」と表示された灰色のアイコン |
❗ 赤いエラー (!) アイコン | スコア非表示 | システムエラーまたは処理の失敗が発生しました。技術的な問題やファイルの不具合が原因の場合があり、後ほど再試行するか、Turnitinサポートにお問い合わせください。 | 「!」付きの赤いエラーアイコン |
🔄 アップデート(2024年7月8日施行):
この日以降の提出物では、20%未満のスコアは数値として表示されず、代わりにアスタリスク (*%) のみが表示されます。これにより、信頼性の低い低パーセンテージの検出に基づく誤った非難を防ぐことができます。
AI提出内訳:インタラクティブなハイライト
Turnitinは、提出物内で疑わしいAI影響を受けたテキスト箇所を示す視覚的な内訳バーも提供しています。このバーは、
色分け(AI生成部分はシアン、AIによる言い換え部分は紫)
インタラクティブ:バーの任意の部分をクリックすると、対応する文書のセクションにジャンプします。
画面には、
🔹 シアンのハイライト:大規模言語モデル(LLM)により直接作成されたと思われる部分
🟣 紫のハイライト:AIで生成された後、QuillBotなどのツールで言い換えられた可能性が高い部分
これらの色は、AIライティングレポートを開いた際にも反映されます。
⚠️ 現在、AIによる言い換え検出は英語の提出物にのみ対応しています。
「良い」Turnitinスコアとは何でしょうか?
「良い」Turnitinスコアは、一つの固定された数値で定義されるわけではなく、その状況に応じて変わります。通常、類似度スコアが15〜20%未満であれば安全と考えられますが、数値が低ければ必ずしも良いわけではありません。実際、非常に低いスコア(たとえば1〜5%)は、出典資料との関わりが不足していることを示唆しており、研究や証拠を盛り込むべき学術文章には問題があります。一方で、15〜30%の中程度のスコアであれば、正しく引用された引用文や参考文献、または一般的な学術フレーズによる重複であれば問題ありません。
逆に、35%以上の高いスコアが出た場合、必ずしも盗用を意味するわけではありませんが、より詳細な確認が必要です。過度な引用や不十分なパラフレーズ、またはテンプレートやプロンプトの繰り返し使用が原因である可能性があるからです。そのため、Turnitinが何を指摘しているのかをしっかり確認することが求められ、単に数値だけに頼るべきではありません。つまり、「良い」スコアとは、自分の文章が明らかに自分のもので、出典が正しく示されており、独創性と研究支援のバランスが適切に反映されている状態を意味します。数値だけを追い求めるのではなく、誠実な執筆を心がけましょう。
よくある質問
なぜ私の類似性スコアが非常に高いのでしょうか?
高いスコアは、あなたの論文が多くのソースからの一致するフレーズを含んでいることを意味します。たとえば、引用が多すぎたり、パラフレーズが不十分であったり、正しく引用されていない可能性があります。どの部分が指摘されているのか、必ずレポートで確認してください。
類似性スコアを下げるにはどうすればよいでしょうか?
自分の言葉で表現し、適切にパラフレーズし、すべての出典を正確に引用してください。過度な引用は避け、既存のテキストを再利用するAIツールに依存しないようにしましょう。
Turnitinのスコアが40%というのは高いのでしょうか?
はい、40%は高いと見なされます。これは、あなたの文章の多くが他のソースと一致していることを示しています。もし引用されていない、または不十分なパラフレーズで記述された部分が多い場合、問題となる可能性があります。
Turnitinのスコアが25%というのは悪いスコアなのでしょうか?
必ずしもそうとは限りません。出典が適切に引用され、一致している部分が主に引用や参考文献で構成されている場合、25%のスコアは許容範囲といえます。大切なのは、単なる数字ではなく、どの種類の内容が指摘されているかという点です。
Turnitinのスコアが50%というのはどういう意味でしょうか?
これは、あなたの文書の約半分が他のソースと一致していることを意味します。警告すべきサインであり、外部資料の過度な使用や盗作の可能性を示唆しています。コピーされた内容への依存を見直し、改善することが望ましいです。
結論
Turnitinスコアの解説はこれで終了です!パーセンテージと色分けの解説を通じて、それぞれの意味をお伝えしました。しかし、最も大切なポイントは、スコアの数字だけにとらわれないことです。何かがフラグされた理由を理解することが本当に重要です。高いスコアが必ずしも不正行為を示すわけではなく、逆に低いスコアが全て問題ないというわけでもありません。大切なのは、どうすればより良い文章を書けるか、引用を正しく行えるか、そしてしっかりとした学問的価値を守れるかを学ぶということです。