良いTurnitin評価とは? 単なる数値以上だ

もしTurnitinを通じて課題を提出したことがあるなら、その類似性スコアが表示されるのをドキドキしながら待ったことでしょう。
8%と表示されて誇りに思ったかもしれませんし、38%と出てきて焦ったかもしれません。しかし、Turnitinのスコアは単なる「合格か不合格か」の数字ではありません。これは一つのツールであり、どんなツールもその正しい使い方を理解してこそ役立つものです。
では、「良い」Turnitinスコアとは一体どんなものなのでしょうか? 詳しく見ていきましょう。
良いTurnitinスコアとは何ですか?
その質問に答える前に、まず立ち止まって、Turnitin scoreが実際に何を示しているのかを確認してみましょう。
Turnitinに論文を提出すると、通常はSimilarity Reportと、最近ではAI Writing Reportという2種類のレポートが提供されます。これらは全く異なる内容を評価しています。
Similarity Scoreは、提出された作品のどの程度が学術論文、ウェブサイト、過去の学生の提出物などの既存の情報源と一致しているかを示し、それによって引用文内の引用や参考文献リストを適切に管理するための手助けをします。
一方、AI Writing Reportは、ChatGPTのような人工知能ツールによって生成された可能性のあるコンテンツを検出するために、Turnitinが新たに導入した機能です。
ですから、「良い」スコアがどのようなものかを論じる前に、まずこれら2種類のレポートが実際に何を意味しているのかを理解する必要があります。まずはTurnitinがコンテンツをどのように検出しているのかを見て、その後で本題に戻りましょう。
優れたTurnitin類似性スコアとは?
まず第一に、Turnitinは論文が盗用されているかどうかを判断しません。
Turnitinが行うのは、あなたの文章がデータベース内のどの部分と一致しているかを示す類似性レポートの作成です。このデータベースには、学生の提出物、発表された学術資料、さらにはオンライン上のコンテンツが含まれています。
類似性スコアとは?
類似性スコアは、あなたの文書がTurnitinのシステム内にある既存のコンテンツとどの程度一致しているかを示す割合です。
計算方法は次の通りです:
類似性 % = (一致した単語数 ÷ 文書内の総単語数) × 100
例えば、1,000語のエッセイのうち200語が他の出典と一致する場合、類似性スコアは20%になります。
しかし、類似性スコアだけでは全体像は掴めません。一致している単語が何かを理解するためには、完全なレポートを確認する必要があります。
スコアに影響を与える主な要因は何でしょうか?
いくつかの状況では類似性スコアが上昇します。中には全く問題のないものもあれば、注意が必要なものもあります。
主な要因は以下の通りです:
引用テキストまたはブロック一致: Turnitinは、正しく引用されていても、正確な引用部分をすべて一致として認識します。これらは必ずしも悪い一致ではありませんが、スコアを上げる原因となります。
大量の単語一致: 大きなテキストブロックをそのままコピーしたり、内容をほぼそのまま言い換えた場合、スコアは上昇します。
チェッカーボード一致: コピーとオリジナルの文章が交互に配置されるパターン(例えば、交互に文が現れる場合)では、レポート上で疑念が生じる可能性があります。
質的な一致: Turnitinは単語単位の一致だけでなく、言い回しや構造にも着目します。そのため、たとえ完全一致がなくても、文章が出典のスタイルに過度に似ていると判断されることがあります。
文書の種類と長さ: 研究重視あるいは長文の論文は、引用文献が多いため、自然とスコアが高くなる傾向があります。
引用と参考文献: 正しい引用であってもスコアに反映されますが、通常は検証しやすく、ペナルティの対象にはなりません。
類似性スコアの色は何を意味するのですか?
Turnitinでは、類似性のレベルを一目で確認できるように色のインジケーターが使われています。表示方法は、使っているプラットフォーム(クラシックフィードバックスタジオや「My Files」ビュー)によって多少異なるものの、意味合いは同じです:
類似性スコアの範囲 | クラシックの課題(Feedback Studio) | "My Files" ビュー |
0% 一致するテキスト | 青 | 緑 |
1–24% 一致するテキスト | 緑 | 青 |
25–49% 一致するテキスト | 黄 | 黄 |
50–74% 一致するテキスト | オレンジ | オレンジ |
75–100% 一致するテキスト | 赤 | 赤 |
ご覧の通り、オレンジと赤は最も懸念すべきケースですが、これだけで盗用があったと決めつけるわけではありません。適切に引用された資料、以前Turnitinに提出されたドラフト、一般的な学術表現、または他人が先に作品を提出した場合などが原因となることがあります。大きな作品では、パーセンテージが切り捨てられるため、実際の一致率が見えにくいこともあります。ですから、数字だけに頼らず、レポート全体をしっかりと確認することが重要です。
では、どんな類似性レポートスコアが妥当なのでしょうか?
ここで言えるのは、完璧な類似性スコアという普遍的な基準は存在しないということです。機関や課題、指導者によって基準は異なります。
それでも、15~20%のスコアは多くの学術環境で安全と見なされることが一般的です。特に、出典の利用が求められる研究課題の場合はなおさらです。
しかし、重要なのは、単なる数字だけではなく、その内訳が肝心だという点です。
いくつか例を挙げてみましょう:
35%のスコアは一見高く感じられますが、そのうち30%が正しく引用された部分であれば、実際のリスクはわずか5%に過ぎません。
19%のスコアは理想的に見えるかもしれませんが、もしその大部分がオンラインソースからの引用されていない1つの段落によるものであれば、深刻な問題を孕んでいる可能性があります。
たとえ0%などの低いスコアであっても、指導者が研究の活用を期待している場合には、裏付けとなる証拠が不足しているという疑念を招くかもしれません。
要するに、ただ単に低いスコアを追い求めるのではなく、高品質な論文を目指すことが大切です。類似性レポートは、点数を競う道具ではなく、フィードバックとして活用しましょう。
特別なケース:
大規模な文書の提出:
非常に大きな文書の場合、レポート内に一致するテキストがいくつか含まれていても、スコアが切り捨てられるために0%の類似性スコアと表示されることがあります。複数のドラフトを提出した場合:
同じ論文の複数ドラフトを機関の非公開リポジトリに提出すると、以前のバージョンと一致するため、最終ドラフトが100%のスコアになってしまう可能性があります。他の誰かがあなたの作品を先に提出した場合:
もし他の人があなたより先に文書を提出すると、その提出物は低い類似性スコア(例: 25%)となるかもしれませんが、その後、あなたがオリジナルを提出すると、Turnitinは100%の類似性スコアを表示します。
良いTurnitin AIライティングスコアとは?
ここまででTurnitinが類似度スコアをどのように計算しているかを説明しましたので、次にAIが生成した文章のスコア付けについて見ていきましょう。Turnitinの類似性レポートを開くと、サイドパネルに別途AIライティング指標が表示されているのが分かります。この機能は、ChatGPTやパラフレーズ用ソフトウェアといったAIツールによって生成または修正された可能性のあるテキストを検出するために特化して設計されています。類似度スコアとは独立しているため、別途説明が必要なのです。
AI指標には通常、次の3つの状態が表示されます:
青(パーセンテージ付き:0または20から100の間): このパーセンテージは、TurnitinのAI検出モデルがテキストの何割をAIが生成したと判断しているかを示しています。
灰色(パーセンテージ非表示、「- -」と表示): これは、AI検出が提出物の処理に失敗したことを意味します。例えば、TurnitinがAI検出機能を導入する前に提出された論文の場合や、ファイルが技術的要件を満たさない場合に発生することがあります。
エラー(!)指標: これは、技術的な問題により処理が失敗したことを示しており、稀に発生します。
1%から19%のスコアにはアスタリスク(*%)が付けられています。これは、誤って人間が書いた文章がAI生成と誤認識される偽陽性がこの範囲で発生しやすいためです。混乱を避けるため、Turnitinはこれらのスコアでは正確なパーセンテージを表示せず、またAI検出されたテキストを強調表示しません。
さらに、エッセイを確認すると、AIレポートでは検出されたAIコンテンツが次の2つのカテゴリーに分けられています:
AI生成のみ: 直接AI言語モデルによって作成された可能性のあるテキストです。この部分はシアンで強調表示されます。
AIパラフレーズされたテキスト: AIが生成した後、QuillbotなどのAIパラフレーズツールを用いて修正されたとみられるテキストです。この部分はパープルで強調表示されます。
では、どのようなAIスコアが許容範囲と言えるのでしょうか?
類似度スコアと同様に、決まった「良い」AIスコアというのは存在しません。0% AIスコアは、AIによる生成が一切検出されなかったことを意味し、これは多くの教員が好む結果です。しかし、少量のAI検出テキストがあるからといって必ずしも不正を示すわけではなく、あなたの文章とAIの学習データとの重なりや、軽微な修正のために正当にAIツールを利用した結果である可能性もあります。
一方で、高いAIスコア(例:20%以上)は、提出物の大部分がAIによって作成または大幅に編集された可能性を示唆しており、所属機関の方針によっては問題視されることがあります。
教師は優れたTurnitinスコアをどのように捉えるか?
Turnitinの類似度スコアに対する受け入れ基準については、教育現場で意見が大きく分かれています。Redditなどのプラットフォームでの議論を見ても、「良い」とされる、あるいは受け入れ可能な類似度の割合に関する様々な見解が存在しています。
多くの教師は単なる数値以上に、その背景となる文脈が大切であると強調しています。例えば、ある教育者はTurnitinが必ずしも盗作を意味するわけではなく、正しく引用された引用文や一般的なフレーズなどもマッチとして表示する可能性があると指摘しました。別の教師は、低い類似度スコアが必ずしも独自性を保証するものではなく、低いスコアにも関わらず盗作をしているケースもあれば、逆に高いスコアでも盗作が認められない場合があると述べています。
また、複数の教育者は厳密なパーセンテージの基準を設けることに反対しています。むしろ、Turnitinが何をハイライトしているのか―たとえば、単語数の少ない場合なのか、あるいは出典のない文章や段落全体なのか―に注目すべきだという意見です。具体的には、以下のような指摘があります:
低いパーセンテージ(例:5%)でも、もし正確な文章が引用なしでコピーされていれば問題となります。
高いパーセンテージ(例:35~40%)の場合、主に引用された資料や正しく引用された情報が含まれていることが多く、これは盗作とは言えないものの、独自の議論がやや弱いことを示している場合があります。
共通して言われるのは、どんなに低い数値でも「安全」と言える普遍的な基準はないということです。そのため、講師たちはハイライトされた部分を細かくチェックし、実際に盗作があったかどうかを判断するよう推奨しています。ある者は「半文以上が同一と判定されるべきではない」というルールを提案し、またある者は類似度スコアに関わらず、そもそも学生に盗作をしないよう教育することが大切だと主張しています。
まとめると、Turnitinスコアだけで学生の独自性を評価するのは不十分であり、教育者は報告書の具体的な一致点と、それが学術的誠実性にどう関わるかを重視しています。
よくある質問:
Q: Turnitinで類似度を0%にするにはどうすればよいですか?
A: 完全に自作の表現を用い、他からの文章をそのまま使わず、全ての出典を正しく引用してください。ただし、通常は0%にこだわる必要はなく、むしろ引用が不足していることを示している場合もあります。
Q: Turnitinで許容される類似度の割合はどのくらいですか?
A: 状況にもよりますが、一般的には15–20%程度が目安とされています。
Q: Turnitinで25%の類似度は高すぎるのでしょうか?
A: 一概には言えません。もし25%が適切に引用された部分や一般的な表現、参考文献から来ているのであれば、問題ない場合もあります。どの部分が一致しているのかを必ず確認してください。
Q: Turnitinで40%のスコアは非常に悪いのでしょうか?
A: 多くの部分がオリジナルでなく引用もされていない場合は懸念されますが、ほとんどが正しく引用されている場合は、特に研究論文のような課題では許容されることもあります。
Q: Turnitinで7%のスコアは理想的と言えますか?
A: はい、7%は一般的に低く安全な範囲です。ただし、低いスコアであっても、引用されていない部分や不適切に意訳された内容がないかをチェックすることが大切です。
結論
結局のところ、「良い」Turnitinスコアとは何か―類似性チェックでもAI検出でも―一概に決まった答えがあるわけではありません。これらのスコアはあくまで潜在的な問題点を示すためのツールであって、最終的な評価を下すものではありません。大切なのは、講師がレポートをどのように解釈するかという点です。スコアが高いからといって必ずしも問題があるわけではなく、低いからと言って全てが完璧だとも限りません。常に指摘された点をしっかり確認し、情報源の引用が正確かどうか確認すること、そして何よりも自分の言葉で文章を書くことが重要です。それこそが、あなたの作品を本当に独創的で、学問的にも信頼できるものにするのです。