Einblicke: Wie entdeckt Turnitin KI in Studentenarbeiten?

Im April 2023 führte Turnitin seine AI-Schreib-Erkennungsfunktion ein – direkt in seinen bekannten Similarity Report integriert. Dieser Schritt erfolgte als Reaktion auf wachsende Bedenken hinsichtlich der Nutzung generativer AI-Tools wie ChatGPT in studentischen Arbeiten.
Während akademische Institutionen bestrebt sind, die Originalitätsstandards zu wahren, hat sich Turnitin als zentraler Akteur bei der Identifizierung von AI-generierten Inhalten etabliert. Aber wie funktioniert die AI-Erkennung von Turnitin eigentlich hinter den Kulissen? Dieser Artikel erklärt es Schritt für Schritt.
Was Turnitin erkennt
Also, kann Turnitin AI erkennen? Die Antwort ist: ja.
Seit April 2023 hat Turnitin als Teil seines Ähnlichkeitsberichts eine Funktion zur Erkennung von KI-Texten eingeführt. Diese Funktion soll zwei Hauptarten von Inhalten identifizieren:
KI-generierte Inhalte
Text, der den Eindruck erweckt, direkt von generativen KI-Tools wie ChatGPT erstellt worden zu sein, einschließlich Versionen wie GPT-3, GPT-3.5 und GPT-4.KI-umformulierter Inhalt
Text, der zunächst von einer KI erzeugt und anschließend mit KI-basierten Paraphrasierungs-Tools umgeschrieben wurde, sodass er menschlicher wirkt.
Wie Turnitin KI-Schreiben in Aufsätzen erkennt
Aber wie funktioniert das eigentlich bei der Abgabe eines Studierenden? Hier ist ein Überblick darüber, was hinter den Kulissen passiert.
Schritt 1: Analyse deiner Einreichung
Wenn du eine Arbeit einreichst, schaut Turnitin nicht das Ganze auf einmal an. Stattdessen wird das Dokument in kleinere Abschnitte unterteilt – in der Regel jeweils einige hundert Wörter. Warum? Kleinere Abschnitte ermöglichen es dem System, den Schreibstil, die Struktur und die Sprachmuster präziser zu analysieren.
Schritt 2: Bewertung einzelner Segmente mithilfe von KI-Modellen
Jeder Abschnitt wird durch Turnitins eigene KI-Erkennungsmodelle geprüft. Diese Modelle vergeben einen Wert zwischen 0 und 1:
Nahe 0 = vermutlich von Menschen verfasst
Nahe 1 = vermutlich KI-generiert
0,5–1 = möglicherweise mit KI-Einfluss vermischt
Diese Zahlen geben die Wahrscheinlichkeit wieder, nicht die absolute Gewissheit. Man kann sie als einen „Risikowert“ pro Abschnitt betrachten.
Schritt 3: Gesamt-KI-Anteil
Nachdem alle Abschnitte analysiert wurden, fasst Turnitin die Werte zu einem Gesamtwert zusammen: dem KI-Anteil. Dieser zeigt, wie viel Prozent deiner Arbeit möglicherweise von einer KI generiert oder durch einen KI-basierten Paraphrasierer verändert wurde.
Wichtiger Hinweis:
Dieser Prozentsatz bezieht sich ausschließlich auf relevanten Text – typischerweise Fließtext. Aufzählungen, Listen oder Codeblöcke werden nicht berücksichtigt.
Obwohl dieser Prozentsatz im Bericht erscheint, beeinflusst er nicht den eigentlichen Ähnlichkeitswert.
Schritt 4: Mustererkennung – So entdeckt Turnitin KI
Turnitin „rät“ nicht einfach, ob ein Text von ChatGPT oder ähnlichen Modellen stammt. Es sucht gezielt nach Muster, die typisch für KI-generierte Sprache sind:
Vorhersehbare Satzstrukturen
Wiederholte Formulierungen
Kaum Variation in der Satzlänge
Übermäßiger Einsatz von Übergangsfloskeln
Diese Merkmale finden sich häufig in Inhalten, die von großen Sprachmodellen wie GPT erzeugt wurden.
Schritt 5: KI-Erkennungsbericht & Farbcodes
Sobald die Analyse abgeschlossen ist, stellt Turnitin einen Bericht über das KI-Schreiben bereit. So kannst du die Ergebnisse interpretieren:
Farbindikatoren:
🔵 Blau (20%–100%): Erfolgreich verarbeitet. Zeigt entdeckte KI-Inhalte an.
🔵 Blau mit * (1%–19%): Erkennung mit geringem Vertrauensniveau. Diese Werte sind weniger zuverlässig – ein Sternchen signalisiert, dass man nicht überreagieren sollte.
⚪ Grau (--%): Wurde nicht verarbeitet. Das kann an Dateiformatproblemen oder einer zu alten Einreichung liegen.
❗ Fehler (!): Systemfehler. Turnitin konnte die Analyse nicht abschließen – versuche es erneut.
Wie Turnitins KI-Detektoren trainiert werden
Turnitins KI-Erkennungssystem basiert auf einem transformerbasierten Deep-Learning-Modell. Dieses Modell verarbeitet den Text in kleinen, sich überlappenden Segmenten, die jeweils etwa fünf bis zehn Sätze (einige hundert Wörter) umfassen. Diese „Segmentfenster“ wandern satzweise durch das Dokument, sodass das System genügend statistische Daten aus den Wörtern und Formulierungen jedes Fensters sammeln kann. So entscheidet das Modell, ob der Text in einem Segment den typischen Merkmalen von KI-generierten Inhalten entspricht.
Für jedes Segment gibt das Modell einen Wert zwischen 0 und 1 aus. Werte näher bei 1 deuten darauf hin, dass das Segment sehr wahrscheinlich von KI verfasst wurde, während Werte näher bei 0 auf menschliche Herkunft hinweisen. Turnitin berechnet dann den Durchschnitt dieser Werte für alle Segmente, die einen bestimmten Satz enthalten, um diesem Satz einen KI-Wahrscheinlichkeitswert zuzuweisen. Überschreitet der Wert einen bestimmten Schwellenwert, wird der Satz als KI-generiert oder als Ergebnis einer KI-Paraphrasierung (im Falle des AIR-Modells) gekennzeichnet.
Ein gesamtes Dokument wird von Turnitin nur dann als „KI-generiert“ eingestuft, wenn mehr als 20 % der Sätze den festgelegten Schwellenwert überschreiten. Dieser Grenzwert hilft, falsch-positive Ergebnisse zu vermeiden, insbesondere bei Dokumenten, in denen weniger als 20 % des Inhalts KI-Charakteristika aufweisen und somit die Fehlerwahrscheinlichkeit höher ist. Zudem müssen Dokumente mindestens 300 Wörter umfassen, um zuverlässig verarbeitet werden zu können.
AIW and AIR Models
Turnitins Tool zur Erkennung von KI-generierten Texten wurde zunächst mit dem AIW-1-Modell eingeführt und später auf AIW-2 weiterentwickelt. AIW-2 erkennt nicht nur klassische KI-generierte Inhalte, sondern auch Texte, die mithilfe von KI-Paraphrasierungstools verändert wurden, um die KI-Ursprünge zu verschleiern.
Neben AIW kommt bei Turnitin das AIR-1-Modell zum Einsatz, das speziell KI-Paraphrasierungen erkennt. AIR-1 identifiziert die charakteristischen statistischen Spuren, die von KI-Paraphrasierungstools hinterlassen werden und sich von herkömmlich KI-generierten Texten unterscheiden. Dadurch kann Turnitin Sätze hervorheben, die von KI verändert wurden, und Lehrkräften ein klareres Bild über die Herkunft des Textes vermitteln.
Das AIR-1-Modell wird nur bei Dokumenten aktiviert, die von AIW-2 als mindestens zu 20 % KI-generiert erkannt wurden, und weist Sätzen, die als von Menschen geschrieben identifiziert wurden, keine Paraphrasierungskennzeichnungen zu.
Trainingsdaten und Modellgestaltung
Turnitins Modelle werden anhand eines umfangreichen und vielfältigen Datensatzes trainiert, der etwa 20 Jahre akademischen Schreibens umfasst – inklusive von Menschen geschriebener sowie KI-generierter Texte aus unterschiedlichen Fachbereichen und von Studierenden mit verschiedenen Hintergründen. Der Datensatz beinhaltet auch Mischformen, wie beispielsweise menschliche Texte, die von KI paraphrasiert wurden, oder KI-Texte, die einer Paraphrasierung unterzogen wurden.
Besondere Sorgfalt galt der Einbeziehung von Texten von Nicht-Muttersprachlern des Englischen, Studierenden aus verschiedenen Ländern und weniger verbreiteten akademischen Disziplinen, um Vorurteile zu minimieren und die Fairness zu erhöhen.
Wo Turnitins KI-Bericht erscheint
Turnitins KI-Erkennung ist kein eigenständiges Tool — sie ist direkt in die Similarity Report-Oberfläche integriert.
Teil des Similarity Reports
Wenn eine Arbeit eingereicht wird, verarbeitet Turnitin den Inhalt genauso wie bei der Plagiatserkennung. Ist die KI-Erkennung aktiviert, erscheint ein AI Writing Indicator in der Seitenleiste des Berichts. Ein Klick darauf zeigt, welche Abschnitte möglicherweise von einer KI erstellt oder umformuliert wurden.
Dieser Indikator wird unabhängig vom Plagiatswert berechnet. Es handelt sich um eine zusätzliche Analyseeinheit — keine Bewertung.
Sichtbarkeit von den Institutionen gesteuert
Das KI-Erkennungstool funktioniert nur, wenn die Institution es aktiviert hat. Das bedeutet:
Einige Schulen entscheiden sich möglicherweise dafür, es ausschließlich den Lehrkräften anzuzeigen.
Andere schalten es komplett ab.
Studierende sehen in der Regel die KI-Ergebnisse nicht auf ihrer Seite.
Der Zugang wird auf Schulebene geregelt, weshalb die Sichtbarkeit variieren kann.
Wie man Turnitin-KI-Hinweise vor der Einreichung überprüft
Da Studierende normalerweise keinen Zugriff auf Turnitins KI-Ergebnisse haben, greifen viele auf andere professionelle Tools zurück, die nachbilden, wie Turnitin KI-generierte Inhalte erkennt.
Eine häufig verwendete Option ist:
TurnitinDetector.com – ein Tool, das Turnitins KI- und Plagiatsprüfungen simuliert.
Setzt Turnitins tatsächliche Erkennungs-Engine ein (keine Nachbildung).
Speichert Ihre Datei nicht in einer Datenbank.
Liefert Ergebnisse, die nahezu identisch mit denen der Lehrkräfte sind.
Dies ermöglicht es Studierenden, potenzielle KI-Hinweise zu überprüfen, bevor sie ihre Arbeit in das LMS ihrer Schule hochladen.
Begrenzungen und Genauigkeit der KI-Erkennung von Turnitin
Turnitin’s KI-Prüftool ist ein nützliches Instrument – allerdings nicht fehlerfrei. Das sollten Studierende und Dozenten beachten:
KI-Erkennung ≠ Endgültiges Urteil
Turnitin macht deutlich, dass dieses KI-Erkennungstool kein abschließendes Urteil liefert. Es stellt lediglich einen Anhaltspunkt für Lehrkräfte dar. Die Plattform empfiehlt, den Kontext – etwa die bisherige Schreibweise und die Leistungen der Studierenden – in die Bewertung einzubeziehen, bevor Schlussfolgerungen gezogen werden.
Falsche Positive sind möglich
Turnitin weist auch auf die Möglichkeit von Fehlalarmen hin und schlägt vor, in unklaren Fällen zugunsten der Studierenden zu entscheiden. Es wird betont, dass diese Funktion den Dialog zwischen Studierenden und Lehrkräften, nicht das Misstrauen, fördern sollte.
Auch wenn das Tool Inhalte als KI-generiert markiert, können sie tatsächlich von Menschen verfasst sein. Dies trifft besonders auf Studierende zu, deren natürlicher Schreibstil Ähnlichkeiten mit von KI erzeugter Sprache aufweist – strukturiert, repetitiv oder übermäßig formell.
Deshalb ist die Einschätzung der Lehrkräfte so wichtig. Pädagogen wird geraten, Folgendes zu berücksichtigen:
Die bisherigen Schriften der Studierenden
Die Leistung im Kurs
Den Kontext der Aufgabe, bevor endgültige Schlussfolgerungen gezogen werden.
Ständige Updates – aber nicht perfekt
Turnitin’s Tool bleibt wirksam, indem es regelmäßig aktualisiert wird, um mit neuen KI-Modellen wie GPT-4 und GPT-4o Schritt zu halten. Es richtet sein Augenmerk auf Sprachmuster, die typischerweise von generativen Modellen erzeugt werden – wie durchgehend ähnliche Satzstrukturen oder vorhersagbare Formulierungen.
Dennoch können neuere oder fortschrittlichere KI-Tools manchmal unbeachtet bleiben. Daher empfiehlt Turnitin, dass Lehrkräfte sich über die Grenzen der Erkennung informieren und die Ergebnisse als einen Bestandteil eines umfassenderen Bewertungsprozesses ansehen.
FAQ
Kann Turnitin wirklich KI erkennen?
Ja, Turnitin kann Inhalte markieren, die wahrscheinlich von KI geschrieben oder paraphrasiert wurden, indem es seine Erkennungsmodelle verwendet. Allerdings ist es nicht 100% genau und sollte mit menschlichem Urteilsvermögen interpretiert werden.
Wie viel KI ist in Turnitin akzeptabel?
Es gibt kein festgelegtes Limit. Turnitin bestraft nicht auf Basis des KI-Anteils. Lehrende entscheiden, was im Rahmen der Aufgabe und des Kontexts akzeptabel ist.
Ist 40% in Turnitin schlecht?
Nicht unbedingt. Eine 40%ige KI-Bewertung bedeutet, dass ein Teil des Textes Mustern ähnelt, die von KI erzeugt wurden. Dies bestätigt jedoch kein Fehlverhalten. Ihre Lehrkraft wird den Kontext beurteilen.
Zusammenfassung
Wir haben besprochen, wie Turnitin KI-gestütztes Schreiben erkennt – mittels Segmentanalyse, Mustererkennung und KI-Vorhersagemodellen. Obwohl es ein hilfreiches Werkzeug zur Identifizierung von KI-generierten oder KI-paraphrasierten Inhalten ist, liegt die endgültige Bewertung letztlich bei den Lehrenden. Das Verständnis darüber, wie das System funktioniert, kann sowohl Studierenden als auch Lehrkräften helfen, es effektiver zu nutzen.