Turnitin détecte-t-il l'IA ? Modèles rapports précision exp

Avec la popularisation des outils d'écriture basés sur l'IA, tels que ChatGPT, nombreux sont ceux qui s'interrogent : Turnitin peut-il réellement identifier les contenus générés par l'IA ?
Dans cet article, nous allons décortiquer le fonctionnement de la détection de l'IA par Turnitin, ses capacités et ses limites, ainsi que les implications pour l'intégrité académique aujourd'hui.
Turnitin détecte-t-il l'IA ?
Oui.
Turnitin a officiellement lancé son outil de détection de l'écriture par l'IA en 2023. Cette fonctionnalité est directement intégrée au rapport de similarité, que de nombreux enseignants utilisent déjà pour vérifier le plagiat. Au lieu de simplement rechercher les passages copiés, cet outil analyse si le texte a pu être généré ou paraphrasé via des modèles linguistiques de grande envergure comme ChatGPT, ou des outils tels que Quillbot.
Quel type de contenu est réellement détecté ?
Le modèle d'IA de Turnitin est conçu pour identifier les contenus qui semblent avoir été rédigés par de grands modèles linguistiques (LLM), tels que ChatGPT, Claude, et d'autres. Il analyse la structure des phrases, le vocabulaire employé et le ton utilisé – autant d'éléments susceptibles de révéler un contenu généré par l'IA.
Le rapport répartit les résultats en deux catégories :
✅ Texte généré par l'IA
Contenu qui semble avoir été directement rédigé par un outil d'IA.🔄 Texte paraphrasé par l'IA
Contenu qui semble avoir été généré par l'IA, puis reformulé à l'aide d'un outil de paraphrase comme Quillbot, ou un outil de "spinning" d'IA.
En résumé, Turnitin est en constante évolution. L'outil ne se contente plus de détecter les dissertations entièrement rédigées par l'IA, mais identifie également les modifications subtiles apportées par des systèmes automatisés.
Langues prises en charge (à partir de juillet 2025)
À l'heure actuelle, la détection d'IA de Turnitin est fonctionnelle pour l'anglais, le japonais et l'espagnol.
Cependant, la détection du contenu paraphrasé par l'IA – qui identifie les textes ayant été réécrits à l'aide d'outils tels que Quillbot – n'est pour l'instant disponible que pour les textes en anglais.
Seuls les enseignants et les administrateurs ont accès au rapport de détection de l'écriture par l'IA. Par défaut, les étudiants ne peuvent pas consulter ces informations.
Quels détecteurs d'IA Turnitin utilise-t-il ?
Turnitin ne s'appuie pas sur des services de détection d'IA tiers comme beaucoup d'autres plateformes. Au lieu de cela, il a développé ses propres outils internes, connus sous le nom de AIW (AI Writing detector) et AIR (AI Revision detector). Ce sont des systèmes sophistiqués formés spécifiquement pour analyser l'écriture académique à la recherche de traces de contenu généré par l'IA ou paraphrasé par l'IA - et oui, il y a une grande différence entre les deux.
AIW est conçu pour identifier le type de modèles que les grands modèles de langage comme GPT-3, GPT-4 ou Gemini produisent généralement. Ces modèles génèrent du contenu en sélectionnant le mot suivant le plus probable dans une séquence, en fonction de quantités massives de données d'entraînement provenant d'Internet. Bien que cela puisse paraître intelligent, cela se traduit par une écriture étrangement cohérente - trop cohérente. L'écriture humaine, en revanche, est pleine de bizarreries, d'incohérences et de tournures de phrase imprévisibles. Ce contraste est ce que le modèle AIW de Turnitin est formé à détecter.
Ce système de détection ne devine pas - il prend des décisions probabilistes basées sur la probabilité qu'une phrase ait été générée par un LLM. Plus une phrase se rapproche de cette structure prévisible et mécanique, plus la probabilité qu'elle soit signalée est élevée. Mais Turnitin ne signale pas les mots individuels. Il évalue des phrases complètes et des segments, chacun d'environ 5 à 10 phrases, se chevauchant pour maintenir le contexte. Chaque segment est noté entre 0 et 1, 1 indiquant une forte probabilité de génération par l'IA.
Mais la détection ne s'arrête pas là. Si un segment est signalé comme étant écrit par l'IA, il est ensuite transmis au deuxième outil de Turnitin, AIR, qui évalue si le contenu a été paraphrasé par un réécriveur d'IA comme Quillbot ou l'outil de paraphrase de Grammarly. Cette étape est importante car de nombreux étudiants utilisent maintenant l'IA pour réécrire du contenu d'IA afin d'échapper à la détection. Le travail d'AIR est d'attraper cette couche de manipulation de la machine.
Les deux modèles ont été formés sur un large éventail de données - pas seulement du texte généré par l'IA, mais aussi de vrais essais d'étudiants de diverses disciplines, niveaux d'éducation et origines linguistiques. Ce type d'ensemble de formation diversifié aide le modèle à éviter les biais et réduit les faux positifs, en particulier pour les étudiants qui parlent l'anglais comme langue seconde ou écrivent dans des styles académiques moins courants.
En bref, lorsqu'un étudiant soumet un document, Turnitin le découpe, analyse chaque élément à la recherche de signes de structure générée par la machine, évalue si des outils de paraphrase d'IA ont été utilisés, puis produit un rapport visuel pour les instructeurs. Le rapport ne se contente pas de signaler le texte - il le décompose en ce qui a probablement été écrit par l'IA et ce qui a probablement été paraphrasé par une autre machine.
Quels types de fichiers le détecteur d'IA de Turnitin peut-il analyser ?
La détection de contenu généré par IA de Turnitin ne se limite pas au contenu de votre texte, mais aussi à la façon dont vous le soumettez. Si votre fichier ne respecte pas certaines exigences techniques, Turnitin ne procédera à aucune analyse d'IA. Voici donc ce que vous devez savoir pour que votre document soit correctement analysé à la recherche de contenu généré par IA.
Premièrement, le document doit être suffisamment long. Turnitin exige désormais un minimum de 300 mots, soit 300 mots de texte, et non des listes, du code, ou des plans. Pourquoi cette augmentation par rapport à l'ancien minimum de 150 mots ? Selon Turnitin, les tests internes ont démontré qu'un volume de contenu légèrement supérieur améliorait considérablement la précision de la détection. En effet, des segments plus longs aident le modèle à identifier les schémas caractéristiques de la rédaction par IA.
Par ailleurs, la longueur maximale est de 30 000 mots. Au-delà, Turnitin ignorera complètement l'analyse par IA. Cette limite de mots permet de trouver un juste milieu entre une analyse approfondie et le maintien de l'efficacité du modèle.
En ce qui concerne les types de fichiers, Turnitin prend en charge les formats académiques standard :
✅ .docx
✅ .pdf
✅ .txt
✅ .rtf
Qu'est-ce qui ne fonctionnera pas ? Tout ce qui ne peut pas être interprété comme du texte brut, donc oubliez les liens Google Docs, les tableurs ou les PDF basés sur des images.
📌 La taille du fichier est également importante : elle est limitée à moins de 100 Mo, ce qui est largement suffisant pour des fichiers texte. Toutefois, si votre fichier comporte de nombreuses images intégrées, une mise en forme ou des éléments volumineux (comme des pages numérisées), il pourrait dépasser cette limite et être rejeté.
Enfin, il y a le filtre de langue. Bien que la détection de l'IA soit proposée en anglais, japonais et espagnol, la détection du contenu paraphrasé par l'IA (qui identifie les textes reformulés à l'aide d'outils tels que Quillbot) n'est actuellement disponible qu'en anglais.
En résumé, si votre fichier pèse moins de 100 Mo, contient entre 300 et 30 000 mots, est dans un format de document lisible et est rédigé dans l'une des langues prises en charge, Turnitin lancera la détection de l'IA. Dans le cas contraire, il sera ignoré, ou l'analyse de l'IA ne sera pas déclenchée.
Quelle est la précision du rapport de détection d'IA de Turnitin ?
La fonctionnalité de détection de l'écriture par l'IA de Turnitin est désormais intégrée à son rapport de similarité, mais quelle est sa fiabilité, en fait ?
Lorsqu'un document est soumis, et une fois qu'il a passé les contrôles techniques de Turnitin (nombre de mots minimum, type de fichier, langue, etc.), le système traite le texte et affiche un score d'IA, représenté par un badge bleu avec un pourcentage. Ce pourcentage indique la quantité de prose admissible que le modèle de Turnitin estime avoir été générée par l'IA, et non le pourcentage de la soumission entière.
Toutefois, si ce score est inférieur à 20 %, Turnitin l'indique par un astérisque (* %) au lieu d'afficher un nombre. Pourquoi ? Parce que la plateforme reconnaît que les scores d'IA faibles sont moins fiables et peuvent entraîner un taux plus élevé de faux positifs. C'est une mesure de contrôle qualité, et une preuve d'honnêteté.
Si Turnitin ne parvient pas à traiter le document (par exemple, type de fichier incorrect, nombre de mots insuffisant ou soumission antérieure au lancement de la détection de l'IA), un tiret gris (– –) s'affiche à la place du score. Dans de rares cas, si un problème survient lors du traitement, un symbole d'erreur (!) apparaît.
Taux de précision de Turnitin : les données à l'appui
Turnitin affirme maintenir un taux de faux positifs (FPR) inférieur à 1 %, ce qui signifie que, sur 100 documents entièrement rédigés par des humains, moins d'un est incorrectement signalé comme généré par l'IA. C'est son objectif principal, confirmé par des tests internes à grande échelle.
En effet, en avril 2023, Turnitin a mené une évaluation comparative approfondie à l'aide de 800 000 travaux universitaires antérieurs à ChatGPT pour s'assurer que son modèle ne confonde pas le style d'écriture étudiant habituel avec une production de l'IA. Cette phase de test a permis à l'entreprise d'affiner plusieurs méthodes de détection et de perfectionner ses classificateurs pour éviter les fausses alertes.
Mais voici le compromis : pour maintenir un faible taux de faux positifs, Turnitin accepte de ne pas détecter jusqu'à 15 % du texte réellement généré par l'IA. Ainsi, si le détecteur d'IA identifie 50 % d'un document comme étant généré par l'IA, la proportion réelle de contenu écrit par l'IA pourrait être plus proche de 65 %. Cette approche prudente privilégie l'équité envers les étudiants à une détection systématique, et ce choix est intentionnel.
Turnitin reconnaît qu'il préfère être prudent, car accuser à tort un étudiant d'utiliser l'IA peut avoir de lourdes conséquences. Par conséquent, la précision (ne pas signaler à tort le travail rédigé par des humains) est privilégiée par rapport à la détection exhaustive (identifier chaque portion de texte générée par l'IA).
Améliorations du modèle pour une précision accrue
Turnitin améliore continuellement son protocole de détection, en se basant sur des données concrètes. Les principales modifications comprennent :
L'augmentation du nombre minimal de mots requis pour la détection de l'IA, passant de 150 à 300 mots, afin de réduire les interférences et d'améliorer la fiabilité.
La suppression des scores d'IA inférieurs à 20 % en raison de leur forte variabilité et du risque de faux positifs.L'ajustement de l'analyse des introductions et des conclusions, car les premiers tests ont révélé que ces sections étaient plus susceptibles de déclencher de fausses alertes, potentiellement en raison de leur formulation générique ou de structures prévisibles.
La détection de l'IA de Turnitin est-elle gratuite ?
La détection de l'IA par Turnitin était gratuite durant sa phase d'essai, afin d'aider les enseignants à s'adapter rapidement aux nouveaux défis. Toutefois, depuis janvier 2024, Turnitin a adopté un modèle de licence payante pour financer la recherche continue, le développement et l'amélioration de son infrastructure. Ainsi, les fonctionnalités de détection de l'IA ne sont plus gratuites et entraînent un coût additionnel en sus de la licence de base.
FAQ
Q1 : Quels détecteurs Turnitin utilise pour détecter l'IA ?
Turnitin utilise deux outils internes : l'un pour détecter les textes écrits par l'IA (AIW) et l'autre pour repérer les contenus paraphrasés par l'IA (AIR).
Q2 : Est-ce que Turnitin vous dit s'il détecte l'IA ?
Oui, mais seuls les enseignants et les administrateurs ont accès au rapport d'IA. Les étudiants ne reçoivent pas ce retour automatiquement.
Q3 : Quelle quantité d'IA est acceptable dans Turnitin ?
Il n'y a pas de limite définie. Chaque établissement décide du niveau d'utilisation de l'IA autorisé.
Q4 : Comment éviter d'être détecté par Turnitin pour l'utilisation de l'IA ?
Rédigez avec votre propre style, révisez en profondeur tout texte assisté par l'IA, et évitez d'utiliser l'IA pour la rédaction complète de dissertations ou pour les outils de reformulation.
Conclusion
Alors, Turnitin est-il capable de détecter l'IA ? La réponse courte est oui, mais ce n'est pas une science exacte et la technologie évolue constamment. Les outils d'IA sont en constante amélioration, et Turnitin s'efforce de rester à la pointe. Au final, ce n'est qu'un outil parmi tant d'autres. L'essentiel est la manière dont les étudiants et les enseignants l'utilisent. Rester honnête et informé est le meilleur moyen de garantir l'équité.