Que Detector de IA o Turnitin Usa? Modelos, Precisão & Mais

Author image
Escrito por  Raj Patel
2025-07-16 17:08:33 7 min leitura

Com ferramentas de escrita de IA como ChatGPT disponíveis por toda parte, não surpreende que o Turnitin tenha introduzido seus próprios detectores de IA. 

Mas ao contrário daquelas ferramentas gratuitas que oferecem respostas vagas, o sistema do Turnitin é um pouco mais sério — e muito mais complexo internamente. 

Investiguei seu whitepaper oficial e testei seu funcionamento, então neste post, vou mostrar-lhe quais modelos o Turnitin realmente utiliza, como eles identificam a escrita de IA e parafraseada por IA, e o que os diferencia dos demais.

Qual Detector de IA o Turnitin Usa Primeira Tela

1. Qual detector de IA o Turnitin utiliza?

De acordo com o white paper oficial do Turnitin (fonte base deste artigo), o sistema de detecção de IA do Turnitin se baseia em dois modelos fundamentais de aprendizado profundo:

  • AIW (abreviação de AI Writing) é o modelo que verifica se um texto foi gerado por uma IA.

  • AIR (abreviação de AI Rewriting) é um modelo mais recente que procura por textos que foram parafraseados ou reescritos por ferramentas de IA para parecerem mais humanos.

Ambos são desenvolvidos com uma arquitetura baseada em transformers — a mesma tecnologia utilizada por IAs modernas, como o ChatGPT.

O Turnitin lançou inicialmente sua ferramenta de detecção de IA—AIW-1—em abril de 2023. Esse modelo foi atualizado e substituído pelo AIW-2 em dezembro de 2023. Em julho de 2024, o AIR-1 foi adicionado para identificar usos mais sutis de IA, como quando um estudante recorre a uma ferramenta de IA apenas para reformular um conteúdo já existente.

Juntos, esses modelos auxiliam os instrutores a identificar textos que possam ter sido escritos ou modificados por IA, proporcionando uma visão mais aprofundada sobre a originalidade dos trabalhos dos estudantes.

Q: Podem indivíduos utilizar os detectores de IA do Turnitin?

A detecção de IA do Turnitin faz parte do serviço de verificação de originalidade, disponível apenas para instituições como escolas e faculdades. E todo serviço do Turnitin é pago.

Os relatórios estão acessíveis apenas a instrutores e administradores. Portanto, se você for um estudante ou indivíduo, não poderá utilizar diretamente o Turnitin ou seus detectores de IA. Entretanto, existem algumas ferramentas alternativas disponíveis online, inclusive links compartilhados no Discord pela comunidade ou outros aplicativos de detecção de IA.

2. Como o Detector de IA do Turnitin Foi Desenvolvido?

Primeiro, Existia o AIW-1

O primeiro detector de escrita com IA do Turnitin foi chamado AIW-1 e foi lançado em abril de 2023. Ele funcionava analisando os textos em busca de padrões que geralmente aparecem em conteúdos gerados por IA — como uma estrutura demasiadamente fluida, ausência de nuances ou construções de frases repetitivas.

Quando identificava uma quantidade significativa desses padrões em um documento, o texto era sinalizado como provável criação de IA.

Uma das vantagens do AIW-1 era sua taxa muito baixa de falsos positivos — ou seja, ele era cauteloso para não acusar erroneamente uma escrita humana de ter sido gerada por IA. Desde que pelo menos 20% do documento fosse marcado, a chance de um alerta falso era de menos de 1%.

Isso ajudou os professores a confiarem nos resultados, sem reagir exageradamente a situações de dúvida marginal.

Depois Chegou o AIW-2 — Uma Versão Mais Avançada

Mas aqui está o detalhe: as ferramentas de IA estavam evoluindo — especialmente aquelas que reescrevem ou parafraseiam textos. Essas ferramentas reformulam sentenças geradas por IA para que soem mais naturais, o que tornava a detecção muito mais desafiadora.

Por isso, o Turnitin lançou o AIW-2 em dezembro de 2023. Este é um modelo ainda mais inteligente, treinado com uma variedade mais ampla de exemplos:

  • Textos gerados rotineiramente por IA (como os do ChatGPT)

  • Produções autênticas de estudantes de diferentes origens e disciplinas

  • Textos que foram gerados por IA e depois reescritos por um parafraseador de IA

  • Documentos que combinam conteúdos humanos e de IA

O AIW-2 também foi desenvolvido sobre uma arquitetura de deep learning baseada em transformadores, similar aos modelos que estão por trás de ferramentas como o GPT-4. Isso permite reconhecer padrões mais complexos na estrutura, gramática e tom das sentenças — aspectos que os modelos mais simples frequentemente deixam escapar.

Turnitin AIW-1 vs AIW-2 Document and Sentence level FPR

📊 Em junho de 2024, o Turnitin informou que o AIW-2 foi utilizado em mais de 250 milhões de submissões de estudantes (Turnitin, 2024). Isso proporcionou uma base enorme de dados para treinamento e testes.

Em resumo, o AIW-2 representou um grande avanço: aprimorou a precisão da detecção, diminuiu os falsos positivos e tornou o sistema mais robusto contra conteúdos de IA parafraseados.

Até agora, abordamos a detecção de escrita por IA de forma geral. Mas e nos casos em que os estudantes tentam mascarar o texto gerado por IA utilizando ferramentas de parafraseamento? É nesse contexto que entra o modelo mais recente do Turnitin — AIR-1 —.

3. O Modelo AIR-1: Como Ele Detecta o Parafraseamento de AI

Cada vez mais estudantes (e escritores, de modo geral) estão recorrendo a parafraseadores de AI — frequentemente chamados de “text spinners” — para reescrever conteúdos gerados por AI. Essas ferramentas não criam textos do zero como o ChatGPT; elas simplesmente reformulam um texto já existente para tentar mascarar sua origem.

Mas eis o diferencial: ferramentas de parafraseamento deixam impressões digitais estatísticas distintas quando comparadas a modelos completos de escrita por AI.

Assim, o Turnitin precisou de um modelo especializado para identificar esses padrões — e foi assim que o AIR-1, sigla para detecção de reescrita de AI, surgiu em julho de 2024.

O que é Parafraseamento de AI e Por que é Complicado?

Ferramentas de parafraseamento (muitas vezes movidas por AI) pegam textos escritos por um LLM, como o ChatGPT, e os reformulam. O objetivo? Tornar o texto menos robótico e mais parecido com a voz original de um estudante. Essas ferramentas não criam novas ideias — apenas remixam o que já existe.

Do ponto de vista da detecção, essa prática complica a tarefa. Embora a estrutura e o vocabulário possam ser alterados, a assinatura estatística subjacente da escrita por AI geralmente permanece.

Como o AIR-1 Funciona 

Imagine o AIR-1 como um detetive especializado em identificar conteúdos de AI reformulados. Ele não se atém apenas ao que está sendo dito — analisa como está sendo dito, utilizando sutis pistas linguísticas e padrões típicos de textos parafraseados por AI. Não se limita à escolha de palavras ou à construção das frases; investiga padrões mais profundos que os parafraseadores de AI costumam deixar para trás, como o ritmo do texto, a forma de reestruturar ideias e até mesmo as variações na complexidade das sentenças.

Confira o que acontece nos bastidores:

  • Primeiro, o modelo AIW-2 realiza sua análise habitual.

  • Se ele indicar que 20% ou mais do documento provavelmente foi escrito por AI, então o AIR-1 é acionado.

  • O AIR-1 reavalia as sentenças sinalizadas e busca por indícios de que foram parafraseadas por AI.

  • Ao detectar esses sinais, ele destaca a sentença em roxo no relatório de escrita por AI do Turnitin.

    Sistema de detecção de escrita por AI do Turnitin com os modelos AIW-2 e AIR-1

Como Isso Aparece nos Relatórios

Quando o AIR-1 identifica uma sentença como parafraseada por AI, ele a marca juntamente com a detecção original do AIW-2. Na interface do relatório do Turnitin, essas sentenças costumam ser destacadas em roxo — sinalizando que o sistema entende que elas foram tanto escritas por AI quanto reformuladas por outra ferramenta.

Amostra de relatório de AI do Turnitin

Esse nível adicional de detecção auxilia os educadores a compreender não apenas se a AI foi utilizada, mas de que forma ela foi empregada — seja porque o estudante copiou e colou de um chatbot ou tentou disfarçar o uso por meio de uma ferramenta de parafraseamento.

✳️ O AIR-1 não analisa o documento inteiro. Ele examina apenas os trechos que o AIW-2 já marcou como possivelmente gerados por AI. E jamais tenta detectar parafraseamento em textos considerados escritos por humanos pelo AIW-2.

Agora que conhecemos todas as ferramentas principais — AIW-2 e AIR-1 — vamos abordar quais dados e treinamentos foram empregados na sua construção.

4. Como foram treinados e testados os Detectores de AI Turnitin?

Agora que sabemos o que AIW-2 e AIR-1 realmente fazem, é natural questionar: como podemos ter certeza de que eles são confiáveis?

Bem, segundo a Turnitin, muito cuidado — e uma grande quantidade de dados — foi dedicado ao treinamento e aos testes desses modelos para garantir que funcionem conforme o esperado. Vamos explicar isso de forma simples.

Treinando os Modelos: De onde vieram os Dados?

Para ensinar o AIW-2 e o AIR-1 a detectar conteúdos escritos por IA ou simplesmente parafraseados, a Turnitin usou grandes conjuntos de dados — mas não qualquer texto.

Segundo a Turnitin:

  • O modelo AIW-2 foi treinado com uma combinação de conteúdo gerado por IA e redações acadêmicas reais, escritas por humanos. Isso abrangeu trabalhos de uma ampla variedade de disciplinas, países e perfis estudantis.

  • A Turnitin fez um esforço especial para incluir grupos sub-representados, como estudantes que aprendem em uma segunda língua e alunos de diversas formações acadêmicas. Isso contribui para reduzir vieses e torna o modelo mais justo e preciso em diferentes estilos de escrita.

  • Além disso, os dados de treinamento do AIW-2 incluíram exemplos de texto gerado por IA que foram processados por ferramentas de parafraseamento — algo essencial para aprimorar sua capacidade de detectar conteúdos “IA+IA-parafraseado”.

Para o AIR-1, o enfoque foi ainda mais específico:

  • Ele foi treinado com uma ampla variedade de texto parafraseado por IA, além de textos escritos por humanos e de conteúdo exclusivamente gerado por IA.

  • Isso permitiu que o AIR-1 aprendesse a identificar pistas sutis exclusivas da IA reescrita — detalhes que os detectores de IA tradicionais costumam deixar passar.

Em resumo, esses modelos não foram treinados apenas com exemplos retirados da internet. Eles foram minuciosamente elaborados utilizando cenários acadêmicos realistas para refletir o que educadores e estudantes realmente enfrentam.

Testando os Modelos: Como a Turnitin Mede a Precisão?

Na fase de testes, a Turnitin se concentra em duas métricas principais:

  • Recall – Mede quantos textos, de fato escritos por IA, são corretamente identificados. Um recall elevado indica que o modelo está cumprindo bem a sua função.

    Turnitin AIW-1 vs AIW-2 Nível de Recall em Documento e Frase

  • Taxa de Falsos Positivos (FPR) – Indica com que frequência textos escritos por humanos são incorretamente sinalizados como sendo de IA. Uma FPR baixa é essencial, especialmente no meio acadêmico, onde uma acusação equivocada pode ter sérias consequências.

De acordo com a Turnitin, o AIW-2 mantém a taxa de falsos positivos em nível de documento abaixo de 1%, desde que identifique pelo menos 20% de um documento como sendo gerado por IA. Por isso, esse limiar de 20% é frequentemente mencionado no relatório de IA — trata-se de um ponto de corte cuidadosamente definido com base nos testes.

Turnitin AIW-1 vs AIW-2 Nível de Falsos Positivos em Documento e Frase

Por que “Precisão” Sozinha Não é Suficiente

Curiosamente, a Turnitin evita usar o termo “precisão” em seus relatórios. Por quê?

Porque em conjuntos de dados desequilibrados (por exemplo, quando a maioria dos documentos é escrita por humanos), até mesmo um modelo ruim poderia aparentar 99% de precisão apenas por sempre optar por “humano”. Isso seria enganoso.

Em vez disso, ao focar no recall e na FPR, a Turnitin oferece uma visão mais realista do desempenho do seu sistema de detecção.

Agora que entendemos como os modelos da Turnitin são treinados, vamos ver com mais detalhes como eles analisam a escrita de um estudante assim que é submetida. Aqui as explicações ficam um pouco mais técnicas, mas vamos manter tudo simples.

Como o Detector de IA do Turnitin Realmente Funciona

Primeiro, o Sistema Divide o Texto em Pequenos Blocos

O Turnitin utiliza um método chamado abordagem de janela segmentada. Em vez de ler todo o ensaio de uma vez, o sistema o divide em pequenas seções sobrepostas — pense em cinco a dez sentenças por segmento.

Cada uma dessas “janelas” percorre o documento uma sentença de cada vez, fazendo com que cada sentença seja analisada em vários segmentos. Dessa forma, o modelo recebe diferentes contextos para avaliar a mesma sentença de maneira mais confiável.

Depois, Ele Atribui uma Pontuação a Cada Sentença para Indicar a Probabilidade de Ser Gerada por IA

Cada segmento recebe uma pontuação entre 0 e 1:

  • Uma pontuação mais próxima de 0 indica que o texto foi provavelmente escrito por humanos.

  • Uma pontuação mais próxima de 1 sugere que é mais provável que tenha sido gerado por IA.

Como cada sentença aparece em vários segmentos, o Turnitin calcula uma pontuação média ponderada para cada uma delas. Isso ajuda a minimizar possíveis erros e oferece um julgamento mais consistente. 

Como mencionado anteriormente, o sistema também avalia a parafraseação por IA em sentenças que já foram identificadas como geradas pela IA, atribuindo uma pontuação separada para essa análise.

Processo de Detecção de Escrita por IA do Turnitin

Em Seguida, o Sistema Efetua um Julgamento Global do Documento

Então, como ele determina se um documento inteiro foi gerado por IA?

Segundo o Turnitin, um documento é sinalizado somente se 20% ou mais de suas sentenças obtiverem pontuações acima do limite estabelecido para escrita por IA. Essa regra dos 20% não foi definida ao acaso — os testes demonstraram que porcentagens menores tendem a gerar falsos positivos. Assim, o Turnitin prefere ser cauteloso e só sinaliza um trabalho quando há evidências mais contundentes de envolvimento de IA.

Ou seja, um trabalho precisa apresentar uma quantidade significativa de conteúdo com características de IA antes de ser classificado dessa forma.

Documentos Curtos Não São Verificados

Outro ponto importante: o Turnitin não utiliza o detector de IA em documentos com menos de 300 palavras. Isso acontece porque textos curtos não oferecem dados suficientes para uma previsão precisa. Quanto maior a quantidade de palavras, melhor será a análise.

Isso é tudo sobre como o Turnitin detecta o conteúdo de IA.

Comparando o Detector de IA do Turnitin com Outras Ferramentas

Há uma variedade de detectores de IA disponíveis—alguns gratuitos, outros pagos—mas o sistema do Turnitin se distingue em alguns aspectos fundamentais:

  • Desenvolvido Especificamente para a Academia: Diferente de muitos detectores genéricos, os modelos do Turnitin foram treinados com trabalhos reais de alunos em diversas disciplinas, idiomas e estilos de escrita. Isso diminui os falsos positivos e o torna mais confiável em ambientes educacionais.

  • Abordagem com Dois Modelos: Enquanto a maioria dos detectores apenas identifica textos gerados por IA, o Turnitin emprega dois modelos—AIW-2 para textos criados diretamente pela IA e AIR-1 para textos parafraseados por IA—ampliando sua cobertura e detectando conteúdos cuidadosamente disfarçados.

  • Arquitetura Baseada em Transformers: Muitos detectores se apoiam em estatísticas simples, como perplexidade ou burstiness. Ao utilizar modelos avançados de transformers, o Turnitin consegue identificar padrões linguísticos sutis, tornando a detecção mais inteligente e precisa.

  • Escala e Integração: As ferramentas do Turnitin estão integradas a sistemas de gerenciamento de aprendizagem ao redor do mundo, já tendo analisado mais de 250 milhões de trabalhos—o que significa que seus modelos estão em constante aprimoramento com dados reais.

  • Transparência e Validação: O Turnitin disponibiliza whitepapers detalhados e estudos de validação, demonstrando abertamente o desempenho e as limitações do seu sistema—algo que a maioria dos detectores gratuitos não oferece.

Em resumo: O Turnitin vai além de ser apenas um verificador de IA. Trata-se de um sistema robusto, fundamentado em pesquisas, desenvolvido para atender às exigências complexas do meio educacional, em vez de simplesmente marcar o uso de IA com base em regras simplistas.

Turnitin vs. Outros Detectores de IA

Você se pergunta se pode usar outros detectores de IA em vez do Turnitin para revisar seu trabalho antes de enviá-lo? A verdade é: o sistema do Turnitin não pode ser facilmente substituído por ferramentas populares como o GPTZero.

Página Inicial GPTZero

O Turnitin treina seus modelos de IA com trabalhos reais de estudantes em uma ampla gama de disciplinas e idiomas, por isso está perfeitamente ajustado para a escrita acadêmica. Além disso, aprendeu ao analisar mais de 250 milhões de submissões reais — algo que a maioria dos outros detectores simplesmente não possui. Esses dados do mundo real realmente aumentam a precisão.

O Turnitin vai além ao usar dois modelos — um para identificar textos gerados por IA e outro para detectar sentenças parafraseadas por IA. Enquanto o GPTZero e o Quillbot oferecem alguns destaques no nível de sentença, eles não alcançam a profundidade e a confiabilidade que o Turnitin proporciona.

Tecnicamente, muitos detectores se baseiam em estatísticas mais simples, como perplexidade, mas o Turnitin é fundamentado em modelos avançados de transformer que captam padrões sutis de linguagem, tornando sua detecção mais inteligente.

Perguntas Frequentes

FAQ

Q: Que modelos de IA o Turnitin utiliza?

A: O Turnitin utiliza dois modelos principais—AIW (AI Writing) para detectar textos gerados diretamente por IA, e AIR (AI Rewriting) para identificar conteúdos parafraseados por IA. As versões mais recentes são AIW-2 e AIR-1, ambos alimentados por um avançado aprendizado profundo baseado em Transformer.

Q: Como posso evitar ser sinalizado pelos detectores de IA do Turnitin?

Se você está preocupado com a detecção de IA, a melhor abordagem é escrever conteúdos originais e bem pesquisados com sua própria voz autêntica. Existem também ferramentas humanizadas que ajudam a aprimorar seu trabalho sem conferir um tom gerado por IA.

Q: O Turnitin é mais preciso do que ferramentas gratuitas como o ZeroGPT?

A: Sim. Os modelos do Turnitin são submetidos à revisão por pares, testados em milhões de artigos acadêmicos reais e especificamente ajustados para a escrita de estudantes. Em contraste, muitos detectores gratuitos não revelam seus dados de treinamento ou taxas de falsos positivos e frequentemente deixam passar detalhes a nível de sentença. Ferramentas como o ZeroGPT tendem a ser mais lenientes e menos precisas.

Q: O Turnitin consegue detectar textos produzidos por IAs mais recentes, como o GPT-4 ou o Gemini?

A: Absolutamente. A partir de 2024, o sistema do Turnitin foi projetado para identificar textos gerados pelo GPT-3, GPT-4, GPT-4o, Gemini, LLaMA e outros modelos avançados de linguagem.

Q: Quão precisa é a detecção de IA do Turnitin?

A: Segundo o Turnitin, a detecção de IA deles é bastante precisa. Eles mantêm uma taxa de falsos positivos abaixo de 1% para documentos em que 20% ou mais do texto é gerado por IA.

Conclusão

Abordamos as minúcias do verificador de IA da Turnitin — desde como ele segmenta os trabalhos em seus componentes até como é treinado com redações de alunos reais e conteúdo gerado por IA. À medida que a IA avança, a Turnitin também se desenvolve, um tema com o qual educadores e estudantes precisam lidar. No final das contas, não se trata de descobrir irregularidades — trata-se de manter a confiança no trabalho que entregamos. Entender o funcionamento da ferramenta ajuda todos a usá-la de maneira mais justa e responsável.