Use este identificador para citar ou linkar para este item: http://bdm.ufmt.br/handle/1/4382
Tipo documento: Trabalho de Conclusão de Curso
Título: Adaptação do algoritmo Ferret/Webferret para detecção de plágio em textos em português: desafios com textos gerados por IA
Autor(es): Elias, Adler Gonçalves
Orientador(a): Lopes, Robson da Silva
Membro da Banca: Lopes, Robson da Silva
Membro da Banca: Silva, Thiago Pereira da
Membro da Banca: Jardim, Sandino Barros
Resumo : A detecção de plágio em textos acadêmicos é um desafio crescente, especialmente com o avanço de tecnologias baseadas em inteligência artificial (IA), como o ChatGPT, que permitem a geração de textos coesos e complexos. Este trabalho propõe a reimplementação do algoritmo WebFerret, originalmente utilizado para identificar similaridade textual, com adaptações específicas para a língua portuguesa e a análise por frases, buscando aprimorar a identificação de plágio em textos gerados por IA. A metodologia adotada incluiu a modificação do algoritmo para considerar trigramas raros em frases e a aplicação de métricas de similaridade baseadas no coeficiente de Jaccard. O experimento foi realizado com três categorias de textos: plágio direto, plágio em mosaico e textos gerados por IA utilizando um banco de dados criado para avaliação. Os resultados demonstraram alta eficácia do algoritmo para identificar plágio direto e em mosaico, mas limitações significativas na detecção de plágio em textos gerados por IA evidenciando a necessidade de novas abordagens para lidar com esse tipo de conteúdo. Conclui-se que a adaptação proposta representa um avanço na detecção de plágio em português, mas ainda exige aprimoramentos para lidar com os desafios impostos pela IA.
Resumo em lingua estrangeira: Plagiarism detection in academic texts is a growing challenge, especially with the advancement of artificial intelligence (AI) technologies, such as ChatGPT, which enable the generation of cohesive and complex texts. This study proposes the reimplementation of the WebFerret algorithm, originally designed for textual similarity detection, with specific adaptations for the Portuguese language and phrase-by-phrase analysis, aiming to enhance plagiarism detection in AI-generated texts. The methodology included modifying the algorithm to consider rare trigrams in phrases and applying similarity metrics based on the Jaccard coefficient. The experiment was conducted with three categories of texts: direct plagiarism, mosaic plagiarism, and AIgenerated texts, using a database created for evaluation purposes. The results showed high algorithm effectiveness in identifying direct and mosaic plagiarism but significant limitations in detecting plagiarism in AI-generated texts, highlighting the need for new approaches to address this type of content. It is concluded that the proposed adaptation represents progress in plagiarism detection in Portuguese but still requires improvements to tackle the challenges posed by AI.
Palavra-chave: detecção de plágio
WebFerret
inteligência artificial
textos acadêmicos
similaridade textual
Palavra-chave em lingua estrangeira: plagiarism detection
WebFerret
artificial intelligence
academic texts
textual similarity
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: Brasil
Instituição: Universidade Federal de Mato Grosso
Sigla da instituição: UFMT CUA - Araguaia
Departamento: Instituto de Ciências Exatas e da Terra (ICET) – Araguaia
Curso: Ciência da Computação - CUA
Referência: ELIAS, Adler Gonçalves. Adaptação do algoritmo Ferret/Webferret para detecção de plágio em textos em português: desafios com textos gerados por IA. 2024. 33 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Instituto de Ciências Exatas e da Terra, Universidade Federal de Mato Grosso, Barra do Garças, 2024.
Tipo de acesso: Acesso Aberto
URI: http://bdm.ufmt.br/handle/1/4382
Data defesa documento: 13-Dez-2024
Aparece na(s) coleção(ções):Ciência da Computação - Araguaia

Arquivos deste item:
Arquivo Descrição TamanhoFormato 
TCC_2024_Adler Gonçalves Elias.pdf587.47 kBAdobe PDFVer/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.