Use este identificador para citar ou linkar para este item:
http://bdm.ufmt.br/handle/1/4382
Tipo documento: | Trabalho de Conclusão de Curso |
Título: | Adaptação do algoritmo Ferret/Webferret para detecção de plágio em textos em português: desafios com textos gerados por IA |
Autor(es): | Elias, Adler Gonçalves |
Orientador(a): | Lopes, Robson da Silva |
Membro da Banca: | Lopes, Robson da Silva |
Membro da Banca: | Silva, Thiago Pereira da |
Membro da Banca: | Jardim, Sandino Barros |
Resumo : | A detecção de plágio em textos acadêmicos é um desafio crescente, especialmente com o avanço de tecnologias baseadas em inteligência artificial (IA), como o ChatGPT, que permitem a geração de textos coesos e complexos. Este trabalho propõe a reimplementação do algoritmo WebFerret, originalmente utilizado para identificar similaridade textual, com adaptações específicas para a língua portuguesa e a análise por frases, buscando aprimorar a identificação de plágio em textos gerados por IA. A metodologia adotada incluiu a modificação do algoritmo para considerar trigramas raros em frases e a aplicação de métricas de similaridade baseadas no coeficiente de Jaccard. O experimento foi realizado com três categorias de textos: plágio direto, plágio em mosaico e textos gerados por IA utilizando um banco de dados criado para avaliação. Os resultados demonstraram alta eficácia do algoritmo para identificar plágio direto e em mosaico, mas limitações significativas na detecção de plágio em textos gerados por IA evidenciando a necessidade de novas abordagens para lidar com esse tipo de conteúdo. Conclui-se que a adaptação proposta representa um avanço na detecção de plágio em português, mas ainda exige aprimoramentos para lidar com os desafios impostos pela IA. |
Resumo em lingua estrangeira: | Plagiarism detection in academic texts is a growing challenge, especially with the advancement of artificial intelligence (AI) technologies, such as ChatGPT, which enable the generation of cohesive and complex texts. This study proposes the reimplementation of the WebFerret algorithm, originally designed for textual similarity detection, with specific adaptations for the Portuguese language and phrase-by-phrase analysis, aiming to enhance plagiarism detection in AI-generated texts. The methodology included modifying the algorithm to consider rare trigrams in phrases and applying similarity metrics based on the Jaccard coefficient. The experiment was conducted with three categories of texts: direct plagiarism, mosaic plagiarism, and AIgenerated texts, using a database created for evaluation purposes. The results showed high algorithm effectiveness in identifying direct and mosaic plagiarism but significant limitations in detecting plagiarism in AI-generated texts, highlighting the need for new approaches to address this type of content. It is concluded that the proposed adaptation represents progress in plagiarism detection in Portuguese but still requires improvements to tackle the challenges posed by AI. |
Palavra-chave: | detecção de plágio WebFerret inteligência artificial textos acadêmicos similaridade textual |
Palavra-chave em lingua estrangeira: | plagiarism detection WebFerret artificial intelligence academic texts textual similarity |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Idioma: | por |
País: | Brasil |
Instituição: | Universidade Federal de Mato Grosso |
Sigla da instituição: | UFMT CUA - Araguaia |
Departamento: | Instituto de Ciências Exatas e da Terra (ICET) – Araguaia |
Programa: | Ciência da Computação - CUA |
Referência: | ELIAS, Adler Gonçalves. Adaptação do algoritmo Ferret/Webferret para detecção de plágio em textos em português: desafios com textos gerados por IA. 2024. 33 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Instituto de Ciências Exatas e da Terra, Universidade Federal de Mato Grosso, Barra do Garças, 2024. |
Tipo de acesso: | Acesso Aberto |
URI: | http://bdm.ufmt.br/handle/1/4382 |
Data defesa documento: | 13-Dec-2024 |
Aparece na(s) coleção(ções): | Ciência da Computação - Araguaia |
Arquivos deste item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TCC_2024_Adler Gonçalves Elias.pdf | 587.47 kB | Adobe PDF | Ver/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.