Utilização de mineração de texto na detecção de plágio em trabalhos acadêmicos

Autores

  • Caroline Aquino Dias
  • Sylvio André Garcia Vieira

Resumo

Com o aumento da utilização da Internet e da disponibilização de materiais, tais como livros e artigos online, há uma ocorrência maior de cópias sem o devido uso de referências ao autor original. Neste trabalho, são abordadas técnicas de comparação de textos e formas de cálculo da similaridade entre dois blocos de arquivos, como o coeficiente de Jaccard e a similaridade dos cossenos. Combinando e adaptando algumas destas técnicas e formas, desenvolveu-se uma aplicação em Java que, com o uso da biblioteca Apache POI, captura o conteúdo de arquivos do Microsoft Word, divide o texto em blocos e consulta os blocos no Google, capturando todo o conteúdo HTML da página de consulta pela biblioteca Jsoup, e então compara os blocos calculando o coeficiente de Jaccard, permitindo detectar possíveis indícios de plágio, de uma forma mais eficiente que as encontradas nos softwares existentes.

Downloads

Como Citar

Dias, C. A., & Vieira, S. A. G. (2017). Utilização de mineração de texto na detecção de plágio em trabalhos acadêmicos. Disciplinarum Scientia | Naturais E Tecnológicas, 17(2), 293–310. Recuperado de https://periodicos.ufn.edu.br/index.php/disciplinarumNT/article/view/1883

Edição

Seção

Artigos