Utilização de mineração de texto na detecção de plágio em trabalhos acadêmicos
Resumen
Com o aumento da utilização da Internet e da disponibilização de materiais, tais como livros e artigos online, há uma ocorrência maior de cópias sem o devido uso de referências ao autor original. Neste trabalho, são abordadas técnicas de comparação de textos e formas de cálculo da similaridade entre dois blocos de arquivos, como o coeficiente de Jaccard e a similaridade dos cossenos. Combinando e adaptando algumas destas técnicas e formas, desenvolveu-se uma aplicação em Java que, com o uso da biblioteca Apache POI, captura o conteúdo de arquivos do Microsoft Word, divide o texto em blocos e consulta os blocos no Google, capturando todo o conteúdo HTML da página de consulta pela biblioteca Jsoup, e então compara os blocos calculando o coeficiente de Jaccard, permitindo detectar possíveis indícios de plágio, de uma forma mais eficiente que as encontradas nos softwares existentes.Descargas
Cómo citar
Número
Sección
Licencia
A submissão de originais para este periódico implica na transferência, pelos autores, dos direitos de publicação impressa e digital. Os direitos autorais para os artigos publicados são do autor, com direitos do periódico sobre a primeira publicação. Os autores somente poderão utilizar os mesmos resultados em outras publicações indicando claramente este periódico como o meio da publicação original. Em virtude de sermos um periódico de acesso aberto, permite-se o uso gratuito dos artigos em aplicações educacionais e científicas desde que citada a fonte conforme a licença CC-BY da Creative Commons.
Creative Commons Atribuição 4.0 Internacional.





