Resumo (PT):
Os métodos de detecção de plágio registaram melhorias significativas ao longo das últimas décadas e, decorrente da investigação avançada realizada por linguistas computacionais e, sobretudo, por linguistas forenses, é, agora, mais
fácil identiVcar estratégias de reutilização de texto simples e soVsticadas. Especificamente, simples algoritmos de comparação de texto criados por linguistas computacionais permitem detectar fácil e (semi-)automaticamente plágio literal,
¿ipsis verbis¿ (i.e. que consiste na reutilização de trechos de texto idênticos em diferentes documentos) ¿ como é o caso do Turnitin ou o SafeAssign ¿, embora o desempenho destes métodos tenha tendência a piorar quando a reutilização
é disfarçada através da introdução de alterações ao texto original. Neste caso, são necessárias técnicas linguísticas mais soVsticadas, como a análise de sobreposição lexical (Johnson, 1997), para detectar a reutilização. Contudo, estas
técnicas são de aplicação muito limitada em casos de plágio `translingue¿, em que determinado texto é traduzido e reutilizado sem atribuição da autoria ao texto original, proveniente de outra língua. Considerando que (a) normalmente,
a tradução amadora (e.g. tradução literal ou tradução automática gratuita) é o
método utilizado para plagiar; (b) é comum os plagiadores fazerem alterações ao
texto, nomeadamente gramaticais e sintácticas, sobretudo após a tradução automática;
e (c) os elementos lexicais são aqueles que a tradução automática processa
mais correctamente, antes da sua reutilização no texto derivado, este artigo
propõe um método de detecção de plágio `translingue¿ informado pelas teorias da
tradução e da interlíngua (Selinker, 1972; Bassnett and Lefevere, 1998), bem como
pelo princípio de `singularidade linguística¿ (Coulthard, 2004). Recorrendo a dados
empíricos do corpus CorRUPT (¿Corpus of Reused and Plagiarised Texts¿),
um corpus de textos académicos e não académicos reais, que foram investigados
e acusados de plagiar textos originais noutras línguas, demonstra-se a utilidade
da metodologia proposta para a detecção de plágio `translingue¿. Finalmente,
discute-se possíveis aplicações deste método como ferramenta de investigação em
contextos forenses.
Abstract (EN):
Plagiarism detection methods have improved signiVcantly over the
last decades, and as a result of the advanced research conducted by computational
and mostly forensic linguists, simple and sophisticated textual borrowing
strategies can now be identiVed more easily. In particular, simple text comparison
algorithms developed by computational linguists allow literal, word-for-word
plagiarism (i.e. where identical strings of text are reused across diUerent documents)
to be easily detected (semi-)automatically (e.g. Turnitin or SafeAssign),
although these methods tend to perform less well when the borrowing is obfuscated
by introducing edits to the original text. In this case, more sophisticated
linguistic techniques, such as an analysis of lexical overlap (Johnson, 1997), are
required to detect the borrowing. However, these have limited applicability in
cases of `translingual¿ plagiarism, where a text is translated and borrowed without
acknowledgment from an original in another language. Considering that
(a) traditionally non-professional translation (e.g. literal or free machine translation)
is the method used to plagiarise; (b) the plagiarist usually edits the text
for grammar and syntax, especially when machine-translated; and (c) lexical
items are those that tend to be translated more correctly, and carried over to the
derivative text, this paper proposes a method for `translingual¿ plagiarism detection
that is grounded on translation and interlanguage theories (Selinker, 1972;
Bassnett and Lefevere, 1998), as well as on the principle of `linguistic uniqueness¿
(Coulthard, 2004). Empirical evidence from the CorRUPT corpus (Corpus of
Reused and Plagiarised Texts), a corpus of real academic and non-academic texts
that were investigated and accused of plagiarising originals in other languages, is
used to illustrate the applicability of the methodology proposed for `translingual¿
plagiarism detection. Finally, applications of the method as an investigative tool
in forensic contexts are discussed.
Language:
English
Type (Professor's evaluation):
Scientific
License type: