Artigos duplicados #14

rencmbr · 2024-11-12T18:25:31Z

Boa tarde, Rafael

depois de rodar o lucylattes para o nosso programa de pós-graduação identifiquei dois artigos que aparecem duplicados na lista de artigos únicos. Só vi isso porque um deles é meu:
Vector Nodal Meshless Method for 3-D Applications - DOI: 10.1109/tmag.2022.3233527

Para tentar encontrar outros, abri o arquivo relatorio/csv_report/report_papers_uniq.csv no Excel, ordenei as entradas pelo titulo dos artigos e procurei os títulos iguais. O segundo artigo duplicado é:
A Strategy for Traffic Safety of Vehicular Platoons Under Connection Loss and Time-Delay - DOI: 10.1109/tits.2023.3258633

Me parece que a razão para o algoritmo não ter identificado as duplicatas foi a diferença de uma letra no título. O primeiro aparece na outra entrada como:

Vector Nodal Meshless Method for 3D Applications (note a falta do -)

e o segundo como:

A Strategy for Traffic Safety of Vehicular Platoons under Connection Loss and Time-dela (note a falta do y)

Os DOIs de ambos estão corretos nas duas entradas e, talvez, ele também possa ser usado para verificar se o artigo em periódico é o mesmo quando a diferença entre os títulos for muito pequena. Não tenho idéia de quão complicado é para implementar isso no algoritmo de identificação de duplicatas, portanto não leve em conta a minha sugestão caso ela seja de implantação complexa.

Abraços,
Renato.

rencmbr · 2024-11-12T18:39:47Z

Esqueci de dizer, mas como você tem os currículos dos docentes do nosso programa, caso queira reproduzir os dados, o período que usei foi de 2021 a 2024. Para um período maior talvez apareçam outros artigos.

rafatieppo · 2024-11-22T12:26:50Z

Renato, bom diaEsses dias não consegui melhorar o código. Hoje consegui passar o olho e fiz um pequena alteração. - (Identificado e eliminado) Vector Nodal Meshless Method for 3D Applications - (pela implementação atual a diferença não é identificada) A Strategy for Traffic Safety of Vehicular Platoons under Connection Loss and Time-dela (note a falta do y) De modo muito simplista, a eliminação dos título duplicados é realizada pelo método da distância do cosseno (técnica de processamento de linguagem natural). Até o momento, fiz duas implementações (vou chamar de A e B)- A: Identifica e elimina de modo mais eficiente os duplicados, porém é o demorado- B: Menos eficiente, mas é mais rápido por vetorizar Não sei exatamente quando, mas um dia estudo melhor a situação.Vlw pelos avisos. Bom fds! Rafael Tieppo site: https://rafatieppo.github.io On Tuesday, November 12, 2024 at 02:25:54 PM GMT-4, Renato ***@***.***> wrote: Boa tarde, Rafael depois de rodar o lucylattes para o nosso programa de pós-graduação identifiquei dois artigos que aparecem duplicados na lista de artigos únicos. Só vi isso porque um deles é meu: Vector Nodal Meshless Method for 3-D Applications - DOI: 10.1109/tmag.2022.3233527 Para tentar encontrar outros, abri o arquivo relatorio/csv_report/report_papers_uniq.csv no Excel, ordenei as entradas pelo titulo dos artigos e procurei os títulos iguais. O segundo artigo duplicado é: A Strategy for Traffic Safety of Vehicular Platoons Under Connection Loss and Time-Delay - DOI: 10.1109/tits.2023.3258633 Me parece que a razão para o algoritmo não ter identificado as duplicatas foi a diferença de uma letra no título. O primeiro aparece na outra entrada como: Vector Nodal Meshless Method for 3D Applications (note a falta do -) e o segundo como: A Strategy for Traffic Safety of Vehicular Platoons under Connection Loss and Time-dela (note a falta do y) Os DOIs de ambos estão corretos nas duas entradas e, talvez, ele também possa ser usado para verificar se o artigo em periódico é o mesmo quando a diferença entre os títulos for muito pequena. Não tenho idéia de quão complicado é para implementar isso no algoritmo de identificação de duplicatas, portanto não leve em conta a minha sugestão caso ela seja de implantação complexa. Abraços, Renato. — Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: ***@***.***>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Artigos duplicados #14

Artigos duplicados #14

rencmbr commented Nov 12, 2024

rencmbr commented Nov 12, 2024

rafatieppo commented Nov 22, 2024 via email

Artigos duplicados #14

Artigos duplicados #14

Comments

rencmbr commented Nov 12, 2024

rencmbr commented Nov 12, 2024

rafatieppo commented Nov 22, 2024 via email