-
-
Notifications
You must be signed in to change notification settings - Fork 21
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Artigos duplicados #14
Comments
Esqueci de dizer, mas como você tem os currículos dos docentes do nosso programa, caso queira reproduzir os dados, o período que usei foi de 2021 a 2024. Para um período maior talvez apareçam outros artigos. |
Renato, bom diaEsses dias não consegui melhorar o código. Hoje consegui passar o olho e fiz um pequena alteração.
- (Identificado e eliminado) Vector Nodal Meshless Method for 3D Applications
- (pela implementação atual a diferença não é identificada) A Strategy for Traffic Safety of Vehicular Platoons under Connection Loss and Time-dela (note a falta do y)
De modo muito simplista, a eliminação dos título duplicados é realizada pelo método da distância do cosseno (técnica de processamento de linguagem natural). Até o momento, fiz duas implementações (vou chamar de A e B)- A: Identifica e elimina de modo mais eficiente os duplicados, porém é o demorado- B: Menos eficiente, mas é mais rápido por vetorizar
Não sei exatamente quando, mas um dia estudo melhor a situação.Vlw pelos avisos. Bom fds!
Rafael Tieppo
site: https://rafatieppo.github.io
On Tuesday, November 12, 2024 at 02:25:54 PM GMT-4, Renato ***@***.***> wrote:
Boa tarde, Rafael
depois de rodar o lucylattes para o nosso programa de pós-graduação identifiquei dois artigos que aparecem duplicados na lista de artigos únicos. Só vi isso porque um deles é meu:
Vector Nodal Meshless Method for 3-D Applications - DOI: 10.1109/tmag.2022.3233527
Para tentar encontrar outros, abri o arquivo relatorio/csv_report/report_papers_uniq.csv no Excel, ordenei as entradas pelo titulo dos artigos e procurei os títulos iguais. O segundo artigo duplicado é:
A Strategy for Traffic Safety of Vehicular Platoons Under Connection Loss and Time-Delay - DOI: 10.1109/tits.2023.3258633
Me parece que a razão para o algoritmo não ter identificado as duplicatas foi a diferença de uma letra no título. O primeiro aparece na outra entrada como:
Vector Nodal Meshless Method for 3D Applications (note a falta do -)
e o segundo como:
A Strategy for Traffic Safety of Vehicular Platoons under Connection Loss and Time-dela (note a falta do y)
Os DOIs de ambos estão corretos nas duas entradas e, talvez, ele também possa ser usado para verificar se o artigo em periódico é o mesmo quando a diferença entre os títulos for muito pequena. Não tenho idéia de quão complicado é para implementar isso no algoritmo de identificação de duplicatas, portanto não leve em conta a minha sugestão caso ela seja de implantação complexa.
Abraços,
Renato.
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you are subscribed to this thread.Message ID: ***@***.***>
|
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Boa tarde, Rafael
depois de rodar o lucylattes para o nosso programa de pós-graduação identifiquei dois artigos que aparecem duplicados na lista de artigos únicos. Só vi isso porque um deles é meu:
Vector Nodal Meshless Method for 3-D Applications - DOI: 10.1109/tmag.2022.3233527
Para tentar encontrar outros, abri o arquivo relatorio/csv_report/report_papers_uniq.csv no Excel, ordenei as entradas pelo titulo dos artigos e procurei os títulos iguais. O segundo artigo duplicado é:
A Strategy for Traffic Safety of Vehicular Platoons Under Connection Loss and Time-Delay - DOI: 10.1109/tits.2023.3258633
Me parece que a razão para o algoritmo não ter identificado as duplicatas foi a diferença de uma letra no título. O primeiro aparece na outra entrada como:
Vector Nodal Meshless Method for 3D Applications (note a falta do -)
e o segundo como:
A Strategy for Traffic Safety of Vehicular Platoons under Connection Loss and Time-dela (note a falta do y)
Os DOIs de ambos estão corretos nas duas entradas e, talvez, ele também possa ser usado para verificar se o artigo em periódico é o mesmo quando a diferença entre os títulos for muito pequena. Não tenho idéia de quão complicado é para implementar isso no algoritmo de identificação de duplicatas, portanto não leve em conta a minha sugestão caso ela seja de implantação complexa.
Abraços,
Renato.
The text was updated successfully, but these errors were encountered: