-
Notifications
You must be signed in to change notification settings - Fork 32
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[Feature Request] Monitoria mais limpa/assertiva #19
Comments
Fala @rafaelribeiroo! Desde a PR #8 as informações dos anúncios estão vindos de um json que fica em cada página, fica bem mais fácil de puxar as informações do json que extrair do HTML, o OLX já mudou algumas vezes a estrutura dos anúncios o script parava de funcionar. Estava fazendo uns testes agora usando esse link para fazer a busca: https://www.olx.com.br/moveis/estado-sp?q=sof%C3%A1 e aparentemente as vezes o json trazia infomações que não tinham nada a ver com os resultados exibidos, olha esse exemplo: Esses são os primeiros 4 resultados Mas no JSON estão aparecendo anúncios que não tem relação alguma com a buscar e não o aparecem na página. No json a ordem é a seguinte:
Em um outro teste na mesma url parece que voltou tudo ao normal, não sei se teve algum bug na hora que estava testando, mas não consegui mais reproduzir essa divergência, vou ter que fazer mais testes, talvez isso também esteja acontecendo no seu caso. Você consegue compartilhar algum exemplo? Lendo o json vi que tem uma propriedade |
Boa noite @carmolim, obrigado mais uma vez pelo excelente projeto.
Recentemente, tive uma ideia para mantermos a monitoria e, consequentemente as notificações, mais assertivas, visto que atualmente o programa pega os anúncios impulsionados que não são originários/oriundos do termo de busca monitorado. Poderia por gentileza remove-los do scraper? Atualmente eu tenho uma solução paliativa mas não estou muito satisfeito.
Geralmente são identificados pela tag a seguir
<span data-ds-component="DS-Badge" role="status" class="olx-badge olx-badge--info" aria-label="Impulsionado" style="color: var(--color-neutral-70); background-color: var(--color-primary-100);">IMPULSIONADO</span>
E costuma aparecer itens que não são exclusivamente os anúncios desejados.
The text was updated successfully, but these errors were encountered: