QueroLerBot

Bot para driblar os paywalls no Twitter

Como o Bot funciona ?

Quando uma pessoa marca o @QueroLerBot em um Tweet com uma URL, o bot irá procurar pelo conteúdo do artigo baseado nas classes do elemento HTML do conteúdo, previamente coletados, no arquivo "news_classes.json". O nome da classe pode variar no mesmo site, dependendo da página. Com o conteúdo coletado, ele envia para o graph.org, onde ficará armazenado. Para evitar fazer o mesmo processo para os mesmos artigos, tanto a url do artigo quanto a url do conteúdo no graph.org, ficam salvos num simples banco de dados sqlite. Assim, quando o bot é acionado, a primeira coisa que ele faz é verificar se o artigo já existe na db.

Como rodar ? (sem nix)

Faça o download ou clone o repositório:

git clone https://github.com/gp2112/QueroLerBot.git

Usando o pip:

 pip install .

Coloque seus tokens e keys da api do twitter nas variáveis de ambientes especificadas:

export QUEROLER_CONSUMER_KEY='sua consumer_key'
export QUEROLER_CONSUMER_SECRET='sua consumer_secret'
export QUEROLER_ACCESS_KEY='sua access_key'
export QUEROLER_ACCESS_SECRET='sua access_secret'

Rode

querolerbot

Como contribuir ?

Sinta-se a vontade para contribuir com o que quiser. Umas ideias pra contribuir são:

Simplificar ao máximo a interação com o usuário
Adicionar novas classes de conteúdo para dar suporte a novos sites em news_classes.json
Adicionar mensagens legais na tupla succ_msgs em app.py.
Organizar mais o código, deixar limpo,

Como achar as classes de conteúdo nos sites?

Na página do artigo, selecione algum trecho do conteúdo do artigo e inspecione o elemento. Agora só buscar pelo elemento "pai" e coletar sua classe. Feito isso, adicione o endereço do site e sua classe no news_classes.json, seguindo o modelo dos outros. Segue um exemplo abaixo com um artigo do Globo:

Name		Name	Last commit message	Last commit date
Latest commit History 74 Commits
querolerbot		querolerbot
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
config.toml		config.toml
default.nix		default.nix
flake.lock		flake.lock
flake.nix		flake.nix
module.nix		module.nix
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

QueroLerBot

Como o Bot funciona ?

Como rodar ? (sem nix)

Como contribuir ?

Como achar as classes de conteúdo nos sites?

About

Releases

Packages

Languages

License

gp2112/QueroLerBot

Folders and files

Latest commit

History

Repository files navigation

QueroLerBot

Como o Bot funciona ?

Como rodar ? (sem nix)

Como contribuir ?

Como achar as classes de conteúdo nos sites?

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages