-
Notifications
You must be signed in to change notification settings - Fork 23
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
add blacklisted url #39
base: master
Are you sure you want to change the base?
Changes from all commits
459e479
4111092
2e1786e
64155c4
41c357f
b52ca68
7aedc0e
be1f06c
038e3bf
df6881e
3b95e29
8650302
aa914d3
af068dd
7f93db3
791a495
7b80645
8cacf12
0ecb13a
File filter
Filter by extension
Conversations
Jump to
Diff view
Diff view
There are no files selected for viewing
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1 @@ | ||
blacklist.txt |
Original file line number | Diff line number | Diff line change | ||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
@@ -0,0 +1,122 @@ | ||||||||||||||||||||||||||||
# Telegram Bot | ||||||||||||||||||||||||||||
@majorwbot | ||||||||||||||||||||||||||||
@BiggesTonBot | ||||||||||||||||||||||||||||
@DinoAirdBot | ||||||||||||||||||||||||||||
@dogshouse_bot | ||||||||||||||||||||||||||||
@dogsqhouse_bot | ||||||||||||||||||||||||||||
@dogsprize_bot | ||||||||||||||||||||||||||||
@EmpirTokenxBot | ||||||||||||||||||||||||||||
@lacaknomer_bot | ||||||||||||||||||||||||||||
@MajorAidrops_Bot | ||||||||||||||||||||||||||||
@MajorAllBot | ||||||||||||||||||||||||||||
@MAJORSTORYBOT | ||||||||||||||||||||||||||||
@Notcoin_DroopBot | ||||||||||||||||||||||||||||
@Notcoin_litebot | ||||||||||||||||||||||||||||
@Notcoin_luckybot | ||||||||||||||||||||||||||||
@Notcoin_moonbot | ||||||||||||||||||||||||||||
@Notcoin | ||||||||||||||||||||||||||||
@PAWSOG_nbot | ||||||||||||||||||||||||||||
@PAWSQO_BOT | ||||||||||||||||||||||||||||
@SpinTetherBOT | ||||||||||||||||||||||||||||
@TetherSpinsBOT | ||||||||||||||||||||||||||||
@TondropAI_bot | ||||||||||||||||||||||||||||
@TONEWYERBOT | ||||||||||||||||||||||||||||
@XEmpireTelegramBot | ||||||||||||||||||||||||||||
@xFreeSpinx_bot | ||||||||||||||||||||||||||||
@XTONXEBOT | ||||||||||||||||||||||||||||
@xtoncoinspin_bot | ||||||||||||||||||||||||||||
@xtonspin_bot | ||||||||||||||||||||||||||||
@XTONCHRISTMASBOT | ||||||||||||||||||||||||||||
putri_aniss334 | ||||||||||||||||||||||||||||
Raymond_adminFx | ||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||
# Keyword | ||||||||||||||||||||||||||||
$DOGS | ||||||||||||||||||||||||||||
listrikgratis | ||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||
# Telegram | ||||||||||||||||||||||||||||
t.me/+dIRnvlnAAd5jZjc8 | ||||||||||||||||||||||||||||
t.me/+mNW8EcFfbHw5ZTQ0 | ||||||||||||||||||||||||||||
t.me/JOIN_THE_WINNING_PROCESS | ||||||||||||||||||||||||||||
t.me/major | ||||||||||||||||||||||||||||
t.me/SecureStocks | ||||||||||||||||||||||||||||
t.me/TATTIAHOE | ||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||
# Site/Link | ||||||||||||||||||||||||||||
bansosupdate2024.trustklik.live | ||||||||||||||||||||||||||||
bansos2024.regist-report22.com | ||||||||||||||||||||||||||||
claim-danabansos.directklick.com | ||||||||||||||||||||||||||||
claim-danabansos.sosialasia.com | ||||||||||||||||||||||||||||
claimm-danabansos.smediax.online | ||||||||||||||||||||||||||||
click-bansosvia-telegram.web.id | ||||||||||||||||||||||||||||
cliick-informaasi-baansos2024.my.id | ||||||||||||||||||||||||||||
Comment on lines
+48
to
+52
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. 🛠️ Refactor suggestion Enhance patterns for social assistance claim scams The new entries show variations in claim-related URLs. Consider adding these patterns: + # Social assistance claim patterns
+ ^cla?i[m]+[-]?dana?[-]?bansos\..*$
+ ^click[-]?bansos(?:via)?[-]?telegram\..*$ This would catch variations in spelling and formatting used to avoid detection. 📝 Committable suggestion
Suggested change
|
||||||||||||||||||||||||||||
cpxsppk.plx-8.systems | ||||||||||||||||||||||||||||
feji.us/informasi-bansos2024t.me/mh_aripin | ||||||||||||||||||||||||||||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. Fix malformed URL combining multiple destinations The URL -feji.us/informasi-bansos2024t.me/mh_aripin
+feji.us/informasi-bansos2024
+t.me/mh_aripin 📝 Committable suggestion
Suggested change
|
||||||||||||||||||||||||||||
feji.us/lapangankerja-bumn | ||||||||||||||||||||||||||||
feji.us/mytelkomsel2024 | ||||||||||||||||||||||||||||
Comment on lines
+54
to
+56
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. Critical: URL shorteners require additional security measures URL shorteners (feji.us, s.id) pose significant risks:
Consider:
Also applies to: 59-65 |
||||||||||||||||||||||||||||
infoloker.aplly-my.com/Jobs | ||||||||||||||||||||||||||||
linkin.bio/layananmo | ||||||||||||||||||||||||||||
lokerbumn-2024.guirel.win | ||||||||||||||||||||||||||||
lokerr-update2024.trustklik.live | ||||||||||||||||||||||||||||
lokerindonesia2024.lokerblog.net | ||||||||||||||||||||||||||||
lowongan-kerja2024.apd-d1.com/jb | ||||||||||||||||||||||||||||
lowongankerja.vrole.uk | ||||||||||||||||||||||||||||
lowongankerja2024.online | ||||||||||||||||||||||||||||
lowonganbumn-terbaru2024.directklick.com | ||||||||||||||||||||||||||||
Comment on lines
+59
to
+65
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. 🛠️ Refactor suggestion Enhance domain patterns for job recruitment scams The new entries reveal additional patterns in job scam URLs. Consider adding these patterns: + # Additional job scam patterns
+ ^rekrutmen(?:bersama)?bumn\d+\..*\.win$
+ ^lowongan.*(?:bumn|kerja).*\.(?:directklick\.com|vrole\.uk)$ This would complement existing patterns while catching more variants of job scam domains. Also applies to: 50-51 |
||||||||||||||||||||||||||||
pendaftaran-kerja.info-1d.com | ||||||||||||||||||||||||||||
qclaim-danaabnsos.smediax.com | ||||||||||||||||||||||||||||
rakyat.me/dftxrkn | ||||||||||||||||||||||||||||
rekrutmenbersamabumn05.byfux.win | ||||||||||||||||||||||||||||
rekrutmenbersamabumn19.byfux.win | ||||||||||||||||||||||||||||
s.id/bantuansosial | ||||||||||||||||||||||||||||
s.id/dtkssbans0sterupdate | ||||||||||||||||||||||||||||
s.id/Loker_Update_2024 | ||||||||||||||||||||||||||||
s.id/Rekrutmenttssbersama | ||||||||||||||||||||||||||||
s.id/lOkerinsdonesiaterupdatessn | ||||||||||||||||||||||||||||
s.id/lokerterbaru | ||||||||||||||||||||||||||||
s.id/rekrutsmentsbersmbumn2024isn | ||||||||||||||||||||||||||||
satuin.web.id/1AVxF/?Lowongankerja2024 | ||||||||||||||||||||||||||||
searchloker02.newinfo.cc | ||||||||||||||||||||||||||||
telegra.ph/Free-TON-Giveaway-11-30 | ||||||||||||||||||||||||||||
voxmn.pl/nKHr8/?LokerBUMN24 | ||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||
Comment on lines
+45
to
+82
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. 🛠️ Refactor suggestion Critical: Implement URL expansion and pattern-based blocking
#!/bin/bash
# Implement URL expansion before blacklist checks
for domain in $(grep -E "s\.id|feji\.us" public_html/carik/files/blacklist-url.txt); do
echo "Checking $domain redirects"
curl -sI "$domain" | grep -i "location:"
done
+# Social assistance scams
+^(?:bansos|bantuan).*(?:2024|update)\.
+^(?:claim|clalm)[-]?(?:dana)?[-]?(?:bansos)\.
+# Job recruitment scams
+^(?:loker|lowongan).*(?:bumn|kerja|2024)\.
+^rekrutmen(?:bersama)?bumn\d+\. |
||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||
# Domain/Site | ||||||||||||||||||||||||||||
AirdropMaga.lol | ||||||||||||||||||||||||||||
aply1-id.com | ||||||||||||||||||||||||||||
antgpt.org | ||||||||||||||||||||||||||||
best-value.ltd | ||||||||||||||||||||||||||||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. Remove duplicate domain entry The domain best-value.ltd
bansos-2024.info
bansos2024.info
bantuan.us.to
-best-value.ltd
byfux.win Also applies to: 91-91 |
||||||||||||||||||||||||||||
bansos-2024.info | ||||||||||||||||||||||||||||
bansos2024.info | ||||||||||||||||||||||||||||
bantuan.us.to | ||||||||||||||||||||||||||||
bantuanbansospkh.net | ||||||||||||||||||||||||||||
best-value.ltd | ||||||||||||||||||||||||||||
byfux.win | ||||||||||||||||||||||||||||
clalm.one | ||||||||||||||||||||||||||||
directklick.com | ||||||||||||||||||||||||||||
eth-spin.lol | ||||||||||||||||||||||||||||
geets-cliks.com | ||||||||||||||||||||||||||||
gets-offcial.com | ||||||||||||||||||||||||||||
ghiju.us | ||||||||||||||||||||||||||||
gshortlink.com | ||||||||||||||||||||||||||||
heylink.me | ||||||||||||||||||||||||||||
indodock.com | ||||||||||||||||||||||||||||
info-ind.com | ||||||||||||||||||||||||||||
informasi.us.to | ||||||||||||||||||||||||||||
klikhere.website | ||||||||||||||||||||||||||||
kminfo.app | ||||||||||||||||||||||||||||
newsupdate.asia | ||||||||||||||||||||||||||||
ppkh.site | ||||||||||||||||||||||||||||
register2024.live | ||||||||||||||||||||||||||||
rakyat.me | ||||||||||||||||||||||||||||
rkyt.eu | ||||||||||||||||||||||||||||
site-klik.com | ||||||||||||||||||||||||||||
st-rg.com | ||||||||||||||||||||||||||||
sosialasia.com | ||||||||||||||||||||||||||||
spoo.me | ||||||||||||||||||||||||||||
tribunsinfo.cc | ||||||||||||||||||||||||||||
trustklik.live | ||||||||||||||||||||||||||||
uasx11.com | ||||||||||||||||||||||||||||
vitur.me | ||||||||||||||||||||||||||||
xbeack.asia | ||||||||||||||||||||||||||||
ze-me.xyz |
Original file line number | Diff line number | Diff line change |
---|---|---|
|
@@ -9513,6 +9513,7 @@ indologi | |
indonesia | ||
indonesianisasi | ||
indra | ||
indraja | ||
indraloka | ||
indranila | ||
indriawi | ||
|
Original file line number | Diff line number | Diff line change |
---|---|---|
|
@@ -76,6 +76,7 @@ const | |
LINE_TOKEN = 'line/default/token'; | ||
LINE_BOT_REPLY_DISABLE = 'line/default/reply_disable'; | ||
LINE_BOT_FIRST_SESSION_RESPONSE = 'line/default/first_session_response'; | ||
TELEGRAM_GROUP_MAXIMUM_MEMBER_COUNT = 1500; | ||
|
||
WITAI_TOKEN = 'witai/default/token'; | ||
GOOGLE_KEY = 'google/default/key'; | ||
|
@@ -138,10 +139,12 @@ const | |
|
||
NEW_MEMBER_INTERVAL_POST_PERMITTED = 20; | ||
SPAM_SCORE_THRESHOLD = 80; | ||
SPAM_SCORE_FORWARD_STORY = 80; | ||
SPAM_WORD = 'ai/default/spam_word'; | ||
SPAM_CAS_OFFENSE = 1; // api.cas.chat | ||
|
||
GROUP_DATA_FILENAME = 'files/carik/carik-groupdata.dat'; | ||
BLACKLIST_URL_FILENAME = 'files/blacklist-url.txt'; | ||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. 🛠️ Refactor suggestion Improve blacklist file path handling and documentation Several concerns regarding the blacklist file configuration:
Consider:
Example documentation: + // Blacklist files:
+ // - blacklist-global.txt: Contains globally banned entities
+ // - blacklist.txt: Contains locally banned entities
+ // - blacklist-url.txt: Contains banned URLs and domains
BLACKLIST_GLOBAL_FILENAME = 'files/blacklist-global.txt';
BLACKLIST_FILENAME = 'files/blacklist.txt';
BLACKLIST_URL_FILENAME = 'files/blacklist-url.txt';
|
||
CALLBACK_QUERY_TIMEOUT = 5; // 5 minutes | ||
CALLBACK_QUERY_TIMEOUT_PREFIX = 30; // 5 minutes | ||
MESSAGE_TYPE = 'message_type'; | ||
|
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Remove or clarify the "$DOGS" identifier
The "$DOGS" entry appears to be a variable-like identifier that may not be effective for URL blocking. Consider either removing it or replacing it with the actual URLs/patterns you want to block.