-
Notifications
You must be signed in to change notification settings - Fork 46
Nefunkční stahování #157
Comments
To samé od včera |
Děje se mi s verzí 3.4.1. Verze 3.3.1 tento problém nemá - ale tam selhává captcha solver - teď mám třeba Ok 2 / 237 a pořád se snaží. To byl důvod proč jsem u sebe zkusil update na 3.4.1. Tý captche se v 3.3.1 moc nedaří - výsledek byl
|
Nevím jakou jsem měl verzi před tím, ale captcha se mi nechtěla splnit vůbec, tak jsem zkusil update a ono tohle |
Možná to souvisí s tím, že v téhle verzi se přes Tor pokouší ulozto-downloader stahovat i úvodní requesty, což obchází geoblocking v některých státech, ale vypadá to, že Ulozto začalo připojení přes Tor částečně blokovat. Trochu podezřívám 86a6342 a pak taky nějaké změny na straně Ulozto.cz. Zrovna nemám moc času se tomu věnovat, ale pokud na to nikdo nepřijde dřív, tak se k tomu dostanu možná v průběhu příštího týdne. |
Mám uplně stejný problém. Stará verze 3.3.1 má posledních pár dní velké problémy s captchou. Nová verze 3.4.1 dostává 403 Forbidden na úvodní request. Navíc se mi zdá, že ignoruje parametr
|
Mně nefungovala ani verze 3.3.1. |
Nezda sa mi, ze by to bolo tymto commitom. Pre istotu som pridal #158, ktory vracia povodnu funkcionalitu a novu zapina dedikovanym parametrom. U mna sa to kazdopadne chova rovnako nepredvidatelne v oboch pripadoch, takze tiez skor podozrievam zmeny na strane Ulozto. |
Bude to ulozto, protože vžum teď taky přestal fungovat. |
Vzum nefunguje už od začátku jara 2022, po létě byl opraven ale fungoval jen asi tyden nebo dva. A autor zřejmě už zlomil nad tím projektem hůl. |
Ještě 14 dní zpátky fungoval, pouze nefungoval captcha solver. |
Ve vzum nefungovala akorat captcha. Kdyz clovek vypnul automaticky vyplnovani a vyplnoval rucne, fungovalo vse ok - az do doby pred 4 dny, tj. presne ve stejnou dobu, kdy byl nahlasen problem i tady. |
Asi to souvisí s tímhle |
Ad geoblocking a Tor - z mych zkusenosti z TorBrowseru nejde z uloz.to stahovat ani v neblokovanych nodech, ale alias ulozto.net lze navstivit i z geoblokovaneho nodu a z aliasu zachovajto.pl lze i stahovat. |
Hostname zachowajto.pl ulozto.sk funguji dale.. staci tedy pouzit vzdy jedno z nich.. |
Takže pro laika - než se to opraví (pokud), tak adresu zadávanou upravit tak, že místo uloz.to nahradím za zachowajto.pl nebo ulozto.sk a ono to vezme. Právě také mi to nešlo se starou 3.3.1 - děsně pokusů dokola a pak jelo třeba jen 1 stahovací vlákno, což pak skoro ztrácí význam používat, tak jsem updatoval na 3.4.1 společně s Pythonem 3.11 a chyba jak se zde už uvádí - 403 a nebo podobné - blokováno, nenalezeno apod., takže zatím stačí to nahrazení adresy (části) a čekat a doufat. Je možné, že to je tedy vina UložTo a jejich blokování a mohou to zablokovat tak, že to již nepůjde obejít? Díky za info a za práci na aplikaci. Edit: Jen dodám, že jsem zkusil stažení se změnou na zachowajto a jelo to, stejně to sice hodilo chybu nějaký TOR errorlog, ale stáhlo to. Ten error.log na ploše obsahuje jen toto "Tor 0.4.7.13 (git-7c1601fb6edd780f) opening new log file.". TOR mám 12.0.4. |
A už to nedje ani při změně na zachowajto, nebo uloztoSK ... 🙁 |
Jop, taky už mi to nejde :-( |
Proto jsem svůj program neupravoval, protože jsem očekával tento výsledek v dohledné době. |
Má někdo ještě nějakou alternativu krom sk nebo polska, která mu funguje? |
Obávám se, že Ulož.to teď se snahou tvářit se spíše jako disk než jako místo pro sdílení souborů bude proti podobným stahovačům (které ale mimochodem nijak neporušují jejich docela krátké podmínky použití, ty jsem si mnohokrát pročítal) bojovat aktivněji. |
RIP ulozto-downloader |
Zatial by som to uplne nepochovaval. Skusil som narychlo naintegrovat https://github.com/VeNoMouS/cloudscraper (vid #163) a zatial to vyzera celkom nadejne. Uplne 100% to zial nie je - obcas to hodi "Detected a Cloudflare version 2 Captcha challenge, This feature is not available in the opensource (free) version.", ale mozno niekto najde alternativny modul, ktory si s tym poradi. |
? https://scrapeops.io/web-scraping-playbook/how-to-bypass-cloudflare/ |
Oproti předchozímu stavu je stahování silně omezené ve své škálovatelnosti. Stále je ale použitelné a hlavně není třeba zadávat captchu ručně. Ale jinak většinu času je to stále použitelné. |
Tohle vypadá jako dobrá cesta, nebo aspoň dočasnén řešení. Mergnu to a vydám další verzi, ať je to alespoň nějak použitelné, díky moc za nápad a za pull request :) |
Este som objavil https://github.com/FlareSolverr/FlareSolverr. Integracia s downloaderom a samotna ditribucia celeho dokopy je ale narocnejsia (vyzaduje to Docker, resp. binarku aplikacie) a aktualny release nepodporuje proxy cez Tor (riesi to ale jeden z merge requestov). |
Toto se mi děje při aktuální verzi. První soubor se stahl třeba po 10 minutách. Nijak to asi fixnout nejde, což? Jinak naprosto super práce a díky za ní! Nejde mi o to něco stáhnout rychle, spíš stáhnout bez opisování captchy. Takhle si naprogramuju frontu a jdu pryč dělat něco lepšího. JDownloader, kterej jde taky používat headless je overkill zbytečně. |
Funguje vám ještě verze 3.3.1? Mě běží, ale limit spadl jako na free stahování. |
Ano i ne. Začíná to na 1 až 2 vláknech, ale potom se to občas i rozjede na víc, takže pořád rychlejší než běžně. |
Mě to na 3.3.1 "začne stahovat", ale ty captchy to nevezme. Zkoušeno automaticky i ručně. Takže nestáhnu nic :( |
už mi to též konečně funguje (12 vláken). 🥳 |
Nějak mi to nefunguje, zkoušena poslední verze 3.5.1 a nic, chyby obrázku s kódem, pak 3.3.1 - nic - dokola zkouší řešit kód z obrázku, i když stahování je "Lucky bez captcha", tak nevím, zkoušel jsem i verzi 3.4.,0 a nic, ta rovnou spadne. Díky za možné tipy, přijde mi že to nefunguje vůbec, 3.3.1 se dokola snaží řešit kód z obrázku a nic nevyřeší ani po X minutách - jen dokola louská obrázky. PS: Zkusil jsem nahradit uloz to za uloz sk, ale to hned padlo. Díky za rady, pokud to nefunguje, nezlobím se, jen by bylo fajn napsat to někam coby hlavní informaci, popř. přímo do aplikace, aby to uživatelé nezkoušeli marně. Pokud je chyba u mě a vám to funguje dobře, pak se omlouvám, ale nevím co mám blbě - Python 3.11.3, Tor 12.5.1. |
Nový python nepodporuje tensorflow lite, zkus nainstalovat starší a na něj tflite z repozitáře pycoral. Je pravda, že mně to taky jednu dobu nešlo (ale ostatním ano), ale naposledy, když jsem to zkoušel, tak to fungovalo. V tu dobu, kdy mi to nešlo, jsem musel snad na každé stránce zadávat cloudflare captchu, tak možná proto. |
Tak nevím co dělám blbě, postup co jsem udělal - os je Windows 10 x64:
pak jsem v cmd zadal toto: python -m ensurepip --upgrade A i když se to tváří ok (downloader je 3.3.1, tensorflow.lite available, Created TensorFlow Lite XNNPACK delegate for CPU) , tak nic, u stahování kde mám "Lucky bez opisování" a vláken jsem zadal pro stahování 4 se to zacyklí na rozpoznávání obrázku. Díky za další možné rady, nějak nevím co s tím dál. Pokud víte co dělám špatně, prosím přesné instrukce, nejsem zdatný a jsem rád, že jsem to vůbec nějak dal dokopy 🙂 |
Zkus tflite z pycoral, jestli není problém tam, i když by to mělo fungovat. |
Zadáš cestu k souboru, co stáhneš a potom zadas nazev balicku s prikazem pro instalaci. |
Díky, nevím jak a co dělat, tak jsem zadal: (samozřejmě nevím zda je to tak dobře) python -m pip install --extra-index-url https://google-coral.github.io/py-repo/ pycoral~=2.0 A přišlo mi, že tensor flow původní nahradila verze pycoral, ale nevím, fakt tomu nerozumím, ovšem výsledek zase nula, opět to dokola řeší obrázek u stahování bez kódu. I tak díky. |
To pravděpodobně nenainstalovalo tflite. Otevřete odkaty vyberte tflite, najděte cp38, zárověň windows a 64bit, stáhněte ji na c:, otevřete cmd, zadejte cestu pomocí cd (např. |
@Wlassko |
Mno, zkusil jsem toto: zdroj sem vzal [(https://google-coral.github.io/py-repo/tflite-runtime/)] pip install https://github.com/google-coral/pycoral/releases/download/v2.0.0/tflite_runtime-2.5.0.post1-cp39-cp39-win_amd64.whl Offline jsem zkusil stáhnout soubor do C: a přejmenovat pro snažší implementaci na tflite.whl pip install tflite.whl Tak nevím, Python 3.8.0. Asi zkouším instalovat špatnou verzi tflite. Díky za odkaz na tu správnou, tato to asi není. Díky i za tip na user agenta a další, ale to je pro mě coby laika spíše nepobratelné, beru to zatím tak, že downloader nefunguje... PS: Tak jsem zkusil: a výsledek: Requirement already satisfied: numpy>=1.16.0 in c:\users\x6356astra22\appdata\local\programs\python\python38\lib\site-packages (from tflite-runtime==2.5.0.post1) A stahování stejně zaseknuté u obrázku, i když je stahování Lucky bez opisování. Takže nic. |
Ok, nemám to jak, vyzkoušet, protože nejsem doma. Naštěstí je teď zadarmo prehraj.to jako alternativa. |
Nevadí, asi to nejde. Snad časem. Díky za informace. |
mne to ide |
Jde? Jaká verze downloaderu a Pythonu? Díky. |
3.3.1 a python 3.9.16 |
Tak nevím co mám blbě, zkusil jsem toto:
dále klasika: python -m ensurepip --upgrade A výsledek nic, klip pro test z ulož nestáhne, napíše lucky bez kódu a zacyklí se na detekci kódů. Tak nic. Ale fajn, že to alespoň někomu funguje 🙂 Takže něco dělám blbě, když to někomu jede, ale samozřejmě netuším co, kdyby někdo věděl, proto píši svůj postup instalace, tak díky za upozornění. Zkusil jsem jestli nechce linky s tím # na konci (dávám bez, jen odkaz), ale to taky nemá vliv - bootstrapped 100% a pak dokola luští obrázky, i když je to lucky free jak jsem už psal 😕 |
Tak mně to taky funguje na mobilu (i když jen jedno vlákno). |
Mně to včera přestalo fungovat na pc...pár MB se stáhne a pak chyba na přístup k https.....a rychlost spadne na 0MB/s. Downloader furt běží, ale přeruší se download. zkusil jsem, win, ubuntu a wsl a stejný |
Občas se mi to chytí a stahuje. Musím ale měnit na ulozto sk / pl apod., ale i tak to jisté není. Jako teď - zadal jsem SK a 10 vláken a chytlo se a stahuje, ale jen 1 vlákno... Njn... ( Python 3.9.13, downloader 3.3.1 ) Edit: Tak oprava - stahuje 3 vlákny, staženo 40% z 300 MB, rychlost 0.44 MB/s ... No alespoň něco... |
Upravil jsem verzi 3.5.0, ve které jsem zrušil získávání CAPTCHA kódů přes TOR a poté stahování funguje spolehlivě, ačkoliv pouze při malém počtu vláken, což ovšem stačí pro pomalé automatické stahování na serveru. Při vyšším počtu vláken začne ulož.to požadovat Google Captchu, přes kterou se downloader nedostane. Zřejmě downloader také nebude fungovat mimo CZ/SK, kvůli čemuž se získávání CAPTCHA kódů přes TOR původně zavádělo. Odkaz na upravenou verzi: https://github.com/Golbinex/ulozto-downloader |
Ahoj, diky moc za snahu, ale co male mnozstvi vlaken? Mas prosim nejake doporucene nastaveni pro stahovani? |
@Golbinex Spíš tady myslím byl problém s cloudflare |
@DavidJares Stačí zadat parametr --parts 1 , ale jak zmínil @Vojtak42 , je asi rovnou lepší použít tuto verzi: |
https://gitlab.com/vladodriver/uld_go/-/commit/f0ffcde7cb0f62c4cda9514fc8fc59f491a57e60 |
Zdravím,
dneska jsem si chtěl jít stáhnout něco většího, ale u všech souborů mi to háže chybu při stahování
The text was updated successfully, but these errors were encountered: