Skip to content
This repository has been archived by the owner on Jan 27, 2024. It is now read-only.

Nefunkční stahování #157

Open
oskarbukovsky opened this issue Apr 12, 2023 · 86 comments
Open

Nefunkční stahování #157

oskarbukovsky opened this issue Apr 12, 2023 · 86 comments

Comments

@oskarbukovsky
Copy link

oskarbukovsky commented Apr 12, 2023

Zdravím,
dneska jsem si chtěl jít stáhnout něco většího, ale u všech souborů mi to háže chybu při stahování

ulozto-downloader https://uloz.to/file/H9sjRGjgnKh8/google-logo-png#!ZGWuAGR1Z2MzZwt5MGNmBJWuMQqvBTuYoxExpSD5FUOwAwVj

[Autodetect] tflite_runtime available, using --auto-captcha
Starting downloading for url 'https://uloz.to/file/H9sjRGjgnKh8/google-logo-png#!ZGWuAGR1Z2MzZwt5MGNmBJWuMQqvBTuYoxExpSD5FUOwAwVj'
Getting info (filename, filesize, …)
[TOR]   TOR started
Cannot download file: Uloz.to returned status code 403, error: <!DOCTYPE html>
<html lang="en-US">
<head>
    <title>Just a moment...</title>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
    <meta http-equiv="X-UA-Compatible" content="IE=Edge">
    <meta name="robots" content="noindex,nofollow">
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <link href="/cdn-cgi/styles/challenges.css" rel="stylesheet">


</head>
<body class="no-js">
    <div class="main-wrapper" role="main">
    <div class="main-content">
        <noscript>
            <div id="challenge-error-title">
                <div class="h2">
                    <span class="icon-wrapper">
                        <div class="heading-icon warning-icon"></div>
                    </span>
                    <span id="challenge-error-text">
                        Enable JavaScript and cookies to continue
                    </span>
                </div>
            </div>
        </noscript>
        <div id="trk_jschal_js" style="display:none;background-image:url('/cdn-cgi/images/trace/managed/nojs/transparent.gif?ray=7b6c8bc9efeb1b09')"></div>
        <form id="challenge-form" action="/file/H9sjRGjgnKh8/google-logo-png?__cf_chl_f_tk=tQD0RYT2drK8z7aAjGvj0OnrSKOX6PezIcAR78vLI4E-1681313798-0-gaNycGzNCjs" method="POST" enctype="application/x-www-form-urlencoded">
            <input type="hidden" name="md" value="7BBnyetmnkeQ_wxMkXVz.9KJYzwUp0Qb5l2l4EMn3Cs-1681313798-0-ATm69RZ7s6oZFyPIfq2zviVIQOvNIjZ4XNFW91L9BSDRIM-iwfTYRsQnvV-LI23zMqL7uH76PQOcinqMJ9-7yjDilUTnkKI4u5FMe3PTPISoFMIJRZHkaZg3kK0ggfALztYs_ulqMLb5q3kYwsxZDkJfK9KgFAUetPTgPd4AnMfeGrR6EGQC2ZHP7CGx4W4V5bwYkoebs25UfFfS6eFig7CgnksFKy9baFxtRIeChelm7Ar7rEc1gNnCBiQuPUfqqkQnw43HkAxhjbUXP88bSS8LiOwEXjqmNbO5Xo_S2yjTzdESgJZFWbyW8CiVFpZxzNyvmb4HuSDd5iSXtfnaqxiiuUvTBOJsP91dAU-xeGC_Tz2qPcdPohXx81TsV7-0mlP0E9h0j6EV8x9FzQjHD4IP1RgK-rsBT88VwCYCnipMuPq8sUyNpW5r3lPdUtnBRq4EOjSRtzj0uQATE9VDW8JgFpSoZPK53xz9vFZPAcrWcyMWx8nPRn8cmmy0u918yfuq4M5ZVf6mbUCDdu7si-b-7RF0EZXKMOZBhOLJplmxeWf0IgCuG9Ps3JIq7B7E6xxWoTnsCqtpEz3EucNkr3W5Ea7UBrgcBM63PCmq2VeH4IfbbR0UbhCIKQouyoPQcd6SvID0PvSKmMf6_48pVhDmLOsLWWydU3VImVlyE7mvJqU0DjaF9LgDDdm2uaSWkZs-tmZP6DyTttJ8TOMQUM8I-skBTOBlEiaTGyUSRUUsFU9kFK6oCq8x50caVFrNAYwNvYkEGvVAFNNu5UfuPUR3943G5lSLdR79Rb7DWvaNzZC_VBVJV3a75-Z2hco-YrOXksoXzPGWnJ31iJ3bARqtikwVs1VQV3zeIFrXB5x129k4HW4zysdy3vast_51cQe2nuaqSpb7bwcf8HOW5DOJndcczEWfDRN8lXDTsf5OUF7SjhZLDEaMBxBtJkHT1LKFTJTQ1524Ps8hD2ILHEsJcFroSHewLHnFd51k76-p-vq4NWPmMIZb1xF-Hwx8XFkVHOov9KhSaYnyBE1DQrq5rRZ8648kTmy1V8K1AGhfzOesFfVxnzztVlY6muGHbsPyqrkfijWhPb0LFIefTG3VkuI-iv_oAYM6Ig9-wPvPIoc5ZP7-mZkrXblsk4tptcsjgCgabql9HzC3sAbZo-OTSLt8sP8xRujGiMJrQNaVqGH0hyVNyABgPcM-Eia6gtAWMi8G0O0xe9KofNapUUULOuxfZPiAVpOv3cxMosc3WeGLQ-ZNGjwYbd0SATHBwichZVm0dgZkT4U4yyDNV5Fsd2WoDSm3TLSM5aV92CYQkXOK9ScoBRfqg9BhfVzz6AWipKtiBDil_txzqvuzpkAo5zzrm-FcsJL-LczdDkIjWgxNDgkrNhwK75ZORTH0IqH08arxwJVyCvGdywGFg_1fGPiGupMyyoyoojHz8TMA-m0A3Xdc9waE0HA0RxZ9wz0eK6Zg4Xp0fFWAE5ez7wgEzE8bdPIrz1bwbwA9PvTBta2RfNVbAy2v-3pTK3rFoM_QhyEWzupIM41uaVfEjXvVudb4sKoB4hX_zxRTYdbL6q1YAJvjgoCpMFiUiIExQBrNbpmi8jfXe_I57ucuIv6GpYrKpEtoEWXOM4_UHvB8fq8KISFtaD4tAOHPFYzDrQY1lSoIpCEceW3QJBLF5ux8Ef2sk-fEn4Lh9SVM_B_2ehV-cNg7m-PCIMEIIXKuV_k615BkG3D3arZht7ZfDtevvnj86jnxZzhMogcofPY92j3ZtM5baxEbwXOTJoABwwwAraWCdcPR0Pduqxhusd1vwhKf67R53LuZNlxX4suQbrNsUxcKuzQJZ-IeNMQxURKUj_ga-WPaWFoxMsbQHmRfGDayEF9R283zkJgY1a6RNglS2OVOWa60B68PqXXcRPY_ulyzPAsKhkeCpggQehrWxQ9fUyb5Z5OlmxezkP10i8v5ucKktzT8hDa8GIodCUjRn0peq9sMSJQsDMhryDYxrGQTp2Wz0GRr9TWUtaqIUnpsa2YkVNuIGBOaMG-7x-lO3yQllVDRNTnpdBqVELkU5LjugJ0IVJEjDnwULNA0tV2WPUvrF_c8NcW9LGKvGACEUu3CizfUsxOrM6x7VVurpwsmn5E5Nue3cSN7wHe2nUmW_7xav06cXvHrxbetIh1ylXLrAOxLnKkDsm7czAEouFm7UF7o4pXKKncEnxej9oD87A2WMdBylWyGPjIJbovWAhNv1oWv49T1pynipC6i8lfSXPKUR7y0hRj8p4qU3OCYyxvK8y9ZY0Fg_ZdGcjHcoTKtMdbv5UN5wcvGz3GKDZCLJ7cBp8wTVjl_YGt58ooA9aQGtWTMJQpBze6aqUa6z2FHtaXoqap4o4o7HdQggJF7Ohnr35zi0UueTXNdvf6B2l7SWaGHBvcrnlzYNH72OA-A2Chku0_HbPOkx1WMyEDw8IR8eJ6x2txQOYKcKGdO5iaVadfDST1qs5aRZNbTrnghXle92VZaP4OI4PmixHm7kDMHmD6F5x85OZk6j7u9wBKHQWLLP0Oe3Rsi8Q">
        </form>
    </div>
</div>
<script>
    (function(){
        window._cf_chl_opt={
            cvId: '2',
            cZone: 'uloz.to',
            cType: 'managed',
            cNounce: '905',
            cRay: '7b6c8bc9efeb1b09',
            cHash: 'd4f6c2da112a486',
            cUPMDTk: "\/file\/H9sjRGjgnKh8\/google-logo-png?__cf_chl_tk=tQD0RYT2drK8z7aAjGvj0OnrSKOX6PezIcAR78vLI4E-1681313798-0-gaNycGzNCjs",
            cFPWv: 'b',
            cTTimeMs: '1000',
            cMTimeMs: '0',
            cTplV: 5,
            cTplB: 'cf',
            cK: "",
            cRq: {
                ru: 'aHR0cHM6Ly91bG96LnRvL2ZpbGUvSDlzalJHamduS2g4L2dvb2dsZS1sb2dvLXBuZw==',
                ra: 'cHl0aG9uLXJlcXVlc3RzLzIuMjguMQ==',
                rm: 'R0VU',
                d: 'BbWHn9UHw5+vsw89l003+tWwnqgsw4ocVGu0y846sFiTMZFuzlkQU8pdJjRlswNYCiN+iXDxmLaqCHRP191qBlGfol5alyhR6AZUGK2bIQk41QQdVCedAeKfkYCIzJLK6OqcPvI+Y5Sph72oScdFaRu2wg4SfXHd4yPkBmxF0hGtacNVePrLTw1t4ybeI09B3Rs9Vxo2TAWeJkHwHAmoK+8y7t29Homa45SqT8ZfFCMx28cRMJvFKMymQz95MnV54OOwKxpRzaTbwq1tUjsIXBEBgckneZpxnrwJAU2FeUbCHJbcLQnWGJLpwVnnCwdmFSj4XfkF+0d0UXTPUfo+7pLvI70reeY1gaNtwsPbZ/GwF7wFU6hEyMRejezsehoRQepSCGrk75y/2ScXqlLWDQd1tG8e/BLj9kyPm9UPksQJ1E39cM+R0tc8evo94dRO1RWrt3B0IQegA0qwAUaN15kPKU1MiF3KBY2i+2exwKZd7+h21h+LIa0S4o/q2moR6g33wp6HSLGROo+08n7DtiBPcI7l//nGMvCZpxNTMrz9JnObQhp9Nh3WVtEaSLO0',
                t: 'MTY4MTMxMzc5OC43MDMwMDA=',
                m: 'bczx1lfTZctWcnlhUzYPpRumxRyZa1oFYe2sTqI02n4=',
                i1: 'dLFrc0AEDQ/0laJed6tuYg==',
                i2: 'fJAOKwqhjrGuip7VaVPqRQ==',
                zh: 'H6H5rT46MdJEduO2EFVWUYu6Mz0W/6o6lKBs5jFOnDc=',
                uh: 'SLdVolODg++SO356HusO5I/hbfOpiiOxQXj62i/MUkA=',
                hh: 'AZxN1L+Nck6+Yo5cCT418B4s2dJxrgUeCciQcMYDIbA=',
            }
        };
        var trkjs = document.createElement('img');
        trkjs.setAttribute('src', '/cdn-cgi/images/trace/managed/js/transparent.gif?ray=7b6c8bc9efeb1b09');
        trkjs.setAttribute('alt', '');
        trkjs.setAttribute('style', 'display: none');
        document.body.appendChild(trkjs);
        var cpo = document.createElement('script');
        cpo.src = '/cdn-cgi/challenge-platform/h/b/orchestrate/managed/v1?ray=7b6c8bc9efeb1b09';
        window._cf_chl_opt.cOgUHash = location.hash === '' && location.href.indexOf('#') !== -1 ? '#' : location.hash;
        window._cf_chl_opt.cOgUQuery = location.search === '' && location.href.slice(0, location.href.length - window._cf_chl_opt.cOgUHash.length).indexOf('?') !== -1 ? '?' : location.search;
        if (window.history && window.history.replaceState) {
            var ogU = location.pathname + window._cf_chl_opt.cOgUQuery + window._cf_chl_opt.cOgUHash;
            history.replaceState(null, null, "\/file\/H9sjRGjgnKh8\/google-logo-png?__cf_chl_rt_tk=tQD0RYT2drK8z7aAjGvj0OnrSKOX6PezIcAR78vLI4E-1681313798-0-gaNycGzNCjs" + window._cf_chl_opt.cOgUHash);
            cpo.onload = function() {
                history.replaceState(null, null, ogU);
            };
        }
        document.getElementsByTagName('head')[0].appendChild(cpo);
    }());
</script>


</body>
</html>

Terminating download. Please wait for stopping all threads.
Download terminated.```

ulozto-downloader --version

3.4.1
@DavidJares
Copy link

To samé od včera

@Ariczek
Copy link

Ariczek commented Apr 13, 2023

Děje se mi s verzí 3.4.1. Verze 3.3.1 tento problém nemá - ale tam selhává captcha solver - teď mám třeba Ok 2 / 237 a pořád se snaží. To byl důvod proč jsem u sebe zkusil update na 3.4.1.

Tý captche se v 3.3.1 moc nedaří - výsledek byl

[Link solve]    CAPTCHA answer 'rufl' (timeout 30)
                [Ok: 9 / 1831] :( [Badcp: 3 Limited: 3 Censored: 2 NetErr: 3]

@oskarbukovsky
Copy link
Author

Nevím jakou jsem měl verzi před tím, ale captcha se mi nechtěla splnit vůbec, tak jsem zkusil update a ono tohle

@setnicka
Copy link
Owner

Možná to souvisí s tím, že v téhle verzi se přes Tor pokouší ulozto-downloader stahovat i úvodní requesty, což obchází geoblocking v některých státech, ale vypadá to, že Ulozto začalo připojení přes Tor částečně blokovat.

Trochu podezřívám 86a6342 a pak taky nějaké změny na straně Ulozto.cz.

Zrovna nemám moc času se tomu věnovat, ale pokud na to nikdo nepřijde dřív, tak se k tomu dostanu možná v průběhu příštího týdne.

@pavelvodrazka
Copy link

Děje se mi s verzí 3.4.1. Verze 3.3.1 tento problém nemá - ale tam selhává captcha solver - teď mám třeba Ok 2 / 237 a pořád se snaží. To byl důvod proč jsem u sebe zkusil update na 3.4.1.

Tý captche se v 3.3.1 moc nedaří - výsledek byl

[Link solve]    CAPTCHA answer 'rufl' (timeout 30)
                [Ok: 9 / 1831] :( [Badcp: 3 Limited: 3 Censored: 2 NetErr: 3]

Mám uplně stejný problém. Stará verze 3.3.1 má posledních pár dní velké problémy s captchou. Nová verze 3.4.1 dostává 403 Forbidden na úvodní request. Navíc se mi zdá, že ignoruje parametr --temp

$ ulozto-downloader --temp /downloads https://uloz.to/file/WB4jdTwMMuxp/debian-11-6-0-amd64-netinst-iso
Starting downloading for url 'https://uloz.to/file/WB4jdTwMMuxp/debian-11-6-0-amd64-netinst-iso'
Getting info (filename, filesize, …)
[TOR]	Unable to start TOR: Process terminated: Couldn't create private data directory "//.tor"

@Vojtak42
Copy link
Contributor

Mně nefungovala ani verze 3.3.1.
[TOR] TOR started Cannot download file: SOCKSHTTPSConnectionPool(host="'https", port=443): Max retries exceeded with url: //uloz.to/file/WB4jdTwMMuxp/debian-11-6-0-amd64-netinst-iso' (Caused by NewConnectionError('<urllib3.contrib.socks.SOCKSHTTPSConnection object at 0x00000250EB236FE0>: Failed to establish a new connection: [Errno 11001] getaddrinfo failed')) Terminating download. Please wait for stopping all threads. Download terminated.

@filo891
Copy link
Collaborator

filo891 commented Apr 14, 2023

Možná to souvisí s tím, že v téhle verzi se přes Tor pokouší ulozto-downloader stahovat i úvodní requesty, což obchází geoblocking v některých státech, ale vypadá to, že Ulozto začalo připojení přes Tor částečně blokovat.

Trochu podezřívám 86a6342 a pak taky nějaké změny na straně Ulozto.cz.

Zrovna nemám moc času se tomu věnovat, ale pokud na to nikdo nepřijde dřív, tak se k tomu dostanu možná v průběhu příštího týdne.

Nezda sa mi, ze by to bolo tymto commitom. Pre istotu som pridal #158, ktory vracia povodnu funkcionalitu a novu zapina dedikovanym parametrom. U mna sa to kazdopadne chova rovnako nepredvidatelne v oboch pripadoch, takze tiez skor podozrievam zmeny na strane Ulozto.

@Vojtak42
Copy link
Contributor

Bude to ulozto, protože vžum teď taky přestal fungovat.

@ParaLizzard
Copy link

Bude to ulozto, protože vžum teď taky přestal fungovat.

Vzum nefunguje už od začátku jara 2022, po létě byl opraven ale fungoval jen asi tyden nebo dva. A autor zřejmě už zlomil nad tím projektem hůl.

@Vojtak42
Copy link
Contributor

Ještě 14 dní zpátky fungoval, pouze nefungoval captcha solver.

@mpegyna
Copy link

mpegyna commented Apr 16, 2023

Bude to ulozto, protože vžum teď taky přestal fungovat.

Vzum nefunguje už od začátku jara 2022, po létě byl opraven ale fungoval jen asi tyden nebo dva. A autor zřejmě už zlomil nad tím projektem hůl.

Ve vzum nefungovala akorat captcha. Kdyz clovek vypnul automaticky vyplnovani a vyplnoval rucne, fungovalo vse ok - az do doby pred 4 dny, tj. presne ve stejnou dobu, kdy byl nahlasen problem i tady.

@engycz
Copy link

engycz commented Apr 17, 2023

@mpegyna
Copy link

mpegyna commented Apr 17, 2023

Možná to souvisí s tím, že v téhle verzi se přes Tor pokouší ulozto-downloader stahovat i úvodní requesty, což obchází geoblocking v některých státech, ale vypadá to, že Ulozto začalo připojení přes Tor částečně blokovat.

Trochu podezřívám 86a6342 a pak taky nějaké změny na straně Ulozto.cz.

Ad geoblocking a Tor - z mych zkusenosti z TorBrowseru nejde z uloz.to stahovat ani v neblokovanych nodech, ale alias ulozto.net lze navstivit i z geoblokovaneho nodu a z aliasu zachovajto.pl lze i stahovat.

@vladodriver
Copy link
Contributor

Hostname zachowajto.pl ulozto.sk funguji dale.. staci tedy pouzit vzdy jedno z nich..
https://gitlab.com/vladodriver/uld_go/-/commit/8e569c48dfdbb2eddeb30053fed2cd85d0f965b0

@Wlassko
Copy link

Wlassko commented Apr 20, 2023

Takže pro laika - než se to opraví (pokud), tak adresu zadávanou upravit tak, že místo uloz.to nahradím za zachowajto.pl nebo ulozto.sk a ono to vezme. Právě také mi to nešlo se starou 3.3.1 - děsně pokusů dokola a pak jelo třeba jen 1 stahovací vlákno, což pak skoro ztrácí význam používat, tak jsem updatoval na 3.4.1 společně s Pythonem 3.11 a chyba jak se zde už uvádí - 403 a nebo podobné - blokováno, nenalezeno apod., takže zatím stačí to nahrazení adresy (části) a čekat a doufat. Je možné, že to je tedy vina UložTo a jejich blokování a mohou to zablokovat tak, že to již nepůjde obejít? Díky za info a za práci na aplikaci.

Edit: Jen dodám, že jsem zkusil stažení se změnou na zachowajto a jelo to, stejně to sice hodilo chybu nějaký TOR errorlog, ale stáhlo to.

Ten error.log na ploše obsahuje jen toto "Tor 0.4.7.13 (git-7c1601fb6edd780f) opening new log file.". TOR mám 12.0.4.

@Wlassko
Copy link

Wlassko commented Apr 27, 2023

A už to nedje ani při změně na zachowajto, nebo uloztoSK ... 🙁

@pmalecek
Copy link

Jop, taky už mi to nejde :-(

@SpiReCZ
Copy link
Contributor

SpiReCZ commented Apr 27, 2023

Jop, taky už mi to nejde :-(

Proto jsem svůj program neupravoval, protože jsem očekával tento výsledek v dohledné době.

@ghost
Copy link

ghost commented Apr 28, 2023

Má někdo ještě nějakou alternativu krom sk nebo polska, která mu funguje?

@setnicka
Copy link
Owner

Obávám se, že Ulož.to teď se snahou tvářit se spíše jako disk než jako místo pro sdílení souborů bude proti podobným stahovačům (které ale mimochodem nijak neporušují jejich docela krátké podmínky použití, ty jsem si mnohokrát pročítal) bojovat aktivněji.
Možná někoho z nás napadne další způsob, jak zautomatizovat i tyhle nově přidané ochrany, ale obávám se, že to nebude vůbec lehké, bohužel :-(

@ParaLizzard
Copy link

RIP ulozto-downloader

@filo891
Copy link
Collaborator

filo891 commented Apr 28, 2023

Zatial by som to uplne nepochovaval. Skusil som narychlo naintegrovat https://github.com/VeNoMouS/cloudscraper (vid #163) a zatial to vyzera celkom nadejne.

Uplne 100% to zial nie je - obcas to hodi "Detected a Cloudflare version 2 Captcha challenge, This feature is not available in the opensource (free) version.", ale mozno niekto najde alternativny modul, ktory si s tym poradi.

@mpegyna
Copy link

mpegyna commented Apr 28, 2023

Zatial by som to uplne nepochovaval. Skusil som narychlo naintegrovat https://github.com/VeNoMouS/cloudscraper (vid #163) a zatial to vyzera celkom nadejne.

Uplne 100% to zial nie je - obcas to hodi "Detected a Cloudflare version 2 Captcha challenge, This feature is not available in the opensource (free) version.", ale mozno niekto najde alternativny modul, ktory si s tym poradi.

?
https://www.zenrows.com/blog/bypass-cloudflare-python#what-is-cloudflare-bot-manager

https://scrapeops.io/web-scraping-playbook/how-to-bypass-cloudflare/

@SpiReCZ
Copy link
Contributor

SpiReCZ commented May 1, 2023

Oproti předchozímu stavu je stahování silně omezené ve své škálovatelnosti. Stále je ale použitelné a hlavně není třeba zadávat captchu ručně.
Co mě nyní trápí, tak je že některé party se iniciují náhodně v jiném pořadí, než dříve. To způsobuje, že například 1. parta není iniciována, ale zbylých 9 ano. Pokud přes API posílám nekompletní soubor, tak to na základě 1. party selže, protože ji to potřebuje jako první.

Ale jinak většinu času je to stále použitelné.

@setnicka
Copy link
Owner

setnicka commented May 2, 2023

@filo891

Zatial by som to uplne nepochovaval. Skusil som narychlo naintegrovat https://github.com/VeNoMouS/cloudscraper (vid #163) a zatial to vyzera celkom nadejne.

Tohle vypadá jako dobrá cesta, nebo aspoň dočasnén řešení. Mergnu to a vydám další verzi, ať je to alespoň nějak použitelné, díky moc za nápad a za pull request :)

@filo891
Copy link
Collaborator

filo891 commented May 2, 2023

Este som objavil https://github.com/FlareSolverr/FlareSolverr. Integracia s downloaderom a samotna ditribucia celeho dokopy je ale narocnejsia (vyzaduje to Docker, resp. binarku aplikacie) a aktualny release nepodporuje proxy cez Tor (riesi to ale jeden z merge requestov).

@petrbrazda
Copy link

image

Toto se mi děje při aktuální verzi. První soubor se stahl třeba po 10 minutách. Nijak to asi fixnout nejde, což? Jinak naprosto super práce a díky za ní! Nejde mi o to něco stáhnout rychle, spíš stáhnout bez opisování captchy. Takhle si naprogramuju frontu a jdu pryč dělat něco lepšího. JDownloader, kterej jde taky používat headless je overkill zbytečně.

@bt4ibwem8
Copy link

mne to dava pri najnovsej verzii 3.5.1 tuto chybu:

image

@Ghostman863
Copy link

Funguje vám ještě verze 3.3.1? Mě běží, ale limit spadl jako na free stahování.

@ParaLizzard
Copy link

ParaLizzard commented Jun 4, 2023

Funguje vám ještě verze 3.3.1?

Ano i ne. Začíná to na 1 až 2 vláknech, ale potom se to občas i rozjede na víc, takže pořád rychlejší než běžně.

@oskarbukovsky
Copy link
Author

Mě to na 3.3.1 "začne stahovat", ale ty captchy to nevezme. Zkoušeno automaticky i ručně. Takže nestáhnu nic :(

@Vojtak42
Copy link
Contributor

Vojtak42 commented Jun 5, 2023

už mi to též konečně funguje (12 vláken). 🥳

@Wlassko
Copy link

Wlassko commented Jul 14, 2023

Nějak mi to nefunguje, zkoušena poslední verze 3.5.1 a nic, chyby obrázku s kódem, pak 3.3.1 - nic - dokola zkouší řešit kód z obrázku, i když stahování je "Lucky bez captcha", tak nevím, zkoušel jsem i verzi 3.4.,0 a nic, ta rovnou spadne.

Díky za možné tipy, přijde mi že to nefunguje vůbec, 3.3.1 se dokola snaží řešit kód z obrázku a nic nevyřeší ani po X minutách - jen dokola louská obrázky.

PS: Zkusil jsem nahradit uloz to za uloz sk, ale to hned padlo. Díky za rady, pokud to nefunguje, nezlobím se, jen by bylo fajn napsat to někam coby hlavní informaci, popř. přímo do aplikace, aby to uživatelé nezkoušeli marně. Pokud je chyba u mě a vám to funguje dobře, pak se omlouvám, ale nevím co mám blbě - Python 3.11.3, Tor 12.5.1.

@Vojtak42
Copy link
Contributor

Nový python nepodporuje tensorflow lite, zkus nainstalovat starší a na něj tflite z repozitáře pycoral. Je pravda, že mně to taky jednu dobu nešlo (ale ostatním ano), ale naposledy, když jsem to zkoušel, tak to fungovalo. V tu dobu, kdy mi to nešlo, jsem musel snad na každé stránce zadávat cloudflare captchu, tak možná proto.

@Wlassko
Copy link

Wlassko commented Jul 14, 2023

Tak nevím co dělám blbě, postup co jsem udělal - os je Windows 10 x64:

  • odinstaloval jsem Python 3.11
  • smazal jsem složku Python aby instalace byla nová bez předchozích pozůstatků
  • instaloval jsem Python 3.8.0

pak jsem v cmd zadal toto:

python -m ensurepip --upgrade
python -m pip install --upgrade pip
pip3 install --upgrade ulozto-downloader[auto-captcha]
python -m pip install wheel
python -m pip install tensorflow
pip install ulozto-downloader==3.3.1

A i když se to tváří ok (downloader je 3.3.1, tensorflow.lite available, Created TensorFlow Lite XNNPACK delegate for CPU) , tak nic, u stahování kde mám "Lucky bez opisování" a vláken jsem zadal pro stahování 4 se to zacyklí na rozpoznávání obrázku.

Díky za další možné rady, nějak nevím co s tím dál. Pokud víte co dělám špatně, prosím přesné instrukce, nejsem zdatný a jsem rád, že jsem to vůbec nějak dal dokopy 🙂

@Vojtak42
Copy link
Contributor

Zkus tflite z pycoral, jestli není problém tam, i když by to mělo fungovat.

@Vojtak42
Copy link
Contributor

Zadáš cestu k souboru, co stáhneš a potom zadas nazev balicku s prikazem pro instalaci.

@Wlassko
Copy link

Wlassko commented Jul 14, 2023

Díky, nevím jak a co dělat, tak jsem zadal: (samozřejmě nevím zda je to tak dobře)

python -m pip install --extra-index-url https://google-coral.github.io/py-repo/ pycoral~=2.0

A přišlo mi, že tensor flow původní nahradila verze pycoral, ale nevím, fakt tomu nerozumím, ovšem výsledek zase nula, opět to dokola řeší obrázek u stahování bez kódu. I tak díky.

@Vojtak42
Copy link
Contributor

To pravděpodobně nenainstalovalo tflite. Otevřete odkaty vyberte tflite, najděte cp38, zárověň windows a 64bit, stáhněte ji na c:, otevřete cmd, zadejte cestu pomocí cd (např. cd C:\, zadejte pip install [file.whl] - file.whl nahraďte skutečným názvem souboru. Snad je to teď srozumitelné🙂.

@zbyna
Copy link
Contributor

zbyna commented Jul 15, 2023

@Wlassko
za sebe mohu říct, ze mi nefunguje žádná verze :-(
3.3.1 fungovat přestala, nejnovější nikdy nezačala. Nainstalováno mám na 99% všechno OK.
Už bych se dávno pustil do “fixování” ale jsem po zánětu mozkových blan a pravděpodobně ještě dlouho se k programování nedostanu. To není nářek, jenom konstatování stavu. Doufám to fixne někdo další. Pravděpodobně bych nejdřív zkoušel přesvědčit protistranu, že downloader je normální prohlížeč pomocí:
user agent
hlaviček
Pěkně popsané je to i tady .
Mohlo by to pomoct, ale nemusí, je to hodně o experimentování a čase.Roli můžou hrát i cookies.

@Wlassko
Copy link

Wlassko commented Jul 15, 2023

Mno, zkusil jsem toto: zdroj sem vzal [(https://google-coral.github.io/py-repo/tflite-runtime/)]

pip install https://github.com/google-coral/pycoral/releases/download/v2.0.0/tflite_runtime-2.5.0.post1-cp39-cp39-win_amd64.whl
ERROR: tflite_runtime-2.5.0.post1-cp39-cp39-win_amd64.whl is not a supported wheel on this platform.

Offline jsem zkusil stáhnout soubor do C: a přejmenovat pro snažší implementaci na tflite.whl

pip install tflite.whl
ERROR: tflite.whl is not a valid wheel filename.

Tak nevím, Python 3.8.0. Asi zkouším instalovat špatnou verzi tflite. Díky za odkaz na tu správnou, tato to asi není. Díky i za tip na user agenta a další, ale to je pro mě coby laika spíše nepobratelné, beru to zatím tak, že downloader nefunguje...

PS: Tak jsem zkusil:

pip install https://github.com/google-coral/pycoral/releases/download/v2.0.0/tflite_runtime-2.5.0.post1-cp38-cp38-win_amd64.whl#sha256=28c2f631edff80d66cf22e3cf94b2f0fb5ef3008cc827dbe7427c1678673158c

a výsledek:

Requirement already satisfied: numpy>=1.16.0 in c:\users\x6356astra22\appdata\local\programs\python\python38\lib\site-packages (from tflite-runtime==2.5.0.post1)
(1.24.3)

A stahování stejně zaseknuté u obrázku, i když je stahování Lucky bez opisování. Takže nic.

@Vojtak42
Copy link
Contributor

Ok, nemám to jak, vyzkoušet, protože nejsem doma. Naštěstí je teď zadarmo prehraj.to jako alternativa.

@Wlassko
Copy link

Wlassko commented Jul 18, 2023

Nevadí, asi to nejde. Snad časem. Díky za informace.

@bt4ibwem8
Copy link

mne to ide

@Wlassko
Copy link

Wlassko commented Jul 20, 2023

Jde? Jaká verze downloaderu a Pythonu? Díky.

@bt4ibwem8
Copy link

3.3.1 a python 3.9.16

@Wlassko
Copy link

Wlassko commented Jul 20, 2023

Tak nevím co mám blbě, zkusil jsem toto:

  • odinstaloval jsem vše a smazal složky
  • instaloval jsem Python 3.9.13, protože 3.9.16 oficiálně nejde stáhnout a novější jsem zkusit zatím nechtěl

dále klasika:

python -m ensurepip --upgrade
python -m pip install --upgrade pip
pip3 install --upgrade ulozto-downloader[auto-captcha]
pip install ulozto-downloader==3.3.1 (nevím jak rovnou instalovat 3.3.1, resp. když použiji jen toto bez řádku výše, zda nebude třeba instalovat ty další závislosti, dodání ==3.3.1 za předchozí řádek končí chybou)
python -m pip install wheel
python -m pip install tensorflow (bez tohoto mi háže okna s písmenky, ale ruční opis nebere a hlásí chybu znaků a toto dokola)

A výsledek nic, klip pro test z ulož nestáhne, napíše lucky bez kódu a zacyklí se na detekci kódů. Tak nic. Ale fajn, že to alespoň někomu funguje 🙂
Zkusil jsem i vypnout --parts-progress, ale vliv to nemá, ať to zobrazuje či ne, zasekne se na detekci textu z obrázků, resp. zacyklí se.

Takže něco dělám blbě, když to někomu jede, ale samozřejmě netuším co, kdyby někdo věděl, proto píši svůj postup instalace, tak díky za upozornění. Zkusil jsem jestli nechce linky s tím # na konci (dávám bez, jen odkaz), ale to taky nemá vliv - bootstrapped 100% a pak dokola luští obrázky, i když je to lucky free jak jsem už psal 😕

@Vojtak42
Copy link
Contributor

Vojtak42 commented Jul 20, 2023

Tak mně to taky funguje na mobilu (i když jen jedno vlákno).

@Ghostman863
Copy link

Mně to včera přestalo fungovat na pc...pár MB se stáhne a pak chyba na přístup k https.....a rychlost spadne na 0MB/s. Downloader furt běží, ale přeruší se download. zkusil jsem, win, ubuntu a wsl a stejný

@Wlassko
Copy link

Wlassko commented Jul 22, 2023

Občas se mi to chytí a stahuje. Musím ale měnit na ulozto sk / pl apod., ale i tak to jisté není. Jako teď - zadal jsem SK a 10 vláken a chytlo se a stahuje, ale jen 1 vlákno... Njn... ( Python 3.9.13, downloader 3.3.1 )

Edit: Tak oprava - stahuje 3 vlákny, staženo 40% z 300 MB, rychlost 0.44 MB/s ... No alespoň něco...

@Golbinex
Copy link

Golbinex commented Aug 23, 2023

Upravil jsem verzi 3.5.0, ve které jsem zrušil získávání CAPTCHA kódů přes TOR a poté stahování funguje spolehlivě, ačkoliv pouze při malém počtu vláken, což ovšem stačí pro pomalé automatické stahování na serveru. Při vyšším počtu vláken začne ulož.to požadovat Google Captchu, přes kterou se downloader nedostane.

Zřejmě downloader také nebude fungovat mimo CZ/SK, kvůli čemuž se získávání CAPTCHA kódů přes TOR původně zavádělo.

Odkaz na upravenou verzi: https://github.com/Golbinex/ulozto-downloader

@DavidJares
Copy link

Ahoj, diky moc za snahu, ale co male mnozstvi vlaken? Mas prosim nejake doporucene nastaveni pro stahovani?

@Vojtak42
Copy link
Contributor

@Golbinex Spíš tady myslím byl problém s cloudflare

@Vojtak42
Copy link
Contributor

@DavidJares #173

@Golbinex
Copy link

@DavidJares Stačí zadat parametr --parts 1 , ale jak zmínil @Vojtak42 , je asi rovnou lepší použít tuto verzi:
https://github.com/filo891/ulozto-downloader/tree/cfsolver-support

@vladodriver
Copy link
Contributor

https://gitlab.com/vladodriver/uld_go/-/commit/f0ffcde7cb0f62c4cda9514fc8fc59f491a57e60
line 25 -> pridat podobnou cookie (je pro vsechny requesty nezavisla na IP...) + pouzit hostname uloz.to, aby to souhlasilo s tou cookie a pak to pojede jako drive.. (krom IP adres blokovanych code 451)

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
None yet
Projects
None yet
Development

No branches or pull requests