Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Přidat vyhledávání na webu 2050 vč. vyhledávání v transkriptech #94

Open
letajicitreska opened this issue Feb 21, 2023 · 7 comments
Assignees

Comments

@letajicitreska
Copy link
Contributor

No description provided.

@mukrop
Copy link
Member

mukrop commented Feb 21, 2023

V zasade by sa dalo prebrat vyhladavanie, ktore pouzivame na faktaoklimatu.cz, ale trochu sa obavam, ze tam uz narazime na limit velkosti textov (transkripty su na tento system vyhladavanie mozno uz prilis dlhe). Prieskum tam robil @jankrcal, on bude vediet odhadnut, ci sa to da prebrat, alebo treba najst ine riesenie.

@letajicitreska
Copy link
Contributor Author

ok, počkám na vyjádření od Jen a případně odhadu jestli je to smysluplné (malé) množství práce nebo projekt do kterého se nemá smysl pouštět...

@jankrcal
Copy link
Member

Ve vyhledávání na FoK používáme prvních 3k znaků textu (tedy např. transkriptu epizody). Jedna epizoda může mít okolo 20k znaků, takže se teď indexuje jen malá část. Na Fok je ale spousta dalších textů, tak jsme omezení.

Čím víc textu v indexu, tím je vyhledávání pomalejší: zkusil jsem nahodit "prototyp" s indexem jen s epizodami (a pár obecnými stránkami), zato s plnými texty: https://cz-fakta-o-klimatu--preview-search-podcast-e39k2896.web.app/

Zkus Petře, jak Ti to funguje, jestli jsi spokojený s kvalitou vyhledávání, jak ti to funguje rychle, apod. (bylo by dobré asi zkusit i na nějakém pomalejším počítačí než relativně nový Mac Air)

Jinak nasadit vyhledávání na podcast odhaduju tak na 4h - 8h práce, v nějaké minimalistické variantě.

@jankrcal
Copy link
Member

Pro vyjasnění: prototyp je web FoK s jeho stávajícím vyhledáváním, ale protože web FoK obsahuje i veškeré podcast episody jako submodul, je to technicky ekvivalentní tomu, co bychom mohli nasadit na web 2050.

@letajicitreska
Copy link
Contributor Author

já asi nechápu, co v tom prototypu mám dělat abych to otestoval...

@jankrcal
Copy link
Member

Používat vyhledávání. Přesně v této rychlosti / kvalitě / podobném designu by to bylo na 2050. Pokud to nadále není jasné, můžem probrat na výjezdu, zas tak to asi nespěchá?

@letajicitreska
Copy link
Contributor Author

no na základě toho, co jsem testoval, tak v transkriptech to nevyhledává. můžeme klidně odložit na výjezd, určitě to není prioritní

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants