Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Elektronické publikace - možnost archivace PDF i PDF/A #218

Open
kerschfilip opened this issue Jul 18, 2024 · 1 comment
Open

Elektronické publikace - možnost archivace PDF i PDF/A #218

kerschfilip opened this issue Jul 18, 2024 · 1 comment

Comments

@kerschfilip
Copy link

Zdravím,

Při zpracování born digital publikací v KNAV narážíme pravidelně na problémy při konverzi PDF do PDF/A. Zejména jde o

  • Nemožnost soubor do PDF/A vůbec převést (při kontrole přes veraPDF je výsledek nevalidní, i když Adobe např. tvrdí, že soubor PDF/A je)
  • Ztráta části informačního obsahu u validních PDF/A (nejčastěji kvůli nedostupnosti fontů)
  • Vizuální rozdíly mezi původním a konvertovaným souborem (nejčastěji snížená kvalita obrázků v PDF/A oproti PDF)

Vzhledem k těmto problémům zvažujeme možnost uchovávat jak původní verzi PDF získanou od vydavatele, tak její verzi převedenou na PDF/A. Ideální by samozřejmě bylo s vydavatelem vykomunikovat problémy v předaném PDF a vyřešit je tak, že ke zpracování dostaneme validní PDF/A. Např. v našem případě jsou ale vydavateli ústavy AV ČR, které často nemají dostatečnou kapacitu tohle řešit.

Otázky:

  1. Potýká se někdo s podobnými problémy a má případně nějaké (osvědčené) návrhy na jejich řešení?
  2. Umožňuje současný standard NDK uchovávat obě verze PDF (původní i PDF/A)?

V současné DMF je, že standard předpokládá zpracovávání dokumentů ve formátech .epub, PDF a PDF/A, přičemž doporučené jsou verze .epub 2.0.1 a PDF/A-1 a PDF/A-2. Také je uvedeno, že složka může obsahovat více souborových formátů pro jednu intelektuální entitu. Není nám však jasné, jak přesně postupovat v případě uchování obou verzí PDF a jak lze v rámci standardu označit jednu verzi jako archivní a druhou jako uživatelskou kopii (např. pro použití v Krameriovi)? Částečně issue asi souvisí s #94

Obdobně si vlastně nejsem jistý, jak je možné např. pro jednu elektronickou monografii mít soubory ve formátu PDF i EPUB - respektive hlavně jak to má vypadat ve strukturální a logické mapě.

Díky moc za případné rady k této problematice.

@FilipPavcik
Copy link
Collaborator

Ahoj, aspoň stručne skúsim odpovedať:

  1. ano, aj my máme podobné problémy pri konverzi – hlavne čo sa týka vizuálnych rozdielov, ale aj čo sa týka nevalidnosti (podle VeraPDF). Avšak bohužiaľ zatiaľ ešte na to nemáme žiadne osvedčené riešenie.
  2. V súčasnosti to standard de facto neumožňuje. Hoci je v DMF uvedené, že „složka může obsahovat více formátů“, nie je tam definované, ako konkrétne má vyzerať balíček, ani ako to má byť v štrukturálnych mapách. Podobu balíčku s viacerými formátmi (minimálne pre pôvodné PDF a PDF/A plánujeme nadefinovať).

Túto požiadavku môžeme prebrať aj na najbližšej schůzke PS pro elektronické publikace.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants