Jak vytvořit správný PDF soubor pro archivaci na tomto webu?

Základní informace o kritériích, které musí splňovat PDF soubor s digitalizovaným číslem časopisu pro to, aby mohl být na tomto webu archivován jsou popsány v odkazu Jak se stát registrovaným uživatelem tohoto webu. Ale protože se na tento web obrací cca 10% zájemců o získání přístupu do archivu, kteří neumí takovýto PDF soubor vytvořit, pokusím se pro ně popsat jak postupuji já. Upozorňuji, že postup, který používám, není jediný správný a že existuje více způsobů – asi rychlejších, komfortnějších i spolehlivějších.

  • Časově nejnáročnější je samotné skenování časopisu. Pokud to váš program umožňuje, skenujte a ukládejte strany časopisu rovnou do formátu PDF.
  • Pokud máte časopis už naskenovaný (zpravidla ve formátu v JPG nebo TIF), zkontrolujte, zda je sken v rozlišení alespoň 300 dpi, zda jsou stránky správně ořezané i orientované.
  • Pojmenujte si stránky jednotlivého čísla tak, aby šly posloupně za sebou – aby byly správně seřazeny. Pak je převeďte do PDF. Já k tomu používám program Zoner Photo Studio 12 (zkušební a plně funkční verze lze stáhnout legálně ze stránek výrobce tohoto českého programu – http://www.zoner.cz/).
  • Nejdříve je ale vhodné skenované stránky upravit – ořezat. Lze ořezat i ve formátu PDF, ale to se mi zdá pracnější – zvláště, je-li potřeba každá stránka ořezat jinak.
  • Když budou všechny stránky správně ořezány, převedete je do souboru PDF. Pochopitelně musí být seřazeny posloupně, aby nebyly stránky na přeskáčku :-) V programu ZONER to jde jednoduše (já používám verzi 12 – u jiné verze to může být trochu jinak): vyberte všechny stránky jednoho čísla (pokud je máte v jednom adresáři, stačí jen Ctrl+A), pak zkrátka Ctrl+P, tlačítko „Další >”, ….. až po „Exportovat do PDF

navod_01

Další postup exportu z JPG do PDF ukazuji na příkladu jiného časopisu – MLADÉHO HLASATELE (to aby vás nemátly jiné obrázky):

1

2

3

4

5

6

  • Do políček v kroku „Parametry exportu do PDF“ vyplňte všechny 4 pole – důležité pro další práci s PDF časopisy (vyhledávání souborů, indexace, …)

navod_02

  • Soubor uložte se správným pojmenováním (!!!) – MLADY_TECHNIK_5.rocnik_(1951-52)_cislo_50 – bez háčků a čárek, s podtržítky místo mezer …. (nazev_rocnik_rok_cislo)

navod_03

navod_04

  • Spustím proces OCR – OK.  Spustí se proces, který trvá i několik minut – podle počtu stran. Tento proces je nezbytný proto aby se mohlo v souboru vyhledávat podle textu  (návod je i na http://www.detske-casopisy.cz/?s=jak+pomoc)

navod_05

  • Při procesu je vidět, která stránka se právě upravuje. Po ukončení akce se na obrazovce vrátí titulní strana.

navod_06

  • Po doběhnutí procesu nezapomeňte soubor ULOŽIT (Ctrl+S) nebo ikonka diskety.
  • Doporučuji provést kontrolu, že proces OCR proběhl v pořádku. Otevřu znovu soubor, do pole pro vyhledávání textu zadejte slovo o kterém bezpečně víte, že se v časopise vyskytuje – potvrďte – na obrazovce by se měla objevit stránka se zadaným slovem (v mém případě „technik“) a zvýrazněným slovem (v mém případě „technika“ – obsahuje slovo „technik“).

navod_07

  • A to je všechno, soubor je nyní vhodný k archivaci na www.detske-casopisy.cz – spolu s ostatními PDF soubory jej můžete poslat k přípravě archivu a nebo je (po přidělení oprávnění i k editaci webu) rovnou na web nahrát a připravit krátký článek s průvodním slovem, zajímavostmi, náhledem titulních stran a odkazy ke stažení.

 

Mějte na paměti, že pro archivování na tomto webu, musí výsledný soubor splňovat tyto kritéria:

  1. uložen ve formátu PDF
  2. pečlivě ořezané všechny strany tak uloženého čísla + dodržená správná orientace všech stran
  3. správně upravený formát PDF – ve kterém lze rozpoznat text  – OCR (důležité pro další badatelskou práci – vyhledávání dle textu, vytvoření rejstříku, …)
  4. uloženo 1 číslo do 1 souboru PDF
  5. maximální velikost jednoho souboru může být 30 MB
  6. při pojmenování souboru dodržený formát NÁZEV_ročník_rok-vydání_číslo (např. ABC_12.rocnik_(1967-68)_cislo 09.pdf) – bez háčků a čárek, namísto mezer podtržítko, …

 

 

3 Responses to Jak vytvořit správný PDF soubor pro archivaci na tomto webu?

  1. Miloš napsal:

    Nevím, kolik dělá chyb Adobe Acrobat Pro, tuším, že stojí cca kolem 10 tisíc! nabízím lepší řešení – AbbyyFineReader 12, umožňuje zonovat – neboli určit pořadí textových sloupců. Tento program stojí tuším cca 3000 Kč! a umožňuje skenování, rozpoznávání z obrázkových formátů, PDF a uložení do různých formátů od txt, docx, rtf, obrázkové PDF nebo PDF s textovou vrstvou pod obrazem stránky nebo nad ní … Další info a pomoc mohu na vyžádání sdělit.

  2. Josef napsal:

    Mám připravené 4. číslo ČINOVNÍKA 1946 k archivaci, – pošlu přes úschovnu na jakou adresu?
    Pepa Karhan

  3. Dazul napsal:

    editor@detske-casopisy.cz – pokud má soubor více než 5 MB, posílejte raději přes uschovna.cz

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *