Jak vytvořit správný PDF soubor pro archivaci na tomto webu?

Základní informace o kritériích, které musí splňovat PDF soubor s digitalizovaným číslem časopisu pro to, aby mohl být na tomto webu archivován jsou popsány v odkazu Jak se stát registrovaným uživatelem tohoto webu. Ale protože se na tento web obrací cca 10% zájemců o získání přístupu do archivu, kteří neumí takovýto PDF soubor vytvořit, pokusím se pro ně popsat jak postupuji já. Upozorňuji, že postup, který používám, není jediný správný a že existuje více způsobů – asi rychlejších, komfortnějších i spolehlivějších.

  • Časově nejnáročnější je samotné skenování časopisu. Pokud to váš program umožňuje, skenujte a ukládejte strany časopisu rovnou do formátu PDF.
  • Pokud máte časopis už naskenovaný (zpravidla ve formátu v JPG nebo TIF), zkontrolujte, zda je sken v rozlišení alespoň 300 dpi, zda jsou stránky správně ořezané i orientované.
  • Pojmenujte si stránky jednotlivého čísla tak, aby šly posloupně za sebou – aby byly správně seřazeny. Pak je převeďte do PDF. Já k tomu používám program Zoner Photo Studio 12 (zkušební a plně funkční verze lze stáhnout legálně ze stránek výrobce tohoto českého programu – http://www.zoner.cz/).
  • Nejdříve je ale vhodné skenované stránky upravit – ořezat. Lze ořezat i ve formátu PDF, ale to se mi zdá pracnější – zvláště, je-li potřeba každá stránka ořezat jinak.
  • Když budou všechny stránky správně ořezány, převedete je do souboru PDF. Pochopitelně musí být seřazeny posloupně, aby nebyly stránky na přeskáčku :-) V programu ZONER to jde jednoduše (já používám verzi 12 – u jiné verze to může být trochu jinak): vyberte všechny stránky jednoho čísla (pokud je máte v jednom adresáři, stačí jen Ctrl+A), pak zkrátka Ctrl+P, tlačítko „Další >”, ….. až po „Exportovat do PDF

navod_01

Další postup exportu z JPG do PDF ukazuji na příkladu jiného časopisu – MLADÉHO HLASATELE (to aby vás nemátly jiné obrázky):

1

2

3

4

5

6

  • Do políček v kroku „Parametry exportu do PDF“ vyplňte všechny 4 pole – důležité pro další práci s PDF časopisy (vyhledávání souborů, indexace, …)

navod_02

  • Soubor uložte se správným pojmenováním (!!!) – MLADY_TECHNIK_5.rocnik_(1951-52)_cislo_50 – bez háčků a čárek, s podtržítky místo mezer …. (nazev_rocnik_rok_cislo)

navod_03

navod_04

  • Spustím proces OCR – OK.  Spustí se proces, který trvá i několik minut – podle počtu stran. Tento proces je nezbytný proto aby se mohlo v souboru vyhledávat podle textu  (návod je i na http://www.detske-casopisy.cz/?s=jak+pomoc)

navod_05

  • Při procesu je vidět, která stránka se právě upravuje. Po ukončení akce se na obrazovce vrátí titulní strana.

navod_06

  • Po doběhnutí procesu nezapomeňte soubor ULOŽIT (Ctrl+S) nebo ikonka diskety.
  • Doporučuji provést kontrolu, že proces OCR proběhl v pořádku. Otevřu znovu soubor, do pole pro vyhledávání textu zadejte slovo o kterém bezpečně víte, že se v časopise vyskytuje – potvrďte – na obrazovce by se měla objevit stránka se zadaným slovem (v mém případě „technik“) a zvýrazněným slovem (v mém případě „technika“ – obsahuje slovo „technik“).

navod_07

  • A to je všechno, soubor je nyní vhodný k archivaci na www.detske-casopisy.cz – spolu s ostatními PDF soubory jej můžete poslat k přípravě archivu a nebo je (po přidělení oprávnění i k editaci webu) rovnou na web nahrát a připravit krátký článek s průvodním slovem, zajímavostmi, náhledem titulních stran a odkazy ke stažení.

 

Mějte na paměti, že pro archivování na tomto webu, musí výsledný soubor splňovat tyto kritéria:

  1. uložen ve formátu PDF
  2. pečlivě ořezané všechny strany tak uloženého čísla + dodržená správná orientace všech stran
  3. správně upravený formát PDF – ve kterém lze rozpoznat text  – OCR (důležité pro další badatelskou práci – vyhledávání dle textu, vytvoření rejstříku, …)
  4. uloženo 1 číslo do 1 souboru PDF
  5. maximální velikost jednoho souboru může být 30 MB
  6. při pojmenování souboru dodržený formát NÁZEV_ročník_rok-vydání_číslo (např. ABC_12.rocnik_(1967-68)_cislo 09.pdf) – bez háčků a čárek, namísto mezer podtržítko, …

 

 

6 Responses to Jak vytvořit správný PDF soubor pro archivaci na tomto webu?

  1. Miloš napsal:

    Nevím, kolik dělá chyb Adobe Acrobat Pro, tuším, že stojí cca kolem 10 tisíc! nabízím lepší řešení – AbbyyFineReader 12, umožňuje zonovat – neboli určit pořadí textových sloupců. Tento program stojí tuším cca 3000 Kč! a umožňuje skenování, rozpoznávání z obrázkových formátů, PDF a uložení do různých formátů od txt, docx, rtf, obrázkové PDF nebo PDF s textovou vrstvou pod obrazem stránky nebo nad ní … Další info a pomoc mohu na vyžádání sdělit.

  2. Josef napsal:

    Mám připravené 4. číslo ČINOVNÍKA 1946 k archivaci, – pošlu přes úschovnu na jakou adresu?
    Pepa Karhan

  3. Dazul napsal:

    editor@detske-casopisy.cz – pokud má soubor více než 5 MB, posílejte raději přes uschovna.cz

  4. Standa Galásek napsal:

    Tak nevím, kolik je asi ochotných lidí nějaký chybějící časopis poslat, ale jejich snaha ztroskotá na bezradnosti jak to udělat. Já jsem si již stáhl Zoner Photo Studio X, ale nejsem absolutně schopen naskenované stránky zpracovat dle požadavků. Podle návodu se mi ani nenaskytají možnosti v něm uvedené. Na PC sice pracuji, ale v tomto směru jsem prostě neschopný. Co s tím, vážení? Rád bych přispěl, rád bych u Vás zalistoval, ale nehnu se z místa.

    • Dazul napsal:

      Ten návod jsem skutečně připravoval pro použití v programu ZONER PHOTO STUDIO 12. Ale použít lze mnoho dalších programů (ukládání více stran do PDF umí i nejběžnější textový editor Microsoft Word – před chvílí jsem vyzkoušel na verzi MS Word 2010) – na začátku návodu píšu „Upozorňuji, že postup, který používám, není jediný správný a že existuje více způsobů – asi rychlejších, komfortnějších i spolehlivějších.“

  5. Josef napsal:

    Návod je připravený pro program „Zoner Photo Studio 12“ a ne „Zoner Photo Studio X“. Je pravděpodbné, že to ten novější program neumí. Budete muset stáhnout starší verzi.

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *