PRAVIDLA – NUTNO DODRŽET 10 BODŮ

Při skenování a převodu do PDF dodrž důsledně VŠECHNA tato pravidla (vzorové soubory si můžeš stáhnout na konci této stránky):

  1. Naskenuj časopisy na jedno z rozlišení 300 (obvyklé) – 400 (jemné detaily, malé písmo)  DPI do formátu TIFF (bez komprese) nebo JPG (nastaveného na 90% /“nejvyšší“ kvalitu, kde slovo nejvyšší bývá použito pro rozsah). Bude následovat vyrovnání textu (natočením),  ořez, sloučení (u dvoustranných vystřihovánek) nebo rozdělení stran (u stran naskenovaných na velkém skeneru A3 nebo A2 do jednoho obrazu), sloučení do PDF (obyč., nearchivního, ale nastaveného na režim maximální kvality bez ztrátové komprimace obrázků), při tom  nebo pak vytvoření OCR vrstvy zpravidla v českém (ale ne vždy!) jazyce a odeslání redakci.  Samotné soubory skenů  s výjimkou náhledu titulní stránky, jehož parametry popisujeme níže, neposílej, nemáme je dosud kde skladovat.
  2. Dodrž  původní orientaci všech stran vázaných v čísle (originální natočení jako v časopise, případně tam natočené popisy, například v tabulkách, se snadno přetočí v prohlížeči pdf, ale nechceme, aby stránky skákaly svým vzhledem mezi „nastojato“ a „naležato“ – doporučujeme vypnout funkci automatické rotace, pokud ji váš pdf editor obsahuje.)
  3. Ořež pečlivě všechny strany – každou stranu samostatně – (návod jak ořezat přesahující okraje)
  4. Dodržuj barevnost  zestárlého originálu (před nadměrným „vybělením“ preferujeme zachovat „historickou patinu“) podobnou náhledům obrázků na našem www, barevné obrázky skenujeme vždy jako barevné, šedou škálu (staré časopisy, které neměly jinou barevnost než vzniklou z černé tiskové barvy) jako šedou. NIKDY jako černobílé (bitonální).
  5. Kontroluj správné pořadí  a úplnost stran (to jest, že jsou všechny, včetně příloh, které bývají obvykle vytrhány)!!!
  6. Výsledné číslo časopisu (nebo ekvivalent, pokud půjde třeba o rodokaps) ukládej ve formátu PDF s textovou vrstvou, tedy vytvoř PDF, u kterého byla aplikována funkce  rozpoznání textu pomocí OCR tak, aby bylo možno následně vyhledávat v rozpoznaném textu (je to důležité pro další badatelskou práci – vyhledávání dle textu, vytvoření rejstříku, …) !!!!!  (návod jak vyrobit PDF s OCR)
  7. Ukládej 1 číslo do 1 souboru
  8. Maximální velikost jednoho souboru – běžného čísla časopisu –  může být cca 50 MB – například 32 stránkový OHNÍČEK lze digitalizovat do PDF o velikosti cca 3 – 12  MB dle nastavené kvality tvorby PDF (to souvisí s nastavením kompresí a doporučujeme řídit se Vašimi znalostmi produktu, který používáte, u Adobe Acrobatu hodnota nabízené ikonky nejlepší kvalita nebo vlastní profil, u Abbyy Fine Readeru  spíše vypínejte MRC kompresi a ponechávejte volby nejlepší kvality obrazu, textová vrstva vždy pod obrazovou!, použijete-li Teseract nebo podobný opensource, zkontrolujte, že pracuje kvalitně, mívá až o desítky procent horší výsledky než Abbyy FR na složitých strukturách a atypických písmech)
  9. Pojmenování souboru musí odpovídat formátu NÁZEV_ročník_(rok-vydání|roky-vydání)_číslo (např. OHNICEK_01.rocnik_(1950-51)_cislo_01.pdf) – bez háčků a čárek, namísto mezery podtržítko, při číslovaní 1-9 používat pevný počet dvou míst „0“ např. 01; 02;03… Velmi zřídka kdy pokračuje číslování čísel průběžně, nehledě na ukončení ročníku. Pokud takový případ zppracováváte, lze pracovat s pevným počtem tří míst. Více jak 999  průběžně vydaných čísel u dětských časopisů neevidujeme.
  10. Společně s PDF souborem daného časopisu vytvoř a pošli náhled titulní stránky (ve formátu JPG) pojmenovaný až na příponu stejně jako číslo v pdf (tedy např.  OHNICEK_26.rocnik_(1975-76)_cislo_01. jpg). V uvedeném příkladu OHNÍČKU to bude velikost po změnšení 800 x 540 bodů, v případě ABC velikost 800 x 1140 bodů, … (s kvalitou JPG 85%  nebo původního JPG – náhled titulní stránky by nicméně neměl být větší než 100 kB). Silně jsou v příkladu vyznačeny rozměry šířky, výška se dopočítá zpravidla automaticky. Doporučujeme uložit jako progresivní jpg (u pomalejších připojení k internetu už ze zhruba 10 % staženého souboru zobrazí náhled a postupně jej zlepšuje, takže čtenář nevidí dlouho jen prázdné místo.).

Něco málo navíc k těmto informacím si můžeš přečíst >>>>

 

Časopis ke stažení – náhled titulní strany + časopis v PDF –  v jaké formě má být digitaliztovaný časopis zasílán (zde splněno všech 10 bodů, vyjma bodu 3 – správné natočení stran – u poslední strany to není správně).