S čím je potřeba pomoc?

V současné době mám z různých zdrojů k dispozici relativně dost skenovaných časopisů – MLADÝ HLASATEL 1938-41,  VPŘED 1945-1951, PIONÝR 1955-1981, JUNÁK 1945-48, ABC 1957-1962, … Bohužel jsou všechny strany skenovány jednotlivě  a uloženy zpravidla do formátu JPG. To neumožňuje pohodlné stahovaní a prohlížení celých čísel, které mají zpravidla několik desítek stran ani vyhledávání v časopisech podle textu.

Aktuálně tedy řeším problém jak tyto skeny převést do PDF a spojit jednotlivé strany daného čísla do jednoho souboru (což není velký problém) a hlavně jak udělat PDF soubor „čitelným“ aby v něm šlo vyhledávat podle textu. Odzkoušený postup v ADOBE ACROBAT 9  PRO verze 9.2.0 (otevřený PDF soubor – Dokument – Rozpoznávání textu OCR – Rozpoznat text s použitím OCR, pak soubor uložit) nefunguje u naskenovaných souborů spolehlivě. I v takových PDF souborech není vyhledávání příliš spolehlivé.

Hledám automatický způsob pro převod JPG do PDF ve které lze relativně spolehlivě vyhleávat dle textu!

A pokud se někomu podaří najít a odzkoušet dávkové zpracování JPG souborů do potřebého formátu PDF, budu moc rád pokud se o svoji zkušenost podělí – neskutečně tím urychlí práci na tomto projektu : -)

Všechny ostatní, kteří jsou ochotni se zapojit do pomoci při „digitalizaci“ starých časopisů, moc prosím, aby při skenování všech dalšíc časopisů dodrželi VŠECHNY tyto pravidla:

  • skenuj časopisy do formátu PDF
  • ořež pečlivě všechny strany tak + dodrž správnou orientaci všech stran + správné pořadí i úplnost stran !!! (návod jak ořezat přesahující okraje)
  • ukládej v takovém formátu PDF, ve kterém lze rozpoznat text  – OCR (důležité pro další badatelskou práci – vyhledávání dle textu, vytvoření rejstříku, …) !!!!!  (návod jak vyrobit PDF s OCR)
  • Ukládej 1 číslo do 1 souboru
  • Maximální velikost jednoho souboru může být 30 MB – například 32 stránkový OHNÍČEK lze digitalizovat do PDF o velikosti cca 3 MB
  • Pojmenování souboru musí odpovídat formátu NÁZEV_ročník_rok-vydání_číslo (např. OHNICEK_26.rocnik_(1975-76)_cislo_01.pdf) – bez háčků a čárek, namísto mezer podtržítko, …
  • Společně s PDF souborem daného časopisu pošli i náhled titulní stránky (ve formátu JPG) pojmenované stejně (tedy např.  OHNICEK_26.rocnik_(1975-76)_cislo_01. jpg) – v případě tohoto OHNÍČKU velikost 800 x 540 DPI, v případě ABC velikost 800 x  1140 DPI, …

 

 

11 Responses to S čím je potřeba pomoc?

  1. Milan Vinduška napsal:

    Vážený příteli
    Jsem ročník 1943. Byl jsem vždy člověk, který měl zájem něco si přečíst a kterému bylo přečtené(jinak určené k likvidaci) líto vyhodit.Tak se ze mně stal jakýsi příležitostný uchovávatel přečtených časopisů .S počítačem si sice rozumím tak v možnostech mého věku, ale snažím se. Nevím jak dlouhou nit mi sudičky při narození nastřihly, ale doufám, že mi ještě nějaká zbývá.Pomohl bych této komunitě i něco z vlastních zásob naskenovat(zatím nevím co je hotové a co se najde u mně). Mám spíš technický problém. Čím. Mám sice starší scener, ale to je vše pomalé.V poslední době by byl pro amatéry vhodný výrobek co vytvořil na internetu Daniel Reetz(foto) nebo japonský SV 600(scen), ten převádí i do PDF. Máte někdo s těmito výrobky skušenost.K dosažení jsem nepravidelně, ale na případný dotaz odpovím
    S pozdravem

    • Milan Šafařík napsal:

      Vážení. Váš přístup k starým dětským časopisům považuji za velmi sobecký. Narodil jsem se na samém počátku roku 1930. Ve stáři mi zbyly jen vzpomínky na mladá léta. Hlavně na dětské časopisy. A míval jsem jich požehnaně. Vzpomínám na „Srdíčko, Punťu, Kulíška, Slovíčko“. Později samozřejmě „Mladý hlasatel“. Vzpomínám na maminku, když jsem byl v zimě nemocný a ona mi Srdíčko, Slovíčko, Punťu četla. Dobře jsem vše opatroval. Bohužel při náhlém útěku ze Slovenska v roku 1939 jsme zachránili je dva kufry nejpotřebnějších věcí. Babička, která tam po válce ještě jela, mi přivezla jen torzo slovíčka. Něco jsem získal v antikvariátech. Je to ale žalostně málo. I když nabízím finanční přispění, ozvou se jen antikváři nebo sběratelé a ti chtějí nekřesťanské částky. Za knížku 18 stránek „Náš svět“ z roku 1934 chtějí 70 tisíc!!!. Děkuji z celého srdce těm, kteří mi umožnily něco stáhnou z internetu. Milan Š.

  2. Karel rychlý napsal:

    Máš pravdu.

  3. Dazul napsal:

    Není účelem tohoto webu porušovat zákon. I z tohoto důvodu nebude úplný archiv starých dětských časopisů na tomto webu patrně nikdy volně přístupný.

  4. Bárta napsal:

    Vážení. Až se vám podaří archív s časopisy pořádně nafouknout, za přispění naivních čtenářů, vyděláte těžké prachy. Jiný smysl by to totiž nemělo.

    • Dazul napsal:

      Pokud by se nám podařilo na archivu LEGÁLNĚ (!!!)vydělat „těžké prachy“ bylo by to jistě příjemné pro všechny zúčastněné. A protože to nikdo z nás neumí, rádi si necháme poradit jak na to aniž bychom porušili (například) autorský zákon. Existuje-li taková možnost, sem s ní – budeme nad ní určitě přemýšlet. Třeba by to bylo řešení pro ty, kteří nechtějí, nemohou nebo neumí splnit podmínku pro účast na tomto projektu (digitalizace starého dětského časopisu podle všech 7 pravidel – http://www.detske-casopisy.cz/jak-se-stat-registrovanym-uzivatelem-tohoto-webu/).

  5. damro napsal:

    Ne každý touží jenom po zisku.Zachovat pro budoucí generaci také něco ze života předchozí generace je záslužnou věcí. A nejlépe se vždy zachovává to , co si pamatujeme ze svého mládí , a člověk se k tomu rád vrací. Ale věřím, že ne každý si rád četl a nebo i jen tak listoval nějakým časopisem. A zejména dnes kdy jsou dokonce tací, co nečtou vůbec. To je mnohdy jejich smysl života. Ale „blázni“ co se věnují tomuto koníčku, mají svůj smysl tohoto konání někde jinde. A to nemohou někteří zřejmě zkousnout.

  6. Jiří Červený napsal:

    Dobrý den,

    gratuluji vám k tomuto jistě záslužnému počinu!
    Jen o jedno bych vás požádal. Dbejte prosím na češtinu! Nadpisy jako Archivované čísla a některé další, to úplně tahá za uši a bije do očí!

    S pozdravem,
    Jirka

  7. Dazul napsal:

    Jsem si vědom, že čeština je jedno ze slabých míst tohoto webu :-( Protože už nestíhám připravovat článeček na každý den, píšu je často v časovém presu a zpravidla si jej ani nestíhám po sobě přečíst. Je to špatně, ale momentálně jsem upřednostnil existenci článečku před dobrou češtinou. To je ta nevýhoda, když web tvoří pouze jeden člověk a nemá k sobě nikoho, kdo by dělal druhé oči atd.
    Ale začnu se na správnou češtinu víc zaměřovat. Už kvůli sobě :-)
    Budu rád, když mne kdokoliv na chyby, překlepy i nesprávné formulace upozorní – rád je pak opravím.

  8. Roman Brom napsal:

    Dobrý den, prosím o informace. Mám kompletní 32. ročník časopisu JUNÁK, včetně č. 28,29-30, 31-32 a závěrečného. Rád bych věděl, zda se mám naučit výrobní postup převodu a tím se účastnit krásného projektu, nebo už to někdo řeší. Jiné časopisy už nemám, stěhování, malé děti …
    Mnoho zdaru.

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *