Maxim Bugakov (palachmb) wrote,
Maxim Bugakov
palachmb

Конвертируем JPG в PDF

Потребовалось выложить на сайт кучу сканированной периодики. Периодика отсканирована постранично в формате jpg и лежит с отдельных папках с номером выпуска.
Потребуются простые скрипты и ImageMagik.

Структура папок следующая - Год / номер выпуска / постранично отсканированные файлы jpg.

Для начала меня не устроило то, что в имени папок присутствует символ "№", поэтому избавляемся от этих спецсимволов:

for i in * ; do mv "$i" `echo $i | cut -c 4-` ; done

Затем скриптом пробегаемся по папкам и создаем для каждого каждой папки свой pdf. Заоодно отконвертируем в оттенки серого и снизим разрешение (в оригинале было что-то около 6000x5500). Результирующие файлы сложим в отдельную папку ~/Journal/1990/

for i in `find . -type d`; do convert -colorspace gray -scale 3000x3000 $i/*jpg ~/Journal/1990/$i.pdf; done

При желании файлы можно переименовать во что-то более удобочитаемое

for i in *.pdf; do mv $i 'sovetskoe-priangarie-'${i%.pdf}'-1990.pdf'; done


Но я пошел дальше. Газета выходила три раза в неделю. Это почти 150 номеров в год - что весьма неприятно вносить врукопашную на сайт, Тем более по необходимо выложить документы за прошедших 28 лет. Поэтому, пока переименовываем - формируем текстовый файлик с html-кодом для странички:



На месте уже можно поправить по вкусу/цвету/запаху.

Результат: http://kezhemka.ru/?page_id=8065
Tags: linux
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 0 comments