1

Тема: djvu, epub, pdf ?

прошу допомоги по темі створення електронної версії книг

хочу оцифрувати декілька невеличких книг українською
думаю, що жодних претензій ні у кого не буде :)

одну відсканував, іншу перефоткав, що далі робити?)

читав, що epub -- це zip архів з html сторінками,
а pdf створював лише експортом з open office document :)

з abbyy finereader колись на вінді трішки працював...
доводилось багато криво-розпізнаного ручками поправляти

нявчіть хтось мене електронні книги створювати?
розкажіть хто-чим-як електронні книги створює
будь-ласкаа) і я вам також у пригоді стану :)

Подякували: leofun011

2

Re: djvu, epub, pdf ?

DjVu. Або FB2.

3 Востаннє редагувалося reverse2500 (18.10.2019 09:50:12)

Re: djvu, epub, pdf ?

fb2 автор уже давно не випускає нові версії, ще з 2008 року, читав давно, що були якісь проблеми з відображенням, але не знали що робити, так що тут pdf, якщо формули то вибирають LateX

Подякували: 221VOLT1

4

Re: djvu, epub, pdf ?

javascriptIsLife написав:

DjVu. Або FB2.

шо "формат дежавю" ?

ви питання взагалі читали?

маю скан, як мені книгу зробити?
за допомогою яких програм, чи якими способами?

:D дякую вам за вашу допомогу, що би я без вас робив))

5

Re: djvu, epub, pdf ?

PDF Manager наче вміє таке робити (під віндою)
https://sourceforge.net/projects/pdfmanager/

Подякували: 221VOLT1

6 Востаннє редагувалося ReAl (19.10.2019 20:45:45)

Re: djvu, epub, pdf ?

Якщо на книжку збіг термін дії авторських прав (у мене в черзі дещо видання 1918-1919 років, Вінниця, Полтава, авторам, як от Олелькові Островському, навіть до Голодомору дожити не дали), то можна (і треба!) просто завантажити архів із зображеннями на archive.org. Воно перепакує, прожене через OCR і вийде щось таке BibleOhienko, де є купа різних форматів вулючно з djvu з підкладеним розпізнаним текстом.
Звісно, зі сканами краще повозитися, щоб була максимальна якість.

Інакше можна спробувати image magick, його convert вміє збирати в pdf (хоча у свіжих убунтах чомусь комизиться, просить явно дозволити).
Цей makefile (у нас форум програмістів чи хто?) розрахований на добре вирівняні і контрастовані скани нот, які можна перегнати в 1-бітове представлення, після чого стиснути факсовим стисканням, це дає дуже малий розмір pdf.

.SILENT :

TARGET := result-make.pdf
AREA := 70mb
TMPDIR := ./tmp
MONITOR := # -monitor
INFO := # echo AREA = $(AREA) ; convert --version ; uname -a

all : begin $(TARGET) printok

begin: directories
    echo ======== Beginning of $(TARGET) processing. ; $(INFO)

printok:  $(TARGET)
    echo ======== All OK: ; ls -l $<


SRC := $(wildcard *.jpg)
TMPTIFF := $(addprefix $(TMPDIR)/,$(SRC:.jpg=.tiff))

result-make.pdf : $(TMPTIFF)
    echo ====  Creating $@
    convert $^ $@ 

$(TMPDIR)/%.tiff : %.jpg
    convert -limit area $(AREA) $(MONITOR) $< -resize 1728x1728 -monochrome -compress fax $@

directories:
    if [ ! -d $(TMPDIR) ] ; then \
        echo ====  Creating working directories ; \
        mkdir -p $(TMPDIR) ; \
    fi

clean:
    echo ====  Erasing working directories
    -rm -f $(TMPTIFF)

Для попередньої обробки сканів є unpaper (воно десь на гітхабі чи ще десь лежить, я 5 років тому збирав сам, бо в убунті була дуже стара версія, повільна і тупувата). Саме ним я перед завантаженням на archive.org ділив розвороти Біблії Огієнка на окремі сторінки, чистив і вирівнював, контрастував, ...
Але там треба почаклувати з параметрами, хоча часу зекономило немало, вручну то було б важко робити. До нього наче є якась оболонка, як ото doxywizard для doxygena, але я без неї обійшовся.

Подякували: leofun01, 221VOLT2

7

Re: djvu, epub, pdf ?

p.s. Розпізнавати пробував tesseract-ом, так, з цікавості.
Результат гірший, ніж від abbyy-як-там-його на archive.org, але помилки в інших місцях (у того теж є).
Тобто за можливості використати обидва можна потім змержити результати :-)

Подякували: 221VOLT1

8 Востаннє редагувалося 221VOLT (20.10.2019 03:44:09)

Re: djvu, epub, pdf ?

Alexv написав:

PDF Manager наче вміє таке робити (під віндою)
https://sourceforge.net/projects/pdfmanager/

дякую)
правда, у мене linux ( (l)ubuntu )


-------------

ого !
не знав, що image magick вміє в pdf
цікаво! дякую!


mr. ReAl , ще маю трішки дотичне запитання про вікіпедію --
допустимо, я хотів би доповнити деякі сторінки,
для прикладу, порівняйте сторінки
про таку чудову мову програмування, як erlang --
українською https://uk.wikipedia.org/wiki/Erlang
російською https://ru.wikipedia.org/wiki/Erlang

власне, запитання полягає в наступному --
як правильно пропонувати доповнення, щоб їх прийняли, а не відкинули?;
чи є якісь гайди по темі тру-стилю наповнювання вікі, список рекомендацій etc ?

дякую

9

Re: djvu, epub, pdf ?

221VOLT написав:

маю трішки дотичне запитання про вікіпедію --
допустимо, я хотів би доповнити деякі сторінки,
для прикладу, порівняйте сторінки
про таку чудову мову програмування, як erlang --
українською https://uk.wikipedia.org/wiki/Erlang
російською https://ru.wikipedia.org/wiki/Erlang

власне, запитання полягає в наступному --
як правильно пропонувати доповнення, щоб їх прийняли, а не відкинули?;
чи є якісь гайди по темі тру-стилю наповнювання вікі, список рекомендацій etc ?

дякую

Я колись писав гайд: https://bunyk.wordpress.com/2016/05/02/ … wikipedia/ 

А що були прецеденти що відкинули? Додав Erlang собі в список спостереження, буду стежити щоб лишнього не відкинули.

Ну й ще корисно зареєструватись, якось дискутувати з кимось зареєстрованим є більше бажання ніж пояснювати щось якомусь 217.24.162.210. Внесок користувачів типу 217.24.162.210 частіше вікидають без пояснень.

Подякували: 221VOLT, leofun01, ReAl3

10

Re: djvu, epub, pdf ?

bunyk, дякую! )

11

Re: djvu, epub, pdf ?

По-моєму, вікіпедійні редагування (навіть незареєстрованих користувачів) дуже рідко відкочують без вагомих причин. Це треба або вандалити, або нарватись на війну редагувань, мабуть. Якщо внесок користувача виглядає як корисний, ніхто його відкочувати не буде. Що більш імовірно — редагування висітимуть з непідтвердженим статусом невідомо-скільки тижнів, місяців і років (ну але, здається, непідтверджені редагування в укрвікі все одно за замовчуванням відображаються). Також є деяка ймовірність видалення всієї статті (якщо в ній замало джерел, або з копірастичних міркувань)...

Подякували: leofun01, ReAl, ostap34PHP, 221VOLT4

12 Востаннє редагувалося ReAl (22.10.2019 22:55:00)

Re: djvu, epub, pdf ?

Стаття bunyk достатньо повна, я б хіба розгорнув «спиратись на незалежні від вас джерела»¹ у «не можна написати „Erlang крутішиq за всі мови“ просто тому, що я так вважаю, але можна написати „такий-то і такий-то вважають, що…“, де обидва такі-то не співак і художник, а відомі авторитети у галузі програмування».
І підтримую P.Y. — щоб відкинули, треба добре накосячити або ж емоційно влізти у якусь статтю, яку хтось такий самий емоційний бачить геть іншою, але то вже суперечки на СО і т.д.

Непідтверджену версію не видно відразу (тобто без додаткового кліка у лінк на найсвіжішу непідтверджену) лише 1) для «стабілізованих» статей (тобто тих, які, наприклад, часто вандалять) і 2) незалогіненим користувачам. В усіх інших випадках видно найсвіжішу версію і є лінк на останю перевірену (хоча, здається, залогінений може у себе в налаштуваннях вказати, яку версію він хоче бачити).
__________
¹ Загалом аж настільки категоричним я б не був, залежні, але авторитетні джерела цілком можна допустити, якщо, наприклад, книжка, співупорядником якої я був, мала за наукового редактора знану в галузі особу і її рекомендувала до друку вчена рада профільного інституту НАНУ, то чом би на неї не спертися мені, невже я маю когось просити додати інформацію з посиланням на книжку?

Подякували: 221VOLT1

13 Востаннє редагувалося 221VOLT (23.10.2019 02:04:31)

Re: djvu, epub, pdf ?

я зараз точно не пригадаю, де і коли зустрічав таке, що хтось дуже бідкався, що витратив купу часу і зусиль, щоб щось дописати, а то все знесли

тому і уточнив :)

14

Re: djvu, epub, pdf ?

Ой, так, люди часто ниють, але це коли вони занадто "кваліфіковані", "компетентні" і забагато "знають". Еталонний приклад якогось "вченого; практика; консультанта, учителя, блогера", якому користувач Bunyk (також відомий як Богдан Бенюк, Piramidion і т.п) заважає нести у вікіпедію істинне знання типу такого: "Це дуже засмутило, адже Google+ у комплексі супутніх засобів багатьом користувачам подобається значно більше ніж Facebook, Twitter, ін."
https://dss-bi.blogspot.com/2019/02/blog-post_20.html
https://dss-bi.blogspot.com/2019/03/blog-post.html

Подякували: 221VOLT1

15

Re: djvu, epub, pdf ?

bunyk написав:

Ой, так, люди часто ниють, але це коли вони занадто "кваліфіковані", "компетентні" і забагато "знають". Еталонний приклад якогось "вченого; практика; консультанта, учителя, блогера", якому користувач Bunyk (також відомий як Богдан Бенюк, Piramidion і т.п) заважає нести у вікіпедію істинне знання типу такого: "Це дуже засмутило, адже Google+ у комплексі супутніх засобів багатьом користувачам подобається значно більше ніж Facebook, Twitter, ін."
https://dss-bi.blogspot.com/2019/02/blog-post_20.html
https://dss-bi.blogspot.com/2019/03/blog-post.html

ой, це просто смішно
там людина елементарно не читає, що пише:

Виведені у цій публікації недоліки - не для приниження чиєїсь гідності, а для покращання Вікіпедії

...

(адмінісратор чи патрульний)

...

на основі матеріалів, що переведені з іноземних західних мов

...

Це вийшло не у всіх спеціалістів з технічних дисциплін (не філологи), проте

...

для самореклами і вікі-рейтингу намагаються "відмітися" у максимальній кількості

...

виглядає, наче дитині варто подарувати букварик
або ж, це дорослий, з шизою --

Є випадки, коли кластери вікі-ігроманів редагували тексти і посилання у статтях більше ніж 8 років, проте жоден з них не помічав елементарні принципові семантичні помилки першого автора (власника статті) та інших. Для прикладу, замість "Business Intelligence" більше ніж 8 років (2011-2018 р.р.) писали "Бізнесова аналітика", з 2019 року - "Бізнес-інтелект"; кластер не помічав використання плагіату, посилання на статті фіктивного  автора

чужі піщинки бачить, а власні бревна ?  :D
зливайте воду  *FACEPALM*