Не вдається копіювати текст з PDF в буфер обміну.

1 Тема від Romanvolja 14.08.2020 01:18:04

Romanvolja
Користувач
Поза форумом

Дата реєстрації: 14.11.2015
Повідомлень: 112

Репутація

: 8

Тема: Не вдається копіювати текст з PDF в буфер обміну.

В мене є електронна книга у форматі Pdf

При копіюванні тексту отримую ось це:

▼Прихований текст

Скоріше за все у мене не встановлені шрифти які використані у цьому Pdf-і

Підкажіть програму, якою можна замінити властивості шрифтів у Pdf-і

2 Відповідь від Droid 77 14.08.2020 01:43:28 Востаннє редагувалося Droid 77 (14.08.2020 01:44:31)

Droid 77
Користувач
Поза форумом

Звідки: UA
Дата реєстрації: 17.01.2020
Повідомлень: 1 222

Репутація

: 302

Re: Не вдається копіювати текст з PDF в буфер обміну.

Якщо використовуєте PDF-XChange Viewer, зробіть наступне:

Виділіть текст за допомогою інструмента виділення тексту
Натисніть праву кнопку миші
В меню оберіть «Властивості тексту»
Виберіть «Форматування», в лівому вікні
Біля обраного тексту є плюсик, в правому вікні
Натискаєте на той плюсик, і отримуєте всю інформацію відносно типу шрифта

Подякували: leofun011

3 Відповідь від leofun01 14.08.2020 01:49:41

leofun01
Replace Team
Поза форумом

Дата реєстрації: 15.03.2014
Повідомлень: 3 499

Репутація

: 2782

Re: Не вдається копіювати текст з PDF в буфер обміну.

Копіювати текст з *.pdf в буфер обміну можна тільки у випадках, коли автор серед параметрів зберігання вказав, що дає дозвіл на копіювання в буфер, і не застосував перемішування / фрагментацію.

leofun01 вебсайт

4 Відповідь від P.Y. 14.08.2020 06:28:30

P.Y.
Replace Team
Поза форумом

Дата реєстрації: 19.02.2013
Повідомлень: 7 868

Репутація

: 5132

Re: Не вдається копіювати текст з PDF в буфер обміну.

Romanvolja написав:

В мене є електронна книга у форматі Pdf
При копіюванні тексту отримую ось це:
▼Прихований текст
ˇ??‡??Ł? ?‡? Æ??æ???? ” ‡ ??ŒŁØ ??Ø: 1 ??Ø?? º??Œ? ?Æ??? ??ºŁ????? æŒº??-
Œ?? ?Œ????, ??æ?????? ?????ª?? 15 ı?ŁºŁ? ‡ ????? ? ????? ?? ?‡?.
—????? „ 11
˚?‡?ŒŁ Œ?º????ºŁ ? 10,0 ª.
????? ª‡???Œ? ??‡¿??ª? ? 5,0 ª.
˚??Ł?? ??Øº??æ?Œ? ? 10,0 ª.
˚??‡?? ‡?ÆŁ?? ???????ª? ? 5,0 ª.
Скоріше за все у мене не встановлені шрифти які використані у цьому Pdf-і
Підкажіть програму, якою можна замінити властивості шрифтів у Pdf-і

Коли зіткнувся був зі схожою проблемою, вирішив її в лоб: конвертував pdf у зображення сторінок і прогнав їх через розпізнавач тексту (в моєму випадку, це був tesseract-OCR, але підійде й будь-який інший з підтримкою української мови). Недоліком такого підходу стало те, що куцохвосте Щ (властиве Times New Roman та іншим сучасним шрифтам) при розпізнаванні перетворилось на Ш — це шокання довелося виправляти власноруч, що я так і не зміг зробити в повній мірі.

5 Відповідь від Romanvolja 14.08.2020 08:38:43 Востаннє редагувалося Romanvolja (14.08.2020 08:40:06)

Romanvolja
Користувач
Поза форумом

Дата реєстрації: 14.11.2015
Повідомлень: 112

Репутація

: 8

Re: Не вдається копіювати текст з PDF в буфер обміну.

Я не сподівався що так швидко відгукнетесь. Дякую.

Droid 77 написав:

Якщо використовуєте PDF-XChange Viewer, зробіть наступне:
Виділіть текст за допомогою інструмента виділення тексту
Натисніть праву кнопку миші
В меню оберіть «Властивості тексту»
Виберіть «Форматування», в лівому вікні
Біля обраного тексту є плюсик, в правому вікні
Натискаєте на той плюсик, і отримуєте всю інформацію відносно типу шрифта

Даною програмою користуюся. Тут можна переглянути параметри шрифту але змінити їх неможливо

leofun01 написав:

Копіювати текст з *.pdf в буфер обміну можна тільки у випадках, коли автор серед параметрів зберігання вказав, що дає дозвіл на копіювання в буфер, і не застосував перемішування / фрагментацію.

Переглянув властивості документу все нормально

▼Прихований текст

P.Y. написав:

Коли зіткнувся був зі схожою проблемою, вирішив її в лоб: конвертував pdf у зображення сторінок і прогнав їх через розпізнавач тексту (в моєму випадку, це був tesseract-OCR, але підійде й будь-який інший з підтримкою української мови). Недоліком такого підходу стало те, що куцохвосте Щ (властиве Times New Roman та іншим сучасним шрифтам) при розпізнаванні перетворилось на Ш — це шокання довелося виправляти власноруч, що я так і не зміг зробити в повній мірі.

За tesseract-OCR не чув. Для розпізнання тексту користуюсь ABBYY FineReader. Маю ще PDF-XChange Viewer Pro де можна розпізнавати текст в самому Pdf-і, та її не використовую тому що немає можливості зробити перевірку тексту як у FineReader-і.
Також думав по новому розпізнати текст: - Та стримує те, що Pdf видавничий(макет по якому створювалася паперова книга), а мені не конче хочеться змінювати всі форматування оригіналу

6 Відповідь від putinovich 14.08.2020 10:29:33

putinovich
Заблокований
Поза форумом

Дата реєстрації: 06.08.2020
Повідомлень: 22

Репутація

: 10

Re: Не вдається копіювати текст з PDF в буфер обміну.

Справа не в шрифтах, автор заборонив копiювати текст.

7 Відповідь від Romanvolja 14.08.2020 11:15:09 Востаннє редагувалося Romanvolja (14.08.2020 11:16:05)

Romanvolja
Користувач
Поза форумом

Дата реєстрації: 14.11.2015
Повідомлень: 112

Репутація

: 8

Re: Не вдається копіювати текст з PDF в буфер обміну.

putinovich написав:

Справа не в шрифтах, автор заборонив копiювати текст.

Дозволи всі є, скріншот додаю:

Post's attachments

Дозволи Pdf документу.JPG 83.19 kb, 219 downloads since 2020-08-14

Подякували: leofun011

8 Відповідь від koala 14.08.2020 12:11:54

koala
Лінива тваринка
Поза форумом

Дата реєстрації: 01.05.2013
Повідомлень: 15 820

Репутація

: 13485

Re: Не вдається копіювати текст з PDF в буфер обміну.

Це не про ці дозволи, це про спосіб запису файлу. Якби ці дозволи були виставлені, то ви б мали ввести пароль для якоїсь дії. А тут - беріть розпізнавач.

koala вебсайт

9 Відповідь від Romanvolja 14.08.2020 12:29:26

Romanvolja
Користувач
Поза форумом

Дата реєстрації: 14.11.2015
Повідомлень: 112

Репутація

: 8

Re: Не вдається копіювати текст з PDF в буфер обміну.

koala написав:

А тут - беріть розпізнавач.

Ви маєте на увазі, що потрібно розпізнати текст по новому?? — чи щось інше

10 Відповідь від koala 14.08.2020 13:10:42

koala
Лінива тваринка
Поза форумом

Дата реєстрації: 01.05.2013
Повідомлень: 15 820

Репутація

: 13485

Re: Не вдається копіювати текст з PDF в буфер обміну.

Саме так.

koala вебсайт

11 Відповідь від Droid 77 14.08.2020 23:55:58

Droid 77
Користувач
Поза форумом

Звідки: UA
Дата реєстрації: 17.01.2020
Повідомлень: 1 222

Репутація

: 302

Re: Не вдається копіювати текст з PDF в буфер обміну.

Romanvolja, документ дозволяє виділити частину тексту та скопіювати в буфер?

12 Відповідь від Romanvolja 21.09.2020 13:55:33

Romanvolja
Користувач
Поза форумом

Дата реєстрації: 14.11.2015
Повідомлень: 112

Репутація

: 8

Re: Не вдається копіювати текст з PDF в буфер обміну.

Я той Pdf сконвертував у Djvu, з якого витягнув текстовий шар(у текстовий документ)
Переглянувши цей текстовий шар виявив послідовність, почав міняти шифровані частини тексту на нормальні.
Закину виправлений текстовий шар у Djvu, скопіював виходить нормально.
Почав писати додаток для виправлення тексту на Delphi, та застряг тому прошу вашої допомоги.
Нище даю посилання на цю тему
Обговорення та код є тут

Ласкаво просимо!

Повідомлення: 12

1 Тема від Romanvolja 14.08.2020 01:18:04

Тема: Не вдається копіювати текст з PDF в буфер обміну.

2 Відповідь від Droid 77 14.08.2020 01:43:28 Востаннє редагувалося Droid 77 (14.08.2020 01:44:31)

Re: Не вдається копіювати текст з PDF в буфер обміну.

3 Відповідь від leofun01 14.08.2020 01:49:41

Re: Не вдається копіювати текст з PDF в буфер обміну.

4 Відповідь від P.Y. 14.08.2020 06:28:30

Re: Не вдається копіювати текст з PDF в буфер обміну.

5 Відповідь від Romanvolja 14.08.2020 08:38:43 Востаннє редагувалося Romanvolja (14.08.2020 08:40:06)

Re: Не вдається копіювати текст з PDF в буфер обміну.

6 Відповідь від putinovich 14.08.2020 10:29:33

Re: Не вдається копіювати текст з PDF в буфер обміну.

7 Відповідь від Romanvolja 14.08.2020 11:15:09 Востаннє редагувалося Romanvolja (14.08.2020 11:16:05)

Re: Не вдається копіювати текст з PDF в буфер обміну.

8 Відповідь від koala 14.08.2020 12:11:54

Re: Не вдається копіювати текст з PDF в буфер обміну.

9 Відповідь від Romanvolja 14.08.2020 12:29:26

Re: Не вдається копіювати текст з PDF в буфер обміну.

10 Відповідь від koala 14.08.2020 13:10:42

Re: Не вдається копіювати текст з PDF в буфер обміну.

11 Відповідь від Droid 77 14.08.2020 23:55:58

Re: Не вдається копіювати текст з PDF в буфер обміну.

12 Відповідь від Romanvolja 21.09.2020 13:55:33

Re: Не вдається копіювати текст з PDF в буфер обміну.

Повідомлення: 12

Переглядають тему: 1 гість, 0 користувачів