IPB

Здравствуйте, гость ( Вход | Регистрация )

 
Reply to this topicStart new topic
> Из pdf в doc с возможностью копирования текста
Sar
сообщение 02 Sep 2013, 19:30
Сообщение #1

Immortal
Сообщений: 1 584
Спасибо сказали: 1556 раз




Задача такая: необходимо повырезать куски текста из формата pdf в doc, обычные конвертировщики меняют только формат и перенося текст из pdf в doc получаются картинки на всю страницу и вырезать из них текст не представляется возможным. Как можно это решить?


--------------------
Всяк инквизитор у них Великий,
Каждый себя Торквемадой мнит,
В фирме «Серебряный Молот»
Работают шляпы одни.
Go to the top of the pageAdd Nick
 
+Quote Post
tolich
сообщение 02 Sep 2013, 20:19 (Сообщение отредактировал tolich - 02 Sep 2013, 20:20)
Сообщение #2

😸🧡✊✌️
Сообщений: 16 483
Спасибо сказали: 3386 раз




Если pdf содержит картинки, то конвертер тебе даст только картинки. Тут нужно распознавание текста.


--------------------
Я слежу за тобой!
* tolic.narod.ru

Цитата
Всегда приятно осознавать, что кто-то делает что-то хуже, чем делал бы ты, если бы умел.
Борис "Бонус" Репетур, "От винта!", выпуск 38.


Спасибо сказали:
Go to the top of the pageAdd Nick
 
+Quote Post
Sar
сообщение 02 Sep 2013, 21:25
Сообщение #3

Immortal
Сообщений: 1 584
Спасибо сказали: 1556 раз




Спасибо, я уже нашел решение!


--------------------
Всяк инквизитор у них Великий,
Каждый себя Торквемадой мнит,
В фирме «Серебряный Молот»
Работают шляпы одни.
Go to the top of the pageAdd Nick
 
+Quote Post
izrukvruki
сообщение 03 Sep 2013, 07:36
Сообщение #4

Князь Бореи
Сообщений: 5 171
Спасибо сказали: 1349 раз




abbyy pdf transformer


Спасибо сказали:
Go to the top of the pageAdd Nick
 
+Quote Post
Marmot
сообщение 05 Sep 2013, 22:48
Сообщение #5

чужой
Сообщений: 270
Спасибо сказали: 1319 раз




Цитата(Saruman @ 02 Sep 2013, 18:30) *
необходимо повырезать куски текста из формата pdf в doc

В современных просмотрщиках pdf есть режим выделения текста. Выделяем фрагмент и, как обычно, помещаем в буфер обмена (Ctrl+C, или через меню), а оттуда уже - в Word. Я так делал. Только есть одно "но": фрагмент должен быть небольшим, иначе ничего не получится (не знаю, почему).


Спасибо сказали:
Go to the top of the pageAdd Nick
 
+Quote Post
izrukvruki
сообщение 06 Sep 2013, 07:23
Сообщение #6

Князь Бореи
Сообщений: 5 171
Спасибо сказали: 1349 раз




а если pdf это набор отсканированных книжных страниц, то там нет никакого текста для копирования... распознавание тогда необходимо


Спасибо сказали:
Go to the top of the pageAdd Nick
 
+Quote Post
Shaidar Haran
сообщение 03 Dec 2013, 14:05
Сообщение #7

Оранжевый Канцлер Тьмы
Сообщений: 2 344
Спасибо сказали: 618 раз




>>режим выделения текста
Зависит от того, как именно сделан PDF. Если там текст картинкой - ничего у тебя не выделится и не скопируется.
А вот если это именно конвертированный .doc или, скажем, .dwg - там тебе и разделение на слои будет с возможностью их переключения, и копирование объектов, и прочие плюшки.

Не надо считать, что .pdf - это просто еще один формат для растровых изображений.


--------------------
I am the fury in your eyes. I am reason, I am vice.
Careful what you say
You may regret it,
Careful what you wish
You just might get it.
Go to the top of the pageAdd Nick
 
+Quote Post

Reply to this topicStart new topic
1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)
Пользователей: 0

 



Текстовая версия Сейчас: 27 November 2025 - 06:33
Copyright by Алексей Крючков
Strategy Gamez by GrayMage
Programming by Degtyarev Dmitry
  Яндекс.Метрика