Домик брачных аферистов
SOS! PDF

СтатьиФорумФотоальбумБиблиотекаЖильцы

➜ главная Домика
Вы не залогинились! Ваш статус в этом ДоМиКе - гость.
В домике онлайн: 1, замечено за сутки: 12

вернуться на 410 стр. списка тем

Выход Здесь  
SOS! PDF
Выход Здесь
Люди скажите как можно конвертировать файл pdf в docx (doc)? Там таблица, текст которой надо редактировать и вносить еще другие данные. В принципе он конвертируется, но только как картинка - редактирование не получается.
Поможите кто чем может!)))
Самурай  
Выход
Самурай
Попробуй ресурс ilovepdf
Выход Здесь  
Самурай,
Выход Здесь
"Извините, но iLovePDF не может извлечь текст из отсканированных PDF-файлов, а только выбранный текст. Чтобы преобразовать отсканированные PDF-файлы в редактируемый документ Office вам нужно выполнить OCR, функция, которую мы предлагаем в плане Premium" (С)

;(
Выход Здесь  
..
Выход Здесь
Распознавание пробовала. Получается только текст)
Люка в БАНе  
я с таблицами не дружу
Люка в БАНе
но, вот что нашла:

бесплатный PDF-конвертер прозволяет преобразовать PDF-документы в DOCX-формат, для дальнейшего редактирования в программах Microsoft Word или OpenOffice Writer. (с)
Ненастенька  
Программа
Ненастенька
Abode Fine Reader. Можно выделять отельные участки документа и задавать распознавание.
Выход Здесь  
))
Выход Здесь
Распознает в текст. А надо текст-таблица+редактирование.
Выход Здесь  
Люка,
Выход Здесь
спасибо)) Но я ж грю - уже это делала))
MR  
А нельзя ли просто скопировать текст из pdf
MR
и вставить в в word? Технически это возможно, но насколько хорошо будет скопирована таблица - вопрос. С простым текстом так можно сделать.
Немка  
Это засада )
Немка
У меня таблицы всегда "плыли" при распознавании. Когда нужно было перенести таблицу, то просто строила новую в Word и копировала текст...

Может быть Org знает какую-нибудь фишку, он, кажется, программист?
Выход Здесь  
Огонёк,
Выход Здесь
можно. 100 страниц!)))

Немка, во-во!)))
Выход Здесь  
Мне
Выход Здесь
тут уже добрые профессиональные люди попытались помочь (денех им побольше и невесту хорошую), но не получилось((
Orgasmatron  
12345
Orgasmatron
Если текст в виде растрового (пиксельного) изображения, то только OCR - при достаточном разрешении картинки.

Засада с pdf такова, что этот формат - подмассив языка печати PostScript (PS), который был создан не для выражения таблиц, но для выражения того, как должны выглядеть объекты на бумаге. Вообще, выражение таблицы в pdf документах возможно, но данные в pdf не всегда выражают (форматируют) именно как таблицы, и потому их невозможно извлечь в виде таблицы. Всё зависит от создателей программы, кторая пишет pdf.
Выход Здесь  
Орг,
Выход Здесь
спасибо.
Но OCR тоже не помог.
Orgasmatron  
12345
Orgasmatron
А просто данные в правильной последовательности есть? Если да, то их можно в "Linux shell" скрипте закатать в html, изобразить в браузере и скопировать как таблицу :).
Аноним [1]  
взять флешку
Аноним
скопировать всё на фешку, сходить в ближайшее фотоателье
там всё сделают как надо
Orgasmatron  
12345
Orgasmatron
Скопируй сюда часть того, что у тебя есть и напиши, какие столбцы и записи хочешь.
Deleted  
ОСR не помог потому,
Deleted
что сканирование, это картинка (а не из текстового редактора), переведённая потом в PDF. Увы и ах. OCR может читать текст с картинками, обычно допуская много ошибок, но с картинками, на буквы не похожими, он работать не может.
Поэтому только ручное форматирование до тех пор, пока искусственный интеллект не научится решать подобные проблемы.
Выход Здесь  
))
Выход Здесь
"... можно в "Linux shell" скрипте закатать в html, изобразить в браузере и скопировать как таблицу :)." (с)

В обмороке)))
Val  
Выход здесь
Val
На сегодняшний момент с этой задачей нормально не может справится ни одна программа.
Более менее корректно может это делать Abode Fine Reader(последняя версия 14), но она платная. Но даже не в этом дело. Чтобы корректно распознавать, нужна хорошего качества картинка и желательно, чтобы таблица располагалась без всяких перекосов на листе, что не всегда бывает возможно достичь в документе.

В общем с одним документом может получится более менее, а с другим косяк на косяке. Да и программа старается применить всякие табуляции и поправки, что делает тяжёлым процесс последующего редактирования. Всё скачет вкривь и вкось.
Как говорится, быстрее создать таблицу с нуля, чем редактировать полученное распознавание. В общем фигня полная.. :(
Val  
Хотя...
Val
Был не совсем прав. Сейчас конвертировал таблицу в pdf и на сайте (ссылку кину в личку) перевёл обратно в doc. Всё корректно получилось. Как и говорил, нужна чёткая картинка.
Orgasmatron  
12345
Orgasmatron
"В обмороке)))" -

из простых данных вроде

а б в г д
е ё ж з и

можно автоматически составить таблицу, но когда много слов и границы ячеек определены достаточно сложно - проще переписать вручную.
Nika...  
ничо не поняла
Nika...
Но у меня просто стоят две сканерные программы
любая переводит в куда надо
контролировать приходится, но количество ошибок действительно зависит от качества картинки

вернуться на 410 стр. списка тем

☍ Поделиться

Тук-тук-тук! Кто в домике живет? Наверное, мышка-норушка, как всегда... Ну там еще зайчик-побегайчик, лисичка-сестричка... А вас тама, похоже, нет!

Почему? Да потому что на Мейби нужно сначала зарегистрироваться, а потом подать заявку на прописку в ДоМиКе.