Домик брачных аферистов
SOS! PDF
➜ главная Домика
Вы не залогинились! Ваш статус в этом ДоМиКе - гость.
В домике онлайн: 0, замечено за сутки: 11
вернуться на 410 стр. списка тем
Если текст в виде растрового (пиксельного) изображения, то только OCR - при достаточном разрешении картинки.
Засада с pdf такова, что этот формат - подмассив языка печати PostScript (PS), который был создан не для выражения таблиц, но для выражения того, как должны выглядеть объекты на бумаге. Вообще, выражение таблицы в pdf документах возможно, но данные в pdf не всегда выражают (форматируют) именно как таблицы, и потому их невозможно извлечь в виде таблицы. Всё зависит от создателей программы, кторая пишет pdf.
Засада с pdf такова, что этот формат - подмассив языка печати PostScript (PS), который был создан не для выражения таблиц, но для выражения того, как должны выглядеть объекты на бумаге. Вообще, выражение таблицы в pdf документах возможно, но данные в pdf не всегда выражают (форматируют) именно как таблицы, и потому их невозможно извлечь в виде таблицы. Всё зависит от создателей программы, кторая пишет pdf.
Аноним [1]
взять флешку
взять флешку

там всё сделают как надо
что сканирование, это картинка (а не из текстового редактора), переведённая потом в PDF. Увы и ах. OCR может читать текст с картинками, обычно допуская много ошибок, но с картинками, на буквы не похожими, он работать не может.
Поэтому только ручное форматирование до тех пор, пока искусственный интеллект не научится решать подобные проблемы.
Поэтому только ручное форматирование до тех пор, пока искусственный интеллект не научится решать подобные проблемы.
На сегодняшний момент с этой задачей нормально не может справится ни одна программа.
Более менее корректно может это делать Abode Fine Reader(последняя версия 14), но она платная. Но даже не в этом дело. Чтобы корректно распознавать, нужна хорошего качества картинка и желательно, чтобы таблица располагалась без всяких перекосов на листе, что не всегда бывает возможно достичь в документе.
В общем с одним документом может получится более менее, а с другим косяк на косяке. Да и программа старается применить всякие табуляции и поправки, что делает тяжёлым процесс последующего редактирования. Всё скачет вкривь и вкось.
Как говорится, быстрее создать таблицу с нуля, чем редактировать полученное распознавание. В общем фигня полная.. :(
Более менее корректно может это делать Abode Fine Reader(последняя версия 14), но она платная. Но даже не в этом дело. Чтобы корректно распознавать, нужна хорошего качества картинка и желательно, чтобы таблица располагалась без всяких перекосов на листе, что не всегда бывает возможно достичь в документе.
В общем с одним документом может получится более менее, а с другим косяк на косяке. Да и программа старается применить всякие табуляции и поправки, что делает тяжёлым процесс последующего редактирования. Всё скачет вкривь и вкось.
Как говорится, быстрее создать таблицу с нуля, чем редактировать полученное распознавание. В общем фигня полная.. :(
Тук-тук-тук! Кто в домике живет? Наверное, мышка-норушка, как всегда... Ну там еще зайчик-побегайчик, лисичка-сестричка... А вас тама, похоже, нет!
Почему? Да потому что на Мейби нужно сначала зарегистрироваться, а потом подать заявку на прописку в ДоМиКе.










