IPB

Здравствуйте, гость ( Вход | Регистрация )

 
Ответить в эту темуОткрыть новую тему
> Распознание и редактирование текста.
Юкио
сообщение Nov 13 2007, 17:53
Сообщение #1


Добрый фей
******

Группа: Модераторы
Сообщений: 5 700
Из: Сумеречная зона



Передо мной задача - перевести ряд текстов с английского на русский. Тексты - в формате PDF, но не распознаны. Обычные сканы. Чем и как перевести эти сканы в редактируемый вид? Цель такая - перевести файлы в редактируемый вид, перевести текст, сделать из переведённого снова PDF, сохранив структуру оригинала - текст в два столбца, рисунки, фон и прочее оформление. Желательно расписать процесс по пунктам, так как опыта в этом не имею. Из установленных программ имеется ABBYY FineReader 8.0, Easy PDF to HTML Converter и PDFCreator.


--------------------
Да умоются кровью те, кто усомнится в моем миролюбии!

"Как бы хорошо человек не говорил, помните: когда он говорит слишком много, то в конце концов скажет глупость." А. Дюма-отец.
caitsith@jabber.ru
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
Софтмаг - магазин лицензионного софта лицензионный номер для promt 8.5 приятные цены )
nishairdna
сообщение Nov 13 2007, 18:43
Сообщение #2


Старожил
******

Группа: Участники
Сообщений: 1 031
Из: Лось



1. Распознать в FineReader
2. Передать в Word
3. Перевести в Word'е, используя Promt
4. Распечатать в PDF, используя Adobe Acrobat, или что-нибудь стороннее (Jaws PDFcreator, pdfFactory и т.п.)
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
ламинат, доска, паркетная доска barlinek, tarkett
Юкио
сообщение Nov 13 2007, 19:38
Сообщение #3


Добрый фей
******

Группа: Модераторы
Сообщений: 5 700
Из: Сумеречная зона



Цитата(nishairdna @ Nov 13 2007, 17:43) *

1. Распознать в FineReader
2. Передать в Word
3. Перевести в Word'е, используя Promt
4. Распечатать в PDF, используя Adobe Acrobat, или что-нибудь стороннее (Jaws PDFcreator, pdfFactory и т.п.)

Внутренности файлов выглядят примерно вот так - смотри аттач. Это все в Word-е сохранится?


Прикрепленные файлы
Прикрепленный файл  1.JPG ( 129.4 килобайт ) Кол-во скачиваний: 36
Прикрепленный файл  2.JPG ( 113.31 килобайт ) Кол-во скачиваний: 26


--------------------
Да умоются кровью те, кто усомнится в моем миролюбии!

"Как бы хорошо человек не говорил, помните: когда он говорит слишком много, то в конце концов скажет глупость." А. Дюма-отец.
caitsith@jabber.ru
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
Кайтсерфинг, виндсерфинг магазин 2010 - последние колекции.
Zendzirou
сообщение Nov 14 2007, 06:15
Сообщение #4


Старожил
******

Группа: Комодераторы
Сообщений: 1 033



текст и обычные картинки файн ридером вытащищь легко. тут особо затруднений не будет. а вот фон - нет. его в итоге придётся рисовать заного. по скринам создавать картинку и ставить везде.


--------------------
Верблюд - это животное, напоминающее зайца, но зайцем не являющееся.

<ega> Zendzirou: ты бог пластмасовых штучек, в которые упаковывают коробочки, из под печенья в форме рыбок с луком
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
Юкио
сообщение Jul 20 2008, 19:20
Сообщение #5


Добрый фей
******

Группа: Модераторы
Сообщений: 5 700
Из: Сумеречная зона



Дано. PDF с текстом и картинками. Сделан он из других сканов, видимо из JPEG. То есть, и текст и изображения не отдельно друг от друга. Проблема - изображения, вставленные в текст так, что он их как бы обтекает. Как их оттуда выдрать?


--------------------
Да умоются кровью те, кто усомнится в моем миролюбии!

"Как бы хорошо человек не говорил, помните: когда он говорит слишком много, то в конце концов скажет глупость." А. Дюма-отец.
caitsith@jabber.ru
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
ghj
сообщение Jul 24 2008, 21:35
Сообщение #6


Старожил
******

Группа: Участники
Сообщений: 1 676



Цитата(Юкио @ Jul 20 2008, 19:20) *
Дано. PDF с текстом и картинками. Сделан он из других сканов, видимо из JPEG. То есть, и текст и изображения не отдельно друг от друга. Проблема - изображения, вставленные в текст так, что он их как бы обтекает. Как их оттуда выдрать?

Мне кажется, что без граф. редактора не обойтись. Сохранить скан в граф. формате, распознать в Finereader(самому выделяя блоки распознования). А рисунковую часть почистить и сохранить отдельно, и использовать при обратной вставке текста.

Сообщение отредактировал ghj - Jul 24 2008, 21:36
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
[U-L]DIMON
сообщение Jul 24 2008, 23:13
Сообщение #7


Старожил
******

Группа: Участники
Сообщений: 1 086
Из: юмительный



I.M.H.O. --- легче файнридером распознать и мелкие баги вручную подправить --- особенно при переносах в распознаваемом изображении документа (фри-тюрница)... Для перевода раньше Socrat вроде бы рулил... но всё равно вручную правили там типа падежи и т.п. нюансы... ну и в общем то Adobe PDF Transformer не так уж и "полностью сохраняет исходную структуру PDF-документа", но всё равно прога хорошая... потом в ворде текст на колонки разбить как надо... ну а про всякие там фоны, обрамления и т.п. --- не знаю... я дипломный так делал, а не "конфетку" --- фотошоп поможет из исходного изображения убрать всякие излишества типа текста, наложенного на имеющийся фон и т.п.

(добавлено) ах ну да!.. в корэл драве хорошие вещи могут получиться!..

Сообщение отредактировал [U-L]DIMON - Jul 24 2008, 23:15


--------------------
Spacesoft скончался!..
Пользователь в офлайнеКарточка пользователяОтправить личное сообщение
Вернуться в начало страницы
+Ответить с цитированием данного сообщения
Ответить в эту темуОткрыть новую тему
1 чел. просматривают этот форум (гостей: 1, скрытых пользователей: 0)
Пользователей: 0