13 лет назад 10 января 2006 в 18:38 62

Можете, конечно, брать с собой и видеокамеру, но держать при себе небольшой цифровик удобнее. Дело в том, что abbyy finereader 8 распознает отснятые тексты почти в два раза лучше, чем прежние версии. И даже если вы переберете на фуршете и несколько неуверенно отснимете документацию, новая версия finereader с этим справится – переведет фотографии документов в редактируемый электронный формат, причем с полным сохранением внешнего вида.

Главное в новой версии – улучшение технологии распознавания, что само по себе обещает сделать это распознавание более точным. Особенно это касается документов, полученных с помощью цифровой фотокамеры или факса, текстов, отсканированных с низким разрешением, а также документов сложного оформления. Комплект ABBYY FineReader 8.0 (www.FineReader.ru) пополнился планировщиком Hot Folder & Scheduling (в корпоративной версии), приложением для распознавания снимков экрана, а также менеджером сценариев, позволяющим автоматизировать выполнение однотипных операций. Добавлена возможность защиты создаваемых PDF-документов с помощью паролей.

Нас особенно заинтересовала возможность улучшенного распознавания отснятых документов. Не потащишь же сканер с собой куда-нибудь на конференцию или в библиотеку, да и не каждую книгу можно физически засунуть в сканер. Вот почему рано или поздно у обладателя цифровика появляется идея вместо сканирования фотографировать. Причем не только документы, но и все что угодно, содержащее текст: объявления, вывески, плакаты, расписания и т. д.

Если придерживаться определенных правил при съемке документа (камера 4 Мпикс и выше, равномерная освещенность, не включать вспышку и держать камеру параллельно поверхности документа), то распознать его, в принципе, можно будет в любой распознавалке. Никто не мешал это делать и в предыдущих версиях ABBYY FineReader. Однако на деле такие фотографии распознавались очень неуверенно – с большим количеством ошибок, которые приходилось править вручную. Посмотрим, как с этим теперь.

Для теста мы отсняли несколько страниц одного из выпусков нашего журнала, умышленно нарушая всякие правила хорошей съемки: располагали журнал криво, затеняли его, не распрямляли страницы, снимали с большого расстояния (больше 50 см), задавали неправильные режимы и даже включали вспышку. И вот что получили.

При обработке подобных изображений, ABBYY FineReader 8.0 ругался и на масштаб, и на яркость, однако распознал почти все в лучшем виде без всякой предварительной подготовки. В графическом редакторе приходилось выпрямлять только кривые картинки и увеличивать яркость/контрастность, если снимки были слишком темными. С сильными бликами нам справиться не удалось – они просто “выедают” часть текста, поэтому лучше совсем забыть о вспышке, особенно при съемке глянцевых журналов. А вот с искривлением строк по краям изогнутых листов ABBYY FineReader 8.0 с успехом справился сам, стоило лишь задать ему “Устранить искажение строк”. Кстати, другой функцией обработки изображений – “Очистить изображение от мусора” – при работе с цифровыми фотографиями лучше не пользоваться. У нас это приводило к ухудшению качества распознавания.

Итак, если документ при съемке лежит прямо, распрямлен, освещен и снят с небольшого расстояния без вспышки и с приемлемыми параметрами, то его фотография распознается в ABBYY FineReader 8.0 с высокой точностью. Судите сами: даже в нашем никуда не годном снимке блок из 500 символов, находящийся на изгибе, был распознан с двадцатью символами, помеченными как неуверенно распознанные, и только два (!) из них были действительно неправильными.

Нужно сказать, что ABBYY FineReader 8.0 теперь лучше понимает не только цифровые фотографии, но и любые плохие изображения. Для этого у него есть дополнительные инструменты. Это и подключение пользовательских словарей Word, и обрезка черных полей, появляющихся при сканировании, и исправление некорректного разрешения изображений до нужной для распознавания величины. Например, с использованием последней возможности нам без труда удалось распознать присланную по факсу справку с разрешением 50 dpi.

В качестве бонуса для зарегистрированных пользователей к ABBYY FineReader 8.0 Professional Edition прилагается небольшая программка ABBYY Screenshot Reader. Ей просто нет цены, если нужно быстро “выдрать” текст из любого окна на экране, а скопировать его обычным способом нет никакой возможности. Выделенный участок экрана моментально распознается и сохраняется в соответствии с выбранным режимом: в файл, в буфер обмена, в Word или Excel.

Точно так же можно захватить таблицу и передать ее в файл или Excel. Годится эта утилита и для обычного создания скриншотов, а полученные изображения можно тут же передавать в ABBYY FineReader 8.0 для более точной обработки. Мы опробовали эту программу на image-only PDF, слайдах различных презентаций, флэш-картинках в интернете, субтитрах DVD-фильмов и даже окнах системных сообщений. Во всех случаях распознавание и передача текста выполнялись отлично. Правда, иногда приходилось увеличивать шрифт – все-таки экранное разрешение маловато для уверенного распознавания.

Еще одна новая возможность – менеджер сценариев – заслуживает отдельного упоминания. Неопытные юзеры могут воспользоваться готовыми сценариями (например, PDF to Word) и тем самым объединить и автоматизировать некоторые отдельные операции. А продвинутые могут сами создавать сценарии на выполнение целых повторяющихся задач и сильно экономить на этом свое время. Способствует сокращению времени на обработку документов высокого качества и новый режим ускоренного распознавания.

Остальные новинки ABBYY FineReader 8.0 остается только коротко перечислить. Башкиры порадуются добавлению своего языка к числу распознаваемых со словарной поддержкой, которых теперь 36, а всего распознается 179. Гиперссылки теперь не только распознаются, но и передаются потом в Word, PDF или HTML. Более того, если во входящем PDF-файле оглавление оформлено в виде внутренних ссылок на страницы документа, эти связи восстановятся в документе Word. И, наконец, для сохраняемых документов теперь можно задавать дополнительные свойства, а потом быстро находить эти документы с помощью систем локального поиска с индексированием.