воскресенье, 20 марта 2011 г.

OCR в Google Docs теперь поддерживает русский язык



В июне прошлого года команда Google Docs представила возможность распознавания текста (OCR). OCR анализирует изображения и PDF-файлы, извлекает текст (пытаясь сохранить форматирование) и позволяет редактировать документ в Google Docs.

Тогда поддерживались тексты только на английском, французском, итальянском, немецком и испанском языках.

Сегодня же в сервисе появилась поддержка ещё 29 наборов символов, в том числе тех, которые используются в большинстве европейских языков, русского, китайского упрощённого и некоторых других азиатских языков.

Поддержка языков, которые поддерживались и ранее, также улучшена. Усовершенствовано и сохранение форматирования документов.


Источник: Хабрахабр - Google
Оригинальная страница: OCR в Google Docs теперь поддерживает русский язык

Комментариев нет:

Отправить комментарий