Ноябрь 6th, 2008
Провести индексацию отсканированных документов? Для Google это не проблема.
Новость в компании Google. Текст на отсканированных изображениях теперь можно индексировать с помощью поисковика Google. Конечно, говорить об индексации текстов любых форматов пока рановато, но текст документа формата PDF ему по плечу.
Определить текст на картинке можно с помощью специальной технологии оптического распознавания. Называется она Optical Character Recognition . Как говорят представители компании, она способна преобразовывать изображение слов в файлы с текстом.
Читать пост: «Новости Google» полностью »
Размешено в рубрике: Новости | Комментариев (2) »