В настоящее время, школьные и правительственные документы выкладываются во Всемирную паутину в основном именно в PDF-формате. До настоящего времени Google не мог распознать текст и воспринимал содержимое как картинку. И вот, у Интернет гиганта появилась новейшая технология оптического распознавания символов (Optical Character Recognition). Векторная информация изображения преобразовывается поисковым алгоритмом в слова, которые в свою очередь легко поддаются индексированию.
«Теперь результаты поиска будут значительно шире и точнее», радуются в Google. Что касается пользователя, то у него появится возможность находить гораздо больше нужной информации.
http://eterra.info/news/260