«Гоголь» радует не по-детски

Новости не классифицированные принадлежностью к разделам выше
Ответить
Аватара пользователя
ИМХО
Бытовой хакер
Бытовой хакер
Сообщения: 975
Зарегистрирован: 02 мар 2010, 13:21
ОС: Maui 2
Откуда: Чолпон-Ата
Контактная информация:

«Гоголь» радует не по-детски

Сообщение ИМХО » 20 авг 2010, 18:32

Google научил свой поисковик индексировать отсканированные текстовые страницы. При этом, текст изображения распознается самостоятельно самой поисковой системой.

В настоящее время, школьные и правительственные документы выкладываются во Всемирную паутину в основном именно в PDF-формате. До настоящего времени Google не мог распознать текст и воспринимал содержимое как картинку. И вот, у Интернет гиганта появилась новейшая технология оптического распознавания символов (Optical Character Recognition). Векторная информация изображения преобразовывается поисковым алгоритмом в слова, которые в свою очередь легко поддаются индексированию.

«Теперь результаты поиска будут значительно шире и точнее», радуются в Google. Что касается пользователя, то у него появится возможность находить гораздо больше нужной информации.
Изображение
http://eterra.info/news/260
Аватара пользователя
Raven
Бородатый сис
Бородатый сис
Сообщения: 2788
Зарегистрирован: 03 мар 2010, 15:12
ОС: RHEL 7
Откуда: Из серверной

Re: «Гоголь» радует не по-детски

Сообщение Raven » 20 авг 2010, 18:39

ну что сказать? молодцы
Я не злопамятный, я просто часто ковыряю логи
Изображение
Ответить

Вернуться в «Общий»