Размещено: 31 минуту назад
Опубликован релиз системы оптического распознавания текста Tesseract 4.0, поддерживающей распознавания документов на более чем 100 языках, включая русский, казахский, белорусский и украинский. Результат может сохраняться как открытым текстом, так и в форматах HTML, PDF и TSV. Изначально система была создана в 1985-1995 годы в лаборатории компании Hewlett Packard, в 2005 году код был открыт под лицензией Apache и в дальнейшем развивался при участии работников компании Google. Исходные тексты проекта распространяются под лицензий Apache 2.0.
Подробнее...