Компания Cognitive Technologies открыла код системы распознавания печатных текстов

Cognitive Technologies открыла код системы распознавания печатных текстов Cuneiform. Исходные тексты будут распространяться под лицензией BSD (Berkeley Software Distribution), что обусловлено «в первую очередь научно-исследовательской и образовательной направленностью проекта». По мнению компании, это позволит получить новые идеи и методы, что усилит проект и повысит «привлекательность OCR-технологии как сервиса».

Открытие кода осуществляется в рамках реализации программы «Распознавание должно быть в каждом компьютере», которая объединит сообщество разработчиков программного обеспечения с открытым исходным кодом. На данный момент, для участия в проекте подано 30 заявок, людьми со всего мира. В 2008 году планируется подготовить версию OCR с открытым кодом на базе Cuneiform. Для последней определены приоритетные направления: создание современного интерфейса; поддержка Linux; добавление распознавания новых языков. Параллельно с этим, компания готовит web-сервис для распознавания текстов в Интернете.

Скачать исходный код можно здесь. Остальные подробности — здесь.