Cognitive Technologies открыла код системы распознавания печатных текстов Cuneiform. Исходные тексты будут распространяться под лицензией BSD (Berkeley Software Distribution), что обусловлено «в первую очередь научно-исследовательской и образовательной направленностью проекта». По мнению компании, это позволит получить новые идеи и методы, что усилит проект и повысит «привлекательность OCR-технологии как сервиса».
Открытие кода осуществляется в рамках реализации программы «Распознавание должно быть в каждом компьютере», которая объединит сообщество разработчиков программного обеспечения с открытым исходным кодом. На данный момент, для участия в проекте подано 30 заявок, людьми со всего мира. В 2008 году планируется подготовить версию OCR с открытым кодом на базе Cuneiform. Для последней определены приоритетные направления: создание современного интерфейса; поддержка Linux; добавление распознавания новых языков. Параллельно с этим, компания готовит web-сервис для распознавания текстов в Интернете.
Скачать исходный код можно здесь. Остальные подробности — здесь.