Открывается исходный код OCR-системы CuneiForm
Российская компания Cognitive Technologies объявила об открытии исходного кода системы распознавания текстов (OCR) CuneiForm.
Хотя на официальном сайте компании об открытии кода CuneiForm еще не объявлено, в отечественных СМИ это событие считается состоявшимся. Более того, уже появились первые комментарии от главных конкурентов Cognitive Technologies…
Сами разработчики объяснили решение открыть исходный код своего программного подукта так: за период с 2000 года никаких революционных изменений в технологиях OCR не произошло. Развитие данных систем шло, главным образом, по пути совершенствования их сервисной стороны и расширения списка дополнительных возможностей (например, распознавание новых языков). Кроме того, считается, что подключение Open Source-сообщества в процесс разработки CuneiForm (под руководством ученых-консультантов и менеджеров Cognitive Technologies) позволит добиться значимого эффекта.
Но с ними не согласны специалисты из другой российской компании — ABBYY: «Выход CuneiForm по открытой лицензии вряд ли способен заметно поменять ситуацию на рынке оптического распознавания», — заявила в интервью руководитель группы продуктового маркетинга компании ABBYY Россия Дина Шелепина.
Она добавила, что система CuneiForm давно и безнадежно отстала по своему качеству и функциональности от современных систем распознавания текстов. А сообществу Open Source-разработчиков, по ее мнению, вряд ли удастся без существенных инвестиций сделать рефакторинг кода и привести эти технологии к виду, когда их можно было бы использовать для решения каких-то реальных задач.
«Открытие устаревших исходных кодов энтузиастам вряд ли позволит вывести продукт на современный конкурентоспособный уровень», — говорит Дина Шелепина.
Постоянная ссылка к новости: http://www.nixp.ru/news/8819.html. Дмитрий Шурупов по материалам dp.ru.
Apache Software Foundation отметила важную роль, которую сыграли Open Source-инструменты для «панамских документов»
В OCR-системе Tesseract 3.00 появилась поддержка русского языка 4
WatchOCR — LiveCD Linux для распознавания текста в PDF 2 4
Вышел ABBYY FineReader Engine 9.0 для Linux 6 2
Последние комментарии
- OlegL, 17 декабря в 15:00 → Перекличка 21
- REDkiy, 8 июня 2023 года в 9:09 → Как «замокать» файл для юниттеста в Python? 2
- fhunter, 29 ноября 2022 года в 2:09 → Проблема с NO_PUBKEY: как получить GPG-ключ и добавить его в базу apt? 6
- Иванн, 9 апреля 2022 года в 8:31 → Ассоциация РАСПО провела первое учредительное собрание 1
- Kiri11.ADV1, 7 марта 2021 года в 12:01 → Логи catalina.out в TomCat 9 в формате JSON 1