Google готовит Open Source-систему распознавания текста
Компания Google продолжила открытие технологий, связанных с распознаванием текста. В дополнение к ранее открытой системе Tesseract выпущен новый открытый продукт — OCRopus (под лицензией Apache 2.0).
Главная цель OCRopus — выявление и разделение областей текста (и других объектов) на изображениях. Система модульная, в настоящее время для распознавания текста используется Tesseract, но Google планирует в течение ближайшего времени значительно расширить возможности проекта (например, появится GUI-интерфейс и поддержка не только английского языка). Релиз намечен на 3 квартал 2008 года.
OCRopus предназначен для автоматизации распознавания отсканированных или снятых на цифровую камеру документов (включая рукописные), программа может использоваться для выявления спама в приложенных к письму изображений.
Постоянная ссылка к новости: http://www.nixp.ru/news/8254.html. Дмитрий Шурупов по материалам opennet.ru.
Spinnaker 1.0 — Open Source-платформа Google для DevOps с поддержкой CI/CD в разных облаках
Google запустила новый сайт со своими Open Source-проектами и связанной документацией
Google выпустила инструмент OSS-Fuzz для постоянного fuzz-тестирования Open Source-проектов 1
«Добрый» Google: в браузере Chromium обнаружили нерегламентированную загрузку проприетарного модуля 9 5
Хостинг Open Source-проектов Google Code закрывается 6 9
KDE призывает школьников к работе над проектами в рамках Google Code-in 2014 3 2
Последние комментарии
- OlegL, 17 декабря 2023 года в 15:00 → Перекличка 21
- REDkiy, 8 июня 2023 года в 9:09 → Как «замокать» файл для юниттеста в Python? 2
- fhunter, 29 ноября 2022 года в 2:09 → Проблема с NO_PUBKEY: как получить GPG-ключ и добавить его в базу apt? 6
- Иванн, 9 апреля 2022 года в 8:31 → Ассоциация РАСПО провела первое учредительное собрание 1
- Kiri11.ADV1, 7 марта 2021 года в 12:01 → Логи catalina.out в TomCat 9 в формате JSON 1