Открыт исходный код базы данных Greenplum — продвинутого warehouse на базе PostgreSQL
1Иллюстрация с сайта Greenplum
Вчера, 28 октября, стало известно об открытии исходного кода базы данных Greenplum Database (GPDB), позиционируемой как продвинутое полнофункциональное Open Source-хранилище данных (warehouse) на основе свободной СУБД PostgreSQL.
Greenplum — СУБД, созданная одноименной компанией, которая была в 2010 году куплена EMC Corporation, а в 2013 году перешла к Pivotal Software. Открытие кода GreenplumDB (GPDB) было анонсировано Pivotal ещё в феврале, и теперь это стало реальностью: проект получил свой сайт, а исходники опубликованы на GitHub под свободной лицензией Apache License v2. Greenplum обеспечивает мощную и быструю аналитику по огромным массивам данных и, как утверждают разработчики, использует «самый продвинутый в мире оптимизатор запросов на основе оценки их стоимости».
Основой для GPDB служит свободная СУБД PostgreSQL, функциональные возможности которой были расширены с помощью:
- архитектуры для массовой параллельной обработки данных (автоматическое распараллеливание всех данных и запросов),
- технологии MPP для высокой производительности в масштабах петабайтов,
- инновационного оптимизатора запросов (его аналитические возможности масштабируются на крупные наборы данных без ущерба производительности и пропускной способности),
- полиморфного (ориентированного на столбцы или строки) хранилища и обработки данных,
- продвинутого машинного обучения на базе библиотеки Apache MADLib.
Кластер Greenplum состоит из мастер-сервера, в котором хранятся только метаданные, и множества «сегментных» серверов, где находятся все пользовательские данные. Все серверы используют одну и ту же схему БД.
Подробности о GPDB, документация по проекту и анонсы событий, связанных с ним, доступны на greenplum.org.
Постоянная ссылка к новости: http://www.nixp.ru/news/13630.html. Дмитрий Шурупов по материалам Greenplum.
- Pivotal открывает код своего ПО для анализа больших данных: GemFire, HAWQ и GreenplumDB 2 1 19 февраля 2015 г.
PostgreSQL 10: свободную СУБД значительно улучшили для распределённого использования 1
Pivotal открывает код своего ПО для анализа больших данных: GemFire, HAWQ и GreenplumDB 2 1
Facebook открыла код HydraBase — новой распределенной базы данных на основе Apache HBase 1
Postgres-XL — свободная кластерная СУБД на базе PostgreSQL для OLTP и Big Data 1
23 марта в Москве с лекцией по Big Data выступит соучредитель Greenplum
EMC покупает Greenplum, займется решениями на базе PostgreSQL 1 4
Последние комментарии
- OlegL, 17 декабря 2023 года в 15:00 → Перекличка 21
- REDkiy, 8 июня 2023 года в 9:09 → Как «замокать» файл для юниттеста в Python? 2
- fhunter, 29 ноября 2022 года в 2:09 → Проблема с NO_PUBKEY: как получить GPG-ключ и добавить его в базу apt? 6
- Иванн, 9 апреля 2022 года в 8:31 → Ассоциация РАСПО провела первое учредительное собрание 1
- Kiri11.ADV1, 7 марта 2021 года в 12:01 → Логи catalina.out в TomCat 9 в формате JSON 1