nixp.ru v3.0

22 декабря 2024,
воскресенье,
10:02:25 MSK

19 октября 2011, 14:35

Apache Cassandra 1.0 — NoSQL-СУБД стала совсем взрослой

1
Логотип Apache Cassandra
Логотип Apache Cassandra
Иллюстрация с сайта Cassandra.Apache.Org

Вчера распределенная СУБД с открытым кодом Apache Cassandra достигла своего первого крупного релиза — 1.0.

Cassandra — распределенная система управления базами данных, относящая к категории «NoSQL» (данные хранит как структурированный набор ключей-значений). Её исходный код распространяется под лицензией Apache License v2, поддержкой и развитием занимается некоммерческая организация Apache Software Foundation (ASF). На коммерциализации проекта специализируется компания DataStax, техническим директором которой является Джонатан Эллис (Jonathan Ellis), один из лидеров этого Open Source-проекта.

Изначально Cassandra была создана в Facebook для быстрой обработки огромных объемов данных*: популярнейшая социальная сеть так и остается её важным «пользователем». К нему присоединились такие компании и сервисы, как Cisco, Digg, Netflix, Reddit, Twitter и Walmart.

С выпуском Apache Cassandra 1.0 эта СУБД позиционируется как готовая для промышленного использования и достаточно простая в администрировании. Впрочем, глядя на нынешних «пользователей» Cassandra, всё это можно назвать формальностями. Тем не менее, из возможностей СУБД, относящихся к категории enterprise, называют сжатие данных для экономии места на дисках, оптимизация распределения данных в фоновом режиме, специальные механизмы для эффективного использования оперативной памяти. Особое внимание уделяется производительности: например, если сравнить скорость чтения данных в Cassandra 0.6 и 1.0, то она увеличилась на 400 процентов (скорость записи за это же время возросла на 40 %).

Подробную информацию о новшествах в Cassandra 1.0 можно найти в цикле статей «What’s new in Cassandra 1.0» на datastax.com. Сайт самой СУБД — cassandra.apache.org.

* Крупнейшая инсталляция Cassandra запущена на кластере из 300 серверов, хранящих более 300 терабайт данных. Каждый узел обрабатывает более 5000 запросов в секунду.

Постоянная ссылка к новости: http://www.nixp.ru/news/11436.html. Дмитрий Шурупов по материалам pcworld.com.

fb twitter vk
Читайте также в новостях:
vasilisc

А подскажите кому принадлежит «Крупнейшая инсталляция Cassandra» ?

Дмитрий Шурупов

Не могу найти. Видимо, Facebook или Twitter.

На сайте Cassandra, кстати, указаны меньшие цифры, чем в статье PC World: «The largest production cluster has over 100 TB of data in over 150 machines». Но простое уточнение говорит, что это про Facebook аж 2009 года. На wikipedia пишут, что у Facebook в 2010 было 200+ nodes, а потом вообще не стало :-) Вот хорошая ссылка: en.wikipedia.org/wiki/Apache_Cassandra#Prominent_users