nixp.ru v3.0

22 декабря 2024,
воскресенье,
11:41:34 MSK

30 мая 2014, 15:39

Apache Spark 1.0 — крупный релиз Open Source-фреймворка для анализа данных

1
Логотип Apache Spark
Логотип Apache Spark
Иллюстрация с сайта Spark.Apache.Org

Сегодня состоялся крупный релиз фреймворка с открытым кодом для анализа данных — Spark 1.0. Ранее в этом году проект был переведён в разряд наиболее приоритетных в Apache Software Foundation (ASF).

Spark — это инструмент для обработки и анализа больших объёмов информации. Версия 1.0 предлагает стабильное API (с обратной совместимостью в ветке 1.x), новый Spark SQL для доступа к структурированным данным, а также интеграцию с другим ПО от ASF: Hadoop YARN, Hive и Mesos.

Патрик Вэндел (Patrick Wendell), инженер ПО в Databricks и менеджер по выпуску Apache Spark 1.0, рассказал о выходе новой версии: «В дополнение к долгосрочной поддержке API данный выпуск содержит несколько новых возможностей. Spark 1.0 включает унифицированный инструмент для развёртывания приложений на локальном компьютере через Mesos или YARN, а также на выделенном кластере. Мы добавили новый модуль Spark SQL для обеспечения моделирования данных с учетом схемы (schema-aware) и поддержки языка SQL в Spark. Библиотека машинного обучения Spark (MLLib) была улучшена путём добавления нескольких новых алгоритмов. Библиотеки потоков и графов также получили значительные обновления. Мы сосредоточились на создании инструментов для расширения возможностей учёных, занимающихся изучением больших данных, людей, занимающихся статистикой и инженеров, сталкивающихся с необходимостью обрабатывать большие объёмы данных каждый день».

Apache Spark 1.0 можно скачать на сайте проекта.

Постоянная ссылка к новости: http://www.nixp.ru/news/12523.html. Никита Лялин по материалам Blogs.Apache.org.

fb twitter vk