nixp.ru v3.0

5 ноября 2024,
вторник,
10:36:40 MSK

17 ноября 2015, 11:58

Microsoft открыла инструменты для распределённого машинного обучения — Distributed Machine Learning Toolkit

Схема работы DMTK
Схема работы DMTK
Иллюстрация с сайта TechNet Blogs

Исследователи из азиатского подразделения Microsoft Research объявили об открытии исходного кода инструментов для распределённого машинного обучения — Distributed Machine Learning Toolkit (DMTK).

Утилиты DMTK предназначены для параллельного выполнения трудоемких задач, связанных с машинным обучением. В инструментарии используется программный фреймворк на основе Parameter Server (написан на C++), который позволяет легко и эффективно масштабировать задания по обработке больших данных (Big Data). В DMTK также доступны два алгоритма распределенного машинного обучения и простые в использовании API. В качестве алгоритма для обучения тематическому моделированию используется LightLDA, а для векторного представления слов — алгоритмы Word2vec и multi-sense.

Исходный код Distributed Machine Learning Toolkit (DMTK) опубликован на GitHub и распространяется на условиях свободной лицензии MIT.

Постоянная ссылка к новости: http://www.nixp.ru/news/13647.html. Дмитрий Шурупов по материалам TechNet Blogs.

fb twitter vk