Microsoft разместила исходный код среды для машинного обучения Microsoft Distributed Machine Learning Toolkit (DMLT) на сайте GitHub.
Платформа DMLT предназначена для децентрализованного машинного обучения — одновременного использования большого количества компьютеров для решения ресурсоемких вычислительных задач.
DMLT включает три элемента:
- программный каркас DMTK;
- алгоритм LightLDA для обучения моделей;
- алгоритмы для обработки естественных языковых запросов (определения взаимосвязей между словами) Distributed Word Embedding и Distributed Multisense Word Embedding.
По словам представителей Microsoft, платформа позволит исследователям сократить время обучения моделей на различных вычислительных узлах, не беспокоясь об управлении потоками и нагрузкой. Платформа также упрощает внутренний обмен данными за счет наличия двух библиотек (MPI и ZMQ).
В качестве реализации, исследователи Microsoft занимаются разработкой алгоритмов интерпретации слов, звуков и изображений.
Напомним, что в начале ноября Google открыла код собственной платформы машинного обучения TensorFlow.