Microsoft открыла двери «большим данным»: Hadoop на Windows Azure
Корпорация Microsoft объединилась с поставщиками решений на базе Hadoop для создания промышленного серверного продукта по работе с «большими данными», объединяющего в себе проприетарные и открытые технологии. Спустя год бета-тестирования Microsoft и Hortonworks представили первую демонстрационную версию интеграции Apache Hadoop c Windows Server и Windows Azure.Решения по интеграции, представленные на конференции O’Reilly Strata Conference + Hadoop World в Нью-Йорке, получили названия Windows Azure HDInsight и Microsoft HDInsight for Windows Server. Оба продукта основаны на промышленной имплементации Apache Hadoop (Hortonworks Data Platform 1.1) и доступны для скачивания на официальном сайте Microsoft.
По словам Дуга Лиланда (Doug Leland), ведущего менеджера по продукту SQL Server, Microsoft вкладывается в развитие Hadoop, так как считает технологию «необычайно важной для распределенной обработки больших объемов данных». Новые продукты призваны облегчить установку, настройку и взаимодействие открытого фреймворка с проприетарными сервисами Microsoft.
HDInsight позволяет просматривать и анализировать большие объемы данных, используя программные продукты Microsoft, такие как Excel с плагином Hive, Microsoft SQL Server Analysis Services, PowerPivot и Power View. Пользователи Microsoft System Center могут с его помощью управлять своим Hadoop-кластером, а пользователям Azure HDInsight может сократить установку и настройку Hadoop в «облаке» до 10 мин.
«HDInsight позволяет снизить планку в отношении усилий, которые требуются для установки и администрирования Hadoop в среде Azure и Windows Server, - заявил Лиланд. - Кроме того, он дает аналитикам возможность использовать средства Excel и Power View для глубинного исследования информации, полученной от ПО для обработки больших данных».
Интересно, что первоначально Редмонд в течение 5 лет пытался создать альтернативную закрытую Hadoop-подобную систему под кодовым названием Dryad, однако затем в корпорации увидели возможность зарабатывать на открытых решениях, и стратегия в отношении Hadoop полностью изменилась: Microsoft активно включился в процесс разработки и год назад подписал формальное соглашение с Hortonworks. В настоящее время компании сработались, и сейчас в разделе Big Data сайта Microsoft представлены именно продукты HDIsight.
«Мы очень активно выступаем за вклад в сообщество, - говорит Джон Крейса (John Kreisa), вице-президент Hortonworks по маркетингу. - Сейчас у нас прекрасные отношения с Microsoft, и не существует технических проблем, которые наши инженеры не смогли бы решить совместными усилиями».
Обе компании рассчитывают, что совместный проект позволит наладить кросс-культурный контакт между разработчиками открытых и закрытых систем. Крейса рассказал, что Microsoft полностью интегрировала свои инструменты разработки с новыми продуктами, так что разработчики могут строить алгоритмы обработки данных для Hadoop на C++, C#, Python, Ruby и Perl. Кроме того, специализированные приложения для работы c Hadoop вскоре появятся на Azure Marketplace.