Разделы

ПО Big Data Облака

Microsoft представила новую версию Azure Data Lake для хранения, обработки и анализа больших данных

Корпорация Microsoft представила новую расширенную версию Azure Data Lake. Новинка поможет вендорам, специалистам по обработке данных и аналитикам хранить информацию любого объема, а также обрабатывать и анализировать ее на любой платформе и на любом языке, сообщили CNews в Microsoft. В обновленную версию Azure Data Lake вошли: облачное хранилище больших данных, новый аналитический сервис, служба кластеров HDInsight для платформы Linux, интегрированные инструменты разработки на Visual Studio, а также новые приложения Hadoop ISV. Объявление стало частью глобальной стратегии Microsoft в области аналитики и больших данных, отметили в корпорации.

«Microsoft уделяет много внимания развитию платформы для работы с большими данными. Мы создаем инструменты обработки информации любого типа и объема, которыми наши заказчики могут воспользоваться как в “облаке”, так и в локальной инфраструктуре, — заявил Дмитрий Марченко, директор по продвижению облачной платформы Microsoft в России. — Наша цель — сделать технологии Big Data более простыми и доступными для максимально широкого круга пользователей — разработчиков, аналитиков, ученых и ИТ-специалистов. И мы надеемся, что обновление Azure Data Lake станет большим шагом к ее достижению».

Azure Data Lake Store — это гибкое масштабируемое хранилище данных, которое позволяет работать с неструктурированной, полуструктурированной и структурированной информацией. С его помощью можно собирать информацию любого типа и размера, получать доступ к ней и анализировать ее, избегая сбоев в производственных процессах и поддерживая требуемый уровень безопасности сети, что, например, критически важно для стабильной работы IoT-сценариев, отметили в Microsoft. Платформа станет доступна пользователям в ближайшее время.

Azure Data Lake Analytics — новый сервис анализа данных, созданный на базе Apache YARN для работы в «облаке». По словам разработчиков, Azure Data Lake Analytics справляется с информацией любого масштаба, регулируя нагрузку на сеть. Модель предоставления сервиса предполагает, что клиенты будут оплачивать только те периоды, когда он использовался, а также поддержку Azure Active Directory.

В новую версию Azure Data Lake также включен сервис Azure HDInsight, разработанный на базе Apache Hadoop. HDInsight позволяет раскручивать неограниченное количество узлов за считанные минуты, утверждают в корпорации. Azure HDInsight предлагает пользователям широкие возможности экосистемы Hadoop в рамках легко управляемого сервиса, работу которого поддерживают специалисты Microsoft. Сегодня сервис стал доступен для пользователей платформы Linux. При этом корпорация ведет работу над версией для Ubuntu.

Павел Ахметчанов, Т-Банк: Онлайн-доски борются не друг с другом, а с неудобными процессами
ИТ в банках

Microsoft также подготовила обновление инструментов разработки, отладки и настройки ПО Visual Studio. Azure Data Lake Tools для Visual Studio предлагают интегрированную среду разработки, доступную для работы с SQL and .NET. А поддержка U-SQL в Azure Data Lake для Visual Studio повышает производительность средств анализа и оптимизирует процессы на тысячах узлов, отметили в компании.

Наконец, Hadoop ISV — это пакет приложений для управления информацией, вошедший в новейшую редакцию Data Lake. Он включает в себя средства непрерывной аналитики больших данных, такие как Datameer, технологии защиты и управления информацией — Dataguise и BlueTalon, а также DataTorrent и инструменты визуализации AtScale и Zoomdata.

Татьяна Короткова