Разделы

Big Data

Россия создает 2,4% мирового объема данных

С 2013 по 2020 гг. мировой объем информации увеличится десятикратно и достигнет 44 зеттабайт, но хранилищ хватит лишь для 15% данных, считают эксперты IDC. Россия на сегодняшний день накопила 155 экзабайт, или 2,4% мировых данных. И в ближайшие семь лет эта доля сохранится.

Авторы седьмого ежегодного исследования IDC «Цифровая вселенная» (IDC Digital Universe), проведенного по заказу EMC, ожидают, что к 2020 г. произойдет 10-кратный рост мирового объема цифровой информации, при этом 10% этого объема будет создаваться датчиками. Ученые прогнозируют, что с 2013 по 2020 гг. количество данных увеличится с 4,4 до 44 зеттабайт. Объем информации удваивается каждые 2 года, основной вклад в этот рост вносит интернет вещей.

По прогнозам, объемы данных в России будут расти немного медленнее, чем в мире. Объем информации в России аналитики оценили в 155 экзабайт (2,4% от мирового объема) и прогнозируют его рост до 980 экзабайт (2,2% от мирового объема) к 2020 г. Увеличению объема информации в России будут способствовать рост числа пользователей интернета, социальных сетей и смартфонов, а также миграция с аналогового телевидения на цифровое. Причину нестабильного развития систем хранения в России аналитики видят в высокой стоимости инфраструктуры и связанном с этим ограниченном финансировании.

Чтобы проиллюстрировать увеличение объемов информации в мире, исследователи приводят несколько наглядных примеров. Так, если записать в iPad Air (толщиной в 29 дюймов с 128 Гб памяти на борту) весь объем информации, то понадобится батарея планшетов длиной 253 704 км, что составляет две трети расстояния до Луны. К 2020 г. не хватит и шести таких батарей, фантазируют эксперты. Другой пример: если представить один байт данных как кастрюлю с водой емкостью 3,7 л, то данных, создаваемых в наши дни за 10 сек., будет достаточно, чтобы полностью залить дом средних размеров. В 2020 г. на это понадобится всего 2 секунды.

По оценкам IDC, количество устройств и предметов, которые можно подключить к интернету в мире, приближается к 200 млрд, из которых 14 млрд, или 7%, уже подключены и активно передают данные. На сегодняшний день данные от таких устройств составляют 2% от мирового объема информации. Согласно прогнозам IDC, к 2020 г. уже 32 млрд подключенных устройств будут генерировать 10% общего объема данных во всем мире.

Развитие интернета вещей также увеличит долю пригодных для анализа данных. На сегодняшний день только 22% информации может быть полезным и только 5% фактически анализируется. Остальные массивы авторы исследования называют «космическим мусором». Предполагается, что к 2020 г. благодаря развитию интернета вещей более 35% будут считаться полезными.

Помимо новых возможностей большие данные принесут и новые проблемы: защищать огромные объемы разнообразных данных станет все сложнее. Согласно IDC, 40% данных в мире и 49% в России нуждаются в различных мерах защиты — от обеспечения повышенной конфиденциальности до полного шифрования. При этом на сегодняшний день только половина, или 20%, общего объема этих данных реально защищена.

Исследователи также ожидают, что через семь лет развивающиеся страны, среди которых включая Бразилия, Китай, Мексика и Россия, будут производить больше данных, чем развитые — например, Германия, Япония и США. Сегодня вклад последних в мировой объем данных оценивается в 60%.

Гибридный ренессанс: как использовать растущий тренд на гибридную инфраструктуру
Облака

Аналитики IDC делают тревожный вывод о том, что рост объемов данных существенно опережает рост емкости систем хранения. В 2013 г. совокупная доступная емкость систем хранения соответствовала 33% объема цифровой информации. К 2020 г. ее будет достаточно для хранения менее чем 15%. Эксперты успокаивают: большая часть данных генерируется краткосрочно и не требует хранения.

В 2013 г. менее 20% данных размещалось в облаке. К 2020 г. эта величина удвоится и составит 40%.

Джереми Бертон (Jeremy Burton), президент по продуктам и маркетингу департамента информационных инфраструктур EMC, считает, что рост данных способен вызвать существенную трансформацию бизнес-структур: «Предприятия все шире используют социальные медиа и включают в свою бизнес-модель использование мобильных устройств. Компании получают более широкие возможности анализа новых потоков данных и повышения ценности уже накопленных данных. Иными словами, предприятия всех типов стремительно превращаются в программно-определяемые предприятия прямо на наших глазах».

Как приручить джинна: Почему GenAI нужен науке и бизнесу, несмотря на сложный характер
Энергия ИИ

С ним согласен Вернон Тернер (Vernon Turner), старший вице-президент IDC: «По мере того как увеличивается количество подключенных к интернету датчиков, генерируемые ими данные играют все большую роль во всех сферах бизнеса, поднимая старые отрасли на совершенно новый уровень. Традиционные сервисы хранения данных достигнут нового уровня отказоустойчивости и надежности и благодаря этому смогут стать частью новой цифровой вселенной. А это можно гарантировать только в программно-определяемой среде».

Для того чтобы извлечь пользу из растущих объемов информации, компаниям необходимо по-новому взглянуть на те массивы генерируемых данных, которые сейчас не принято анализировать системно: журналы работы информационных систем, историю показаний датчиков на различных временных интервалах и т.д, считает Руслан Цховребадзе, ведущий консультант IBS. «Огромные объемы информации с различных устройств кроме широких возможностей для анализа позволяют автоматически управлять процессами на основе показаний датчиков в реальном времени: менять режимы работы оборудования, включать резервные мощности или отключать неиспользуемые и т.п. В результате можно экономить за счет более «умной» и точной работы оборудования. В имеющихся потоках данных необходимо определить шаблоны регулярно повторяющихся событий, определить ключевые факторы и условия, влияющие на развитие ситуаций. Реализовать обработку событий с учетом множества сопутствующих конкретной ситуации факторов можно с помощью новых классов программных инструментов, например, решений класса Complex Event Processing (CEP) и Operational Decision Management (ODM)», – рассказал эксперт.

Александра Кирьянова