Разделы

IBS

Большие данные

Большие данные (Big Data, big data) – термин подразумевает данные, которые невозможно обрабатывать традиционными способами; зонтичный (общий) термин для широкого набора технологий, включающих системы сбора, хранения и обработки огромных массивов структурированных и в основном неструктурированных цифровых данных разнообразного состава (текст, фото, видео и т. д.), часто обновляемых и находящихся в различных источниках, обрабатываемых в целях увеличения эффективности бизнеса, создания новых продуктов и повышения конкурентоспособности, и соответствующий набор технологий и систем хранения.

Для хранения больших данных были созданы специальные СУБД, разработаны методы ИТ-аналитики

Большие данные – одна из прорывных технологий ИТ, поскольку она позволяет увидеть и понять связи между различными фрагментами информации. Технологии больших данных особенно актуальны и потому, что, согласно экспертным оценкам аналитиков, к 2020 г. на долю каждого человека на Земле в среднем будет приходиться примерно 1,5 ГБ новых генерируемых данных в день. Термин в 1998 г. ввел Джон Мэши (John R. Mashey), главный научный сотрудник корпорации SGI.

Для хранения больших данных были созданы специальные СУБД, разработаны методы ИТ-аналитики (IT operations analytics, ITOA; advanced operational analytics – углубленная операционная аналитика; IT data analytics – аналитика ИТ-данных) и ПО для поиска, анализа и составления отчетов по данным, необходимым для ИТ-операций и менеджмента. Эти методы дают возможность при помощи математических алгоритмов, ИИ и других новаторских технологий выделять (извлекать) из сырых первичных данных, собираемых средствами менеджмента и мониторинга, уникальную значимую информацию, умные данные (Smart Data), и делать прогнозы, обеспечивающие повышение прибыльности бизнеса.

Александр Бабкин, Газпромбанк: Сейчас иностранные ИБ-решения в Газпромбанке замещены на 65%
безопасность

Для существенного (в сотни раз) ускорения обработки больших данных применяется также технология вычислений в оперативной памяти (в ОЗУ, in-memory computing), предусматривающая размещение всех программ и данных в ОЗУ, без обращения за ними к дисковой подсистеме.

В целом можно сказать, что технологии больших данных после периода бурного роста устоялись, и их развитие сейчас идет эволюционным путем.

Почему это важно для бизнеса?

Данные накапливаются во всех компаниях, и часто они уже попадают в категорию больших данных. Такими данными в мире занимаются все крупные компании. IDC оценивает доходы, связанные с этими технологиями, в более чем $203 млрд к 2020 г. Роль технологий работы с большими данными только повысится, поскольку объемы оперативно поступающих данных с учетом данных интернета вещей (ИВ) будут неуклонно расти, поэтому для компаний важно иметь (создавать) инфраструктуру, способную не упустить выгоду от этого роста.