Цифровизация Инфраструктура Электроника

20 Июня 2016 18:08 20 Июн 2016 18:08 |

Nvidia Tesla P100 ускоряет приложения глубокого обучения и высокопроизводительные вычисления

Компания Nvidia представила передовой графический ускоритель для сверхмасштабируемых дата-центров — Nvidia Tesla P100. Как сообщили CNews в Nvidia, Tesla P100, новейшее решение для платформы ускоренных вычислений Nvidia Tesla, позволяет создавать новый класс серверов с производительностью уровня нескольких сотен классических серверов на базе CPU.

Nvidia Tesla P100 на базе Pascal

Современные дата-центры — обширные сетевые инфраструктуры с многочисленными взаимосвязанными CPU-серверами — обрабатывают огромное количество транзакций, например, веб-сервисов. Но их мощи недостаточно для нового поколения научных приложений и задач, связанных с искусственным интеллектом, для которых требуются сверхэффективные, ультраскоростные серверные узлы, указали в компании. Ускоритель Tesla P100, основанный на новой архитектуре Nvidia Pascal с пятью передовыми технологиями, обеспечивает высокую производительность и экономичность для самых ресурсоемких приложений.

Д-р Джон Келли III (John Kelly III), старший вице-президент Cognitive Solutions и IBM Research, отметил: «Искусственный интеллект и познание требуют абсолютно нового подхода и нового уровня вычислений. Графические процессоры Nvidia совместно с технологией OpenPower уже ускоряют обучение Watson новым умениям. Связка из архитектуры Power от IBM и архитектуры Pascal от Nvidia с интерфейсом NVLink вместе еще больше ускорит изучение процессов познания, ускорив развитие искусственного интеллекта».

По информации Nvidia, в целом Tesla P100 — первый ускоритель Nvidia со скоростью вычислений двойной и одинарной точности в 5 и 10 терафлопс соответственно, который, по задумке производителя, позволит повысить скорость обработки данных и ускорит открытия в широком спектре областей. Решение обеспечивает высокую производительность и масштабируемость благодаря использованию пяти прогрессивных технологий.

Архитектура Nvidia Pascal для экспоненциального роста производительности

По утверждению представителей компании, Tesla P100 на базе архитектуры Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе архитектуры прошлого поколения Nvidia Maxwell.

Nvidia NVLink для масштабируемости приложений

Nvidia NVLink, высокоскоростной интерфейс для связи между несколькими графическими процессорами, распределяет нагрузку между GPU, увеличивая пропускную способность. NVLink позволяет связать до восьми GPU Tesla P100, повышая производительность в узле. IBM уже внедрила NVLink в свои процессоры Power8 для высокоскоростной коммуникации между CPU и GPU.

16нм FinFET для высокой энергоэффективности

Процессор Pascal обладает 15,3 млрд транзисторов, построенных на базе 16нм процесса FinFET. Он создан, чтобы обеспечить требуемую производительность и энергоэффективность для нагрузок с практически неограниченными вычислительными требованиями.

CoWoS с HBM2 для больших нагрузок

Архитектура Pascal объединяет процессор и данные в одном пакете, чтобы оптимизировать вычисления. Инновационный подход к строению памяти, Chip-on-Wafer-on-Substrate (CoWoS) с HBM2, повышает пропускную способность памяти в 3 раза, до 720ГБ/с, по сравнению с архитектурой Maxwell.

<p>Петр Дубенсков, группа Rubytech: В долгосрочной перспективе дешевле делегировать построение инфраструктуры производителю ПАК</p>

Петр Дубенсков, группа Rubytech: В долгосрочной перспективе дешевле делегировать построение инфраструктуры производителю ПАК Цифровизация

Новые алгоритмы искусственного интеллекта для пиковой производительности

Новые инструкции половинной точности обеспечивают пиковую производительность свыше 21 терафлопса в задачах глубокого обучения, указали в Nvidia.

«Графический ускоритель Tesla P100 поднимает на новый уровень производительность в ряде приложений высокопроизводительных вычислений и глубокого обучения, включая приложение молекулярной динамики Amber, которое работает быстрее на 1-ом серверном узле с графическими процессорами Tesla P100, чем на 48 двухсокетных серверных узлах», — заявили в компании.

Для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU Tesla P100. А популярное приложение прогнозирования погоды COSMO работает быстрее на восьми GPU Tesla P100, чем на 27 двухсокетных серверах, рассказали в Nvidia.

7 ошибок при внедрении ИТ-решений в МФО и как их избежать Цифровизация

Обновления в Nvidia SDK

Nvidia также анонсировала ряд обновлений в Nvidia SDK, платформе разработки для GPU-вычислений. В число обновлений входит Nvidia CUDA 8. Новейшая версия платформы параллельных вычислений Nvidia представляет разработчикам прямой доступ к новым возможностям Pascal, включая унифицированную память и NVLink. Кроме того, в актуальный релиз входит библиотека анализа графов nvGRAPH, которую можно использовать для расчета траекторий, информационной безопасности и анализа логистики, что включает в сферу применения GPU-ускоренных вычислений аналитику Big Data.

В то же время, компания анонсировала cuDNN версии 5, GPU-ускоряемую библиотеку примитивов для сетей глубокого обучения. cuDNN 5 включает поддержку GPU Pascal, ускорение рекуррентных нейронных сетей, используемых для видео и других последовательных данных, а также ряд улучшений, предназначенных для использования в медицинской, нефтегазовой и других областях промышленности. cuDNN ускоряет работу фреймворков глубокого обучения, включая TensorFlow от Google, Caffe от Университета Беркли, Theano от Университета Монреаля и Torch от Нью-Йоркского Университета, которые, в свою очередь, находятся в основе решений от Amazon, Facebook, Google и других компаний, отметили в Nvidia.

Доступность

Графические ускорители Nvidia Tesla P100 на базе Pascal появятся в составе новой системы глубокого обучения Nvidia DGX-1 в июне. Также ожидается, что новый процессор появится в составе серверов от ведущих производителей в начале 2017 г.

Что лучше — ГЛОНАСС или GPS: главные различия систем навигации

Татьяна Короткова

Подписаться на новости

Короткая ссылка

Nvidia Tesla P100 ускоряет приложения глубокого обучения и высокопроизводительные вычисления

Другие материалы рубрики

Конференции

Business Process Management 2026

Технологии искусственного интеллекта 2026

Цифровизация HR 2026

CNewsMarket

IP-телефония

RPA

Kubernetes

Dedicated

Техника

Лучшие внешние звуковые карты до 35 000 рублей: выбор ZOOM

Лучшие видеорегистраторы в 2026 году: хиты продаж

Как платить смартфоном в 2026 году: все способы

Наука

Как узнать, какой была жизнь на Земле до древнейшего известного предка?

Переписана история последних дней динозавров: вместо того чтобы бороться за выживание, они процветали

Ученые выяснили, что при недостатке сна мозг запускает странную «очистку»

Топ-10
ИТ-трендов
в России на 2026 г.

Топ-25 поставщиков инфраструктуры дата-центров

Топ-25 поставщиков инфраструктуры дата-центров

Топ-10
ИТ-трендов
в России на 2026 г.

Студентам говорят «используй ИИ при написании диплома, только объясни,
где,
как и для чего»

«Цифра» помогает ювелирным компаниям в условиях беспрецедентного роста стоимости драгоценных металлов

Nvidia Tesla P100 ускоряет приложения глубокого обучения и высокопроизводительные вычисления

Другие материалы рубрики

Конференции

Business Process Management 2026

Технологии искусственного интеллекта 2026

Цифровизация HR 2026

CNewsMarket

IP-телефония

RPA

Kubernetes

Dedicated

Техника

Лучшие внешние звуковые карты до 35 000 рублей: выбор ZOOM

Лучшие видеорегистраторы в 2026 году: хиты продаж

Как платить смартфоном в 2026 году: все способы

Наука

Как узнать, какой была жизнь на Земле до древнейшего известного предка?

Переписана история последних дней динозавров: вместо того чтобы бороться за выживание, они процветали

Ученые выяснили, что при недостатке сна мозг запускает странную «очистку»

Топ-10 ИТ-трендов в России на 2026 г.

Топ-25 поставщиков инфраструктуры дата-центров

Топ-25 поставщиков инфраструктуры дата-центров

Топ-10 ИТ-трендов в России на 2026 г.

Студентам говорят «используй ИИ при написании диплома, только объясни, где, как и для чего»

«Цифра» помогает ювелирным компаниям в условиях беспрецедентного роста стоимости драгоценных металлов

Топ-10
ИТ-трендов
в России на 2026 г.

Топ-10
ИТ-трендов
в России на 2026 г.

Студентам говорят «используй ИИ при написании диплома, только объясни,
где,
как и для чего»