GPU NVIDIA A100 ускоряет обучение ИИ и инференс до 20
17.05.2020
NVIDIA объявила о начале производства и поставок первого графического процессора на базе архитектуре NVIDIA® Ampere - NVIDIA A100.
Благодаря передовой архитектуре NVIDIA Ampere графический процессор A100 обладает максимальным приростом производительности среди всех восьми поколений GPU NVIDIA и создает единую платформу для обучения ИИ и инференса, ускоряя производительность до 20 раз по сравнению с предшественниками. Универсальный ускоритель A100 также предназначен для задач анализа данных, научных вычислений и облачной графики.
«Стремительное распространение облачных вычислений и ИИ кардинально меняет архитектуру дата-центров: CPU-серверы сегодня уступают место GPU-ускоренным вычислениям, - говорит Дженсен Хуанг (Jensen Huang), основатель и генеральный директор NVIDIA. - Графические процессоры NVIDIA A100 в 20 раз быстрее в ИИ-задачах и ускоряют машинное обучение на всех этапах – от анализа данных до обучения и инференса. Впервые вертикально и горизонтально масштабируемые задачи можно ускорять на одной платформе. NVIDIA A100 одновременно увеличивает полосу пропускания и снижает стоимость дата-центров».
Новые адаптивные вычислительное технологии в A100 позволяют подобрать необходимую вычислительную мощь для каждой задачи. Каждый GPU A100 может быть разделен на максимум семь независимых инстансов для задач инференса, а благодаря интерконнекту третьего поколения NVIDIA NVLink® графические процессоры A100 можно объединить в один гигантский GPU для работы с моделями большого для работы с масштабными задачами.
Ожидается, что процессоры A100 интегрируют в свои решения следующие поставщики облачных услуг и сборщики систем: Alibaba Cloud, Amazon Web Services (AWS), Atos, Baidu Cloud, Cisco, Dell Technologies, Fujitsu, GIGABYTE, Google Cloud, H3C, Hewlett Packard Enterprise (HPE), Inspur, Lenovo, Microsoft Azure, Oracle, Quanta/QCT, Supermicro и Tencent Cloud.
Широкое применение
Компания Microsoft одной из первых приобрела графические процессоры NVIDIA A100, чтобы задействовать их преимущества в производительности и масштабируемости для задач, связанных с обработкой языка, речи, компьютерного зрения, мультимодальности и не только.
DoorDash, платформа доставки еды по требованию, служащая жизненной артерией для ресторанов во время пандемии, отмечает, что наличие гибкой ИИ-инфраструктуры является важным фактором для возможности масштабировать бизнес, одновременно повышая его эффективность и снижая издержки.
Процессоры A100 также будут использоваться в суперкомпьютерах нового поколения следующих лабораторий и исследовательских организаций: Университета Индианы (США), Юлихского исследовательского центра (Германия), Технологического Института Карлсруэ (Германия), Общества Макса Планка (Max Planck Computing and Data Facility, Германия), Научно-исследовательского вычислительного центра Министерства энергетики США в Национальной лаборатории Лоуренса в Беркли.
Пять инноваций A100
Вычислительные возможности GPU NVIDIA A100 стали возможны благодаря пяти ключевым инновациям:
Архитектура Ampere — в основе GPU A100 лежит новая архитектура NVIDIA Ampere с более чем 54 млрд транзисторов, что делает его крупнейшим в мире 7-нм процессором.
Тензорные ядра третьего поколения с TF32 — получившие широкое применение тензорные ядра NVIDIA стали еще более гибкими, быстрыми и простыми в использовании. Теперь они поддерживают TF32 для ИИ, что поднимает скорость ИИ-вычислений до 20 раз для FP32 без каких-либо изменений кода. Также, тензорные ядра теперь поддерживают FP64, что повышает скорость работы в HPC-приложениях до 2.5 раз по сравнению с предыдущим поколением.
Multi-instanceGPU (MIG) позволяет разделить A100 на максимум семь отдельных GPU для выполнения задач разной степени сложности для оптимизации использования GPU и эффективности инвестиций.
NVIDIANVLink третьего поколения — удваивает скорость высокоскоростного соединения между GPU для более эффективного масштабирования вычислений.
Structuralsparsity— технология удваивает производительность, используя разреженность данных в задачах ИИ.
Вместе эти возможности превращают NVIDIA A100 в идеальное решение для разнообразных требовательных задач, включая обучение нейросетей и инференс, научное моделирование, диалоговый ИИ, рекомендательные системы, геномику, анализ данных, сейсмическое моделирование и финансовое прогнозирование.
NVIDIAA100 доступен в новых системах, скоро в облаке
Система NVIDIA DGX A100™ включает восемь GPU NVIDIA A100, связанных интерфейсом NVIDIA NVLink. Система уже доступна у NVIDIA и будет доступна у партнеров компании.
Сервисы на базе A100 планируют предоставлять Alibaba Cloud, AWS, Baidu Cloud, Google Cloud, Microsoft Azure, Oracle и Tencent Cloud.
Ожидается широкая линейка серверов на базе A100 от ведущих производителей, включая Atos, Dell Technologies, Fujitsu, GIGABYTE, H3C, HPE, Inspur, Lenovo, Quanta/QCT и Supermicro.
Чтобы ускорить разработку серверов, NVIDIA создала референсный дизайн модулей HGX A100 в форме интегрируемых плат с различными конфигурациями GPU.
Соединение 4-х GPU в модулях HGX A100 обеспечивает технология NVLink. В модулях же с восьмью GPU взаимодействие GPU-to-GPU происходит через NVIDIA NVSwitch™. Благодаря новой технологии MIG, модуль HGX A100 можно разбить на 56 отдельных GPU, каждый из которых будет быстрее NVIDIA T4. Общая производительность сервера с восьмью GPU на борту в ИИ-вычислениях составляет 10 петафлопс.
Программные оптимизации NVIDIAв A100
NVIDIA также анонсировала несколько обновлений своего программного стека, включая новые версии более чем 50 библиотек CUDA-X, используемых для ускорения графики, моделирования и ИИ; для CUDA 11; для NVIDIA Jarvis, мультимодального фреймворка для диалоговых ИИ-сервисов; для NVIDIA Merlin, фреймворка для рекомендательных систем; и NVIDIA HPC SDK, который включает компиляторы, библиотеки и инструменты, помогающие HPC-разработчикам отлаживать и оптимизировать свой код для A100.
Официально представлены высокопроизводительные видеокарты в серии Republic of Gamers (ROG): Matrix R9 290X и Matrix GTX 780 Ti. Созданные на базе новых графических процессоров R9 290X и GeForce GTX 780 Ti, эти модели можно назвать воплощением ...
NVIDIA представила платформу ускоренных вычислений NVIDIA EGX , которая позволяет компаниям использовать ИИ с низкими задержками на периферийных устройствах: получать непрерывный поток данных от 5G станций, складов, магазинов, заводов и других мест, ...
Архитектура NVIDIA Kepler, которая появилась в марте, положена в основу нового графического процессора NVIDIA GeForce GTX 660 Ti, поступившего на рынок по цене 299 долларов США. GTX 660 Ti обеспечивает кардинально новый уровень производительности в ...
В сеть интернет утекли характеристики и изображения новой видеокарты NVIDIA GeForce GTX Titan X. Информация о новом флагмане, который еще готовится к выходу, была опубликована сайтом Videocardz.com. Стоит напомнить, что официальный анонс NVIDIA ...
NVIDIA объявила о доступности архитектуры NVIDIA Ampere для миллионов новых ПК-геймеров с выходом графического процессора GeForce® RTX™ 3060. Благодаря эффективной и производительной архитектуре и второму поколению технологии NVIDIA RTX™, ...
Компания NVIDIA представила 3D-карту TITAN V с GPU на базе передовой архитектуры GPU NVIDIA Volta. TITAN V, представленный президентом NVIDIA Дженсеном Хуангом (Jensen Huang) на ежегодной конференции NIPS, демонстрирует исключительную вычислительную ...
NVIDIA официально анонсировала две новые видеокарты на основе архитектуры Pascal. Новинки – модели GeForce GTX 1050 и 1050 Ti начального уровня. Как утверждает производитель, видеокарты отлично подойдут начинающим геймерам, особенно тем, кто ...
Геймерам придется по душе производительность GTX 680, а также тот факт, что ей не требуются громкие вентиляторы и экзотические блоки питания. Пользователям ультрабуков понравится семейство GT 600M за ее производительность и экономичность, так ...
Получивший поддержку Google, Intel, Baidu, NVIDIA и десятков других лидеров индустрии, новый пакет MLPerf измеряет широкий спектр нагрузок в задачах глубокого обучения. Первый в индустрии пакет с объективной оценкой скорости вычислений для ИИ ...
На мероприятии GDC 2016 компания AMD официально представила новую видеокарту Radeon Pro Duo. Как утверждает производитель, на данный момент это самая мощная видеокарта в мире. Устройство позиционируется как видеокарта для девайсов виртуальной ...
Advanced Micro Devices официально анонсировала релиз видеокарты Radeon R7250X, которая принадлежит к категории видеоадаптеров начального уровня. Кстати, новинка, по сути, является видеокартой Radeon HD 7770 GHz Edition, только что выпускается под ...