GPU NVIDIA A100 ускоряет обучение ИИ и инференс до 20
17.05.2020
NVIDIA объявила о начале производства и поставок первого графического процессора на базе архитектуре NVIDIA® Ampere - NVIDIA A100.
Благодаря передовой архитектуре NVIDIA Ampere графический процессор A100 обладает максимальным приростом производительности среди всех восьми поколений GPU NVIDIA и создает единую платформу для обучения ИИ и инференса, ускоряя производительность до 20 раз по сравнению с предшественниками. Универсальный ускоритель A100 также предназначен для задач анализа данных, научных вычислений и облачной графики.
«Стремительное распространение облачных вычислений и ИИ кардинально меняет архитектуру дата-центров: CPU-серверы сегодня уступают место GPU-ускоренным вычислениям, - говорит Дженсен Хуанг (Jensen Huang), основатель и генеральный директор NVIDIA. - Графические процессоры NVIDIA A100 в 20 раз быстрее в ИИ-задачах и ускоряют машинное обучение на всех этапах – от анализа данных до обучения и инференса. Впервые вертикально и горизонтально масштабируемые задачи можно ускорять на одной платформе. NVIDIA A100 одновременно увеличивает полосу пропускания и снижает стоимость дата-центров».
Новые адаптивные вычислительное технологии в A100 позволяют подобрать необходимую вычислительную мощь для каждой задачи. Каждый GPU A100 может быть разделен на максимум семь независимых инстансов для задач инференса, а благодаря интерконнекту третьего поколения NVIDIA NVLink® графические процессоры A100 можно объединить в один гигантский GPU для работы с моделями большого для работы с масштабными задачами.
Ожидается, что процессоры A100 интегрируют в свои решения следующие поставщики облачных услуг и сборщики систем: Alibaba Cloud, Amazon Web Services (AWS), Atos, Baidu Cloud, Cisco, Dell Technologies, Fujitsu, GIGABYTE, Google Cloud, H3C, Hewlett Packard Enterprise (HPE), Inspur, Lenovo, Microsoft Azure, Oracle, Quanta/QCT, Supermicro и Tencent Cloud.
Широкое применение
Компания Microsoft одной из первых приобрела графические процессоры NVIDIA A100, чтобы задействовать их преимущества в производительности и масштабируемости для задач, связанных с обработкой языка, речи, компьютерного зрения, мультимодальности и не только.
DoorDash, платформа доставки еды по требованию, служащая жизненной артерией для ресторанов во время пандемии, отмечает, что наличие гибкой ИИ-инфраструктуры является важным фактором для возможности масштабировать бизнес, одновременно повышая его эффективность и снижая издержки.
Процессоры A100 также будут использоваться в суперкомпьютерах нового поколения следующих лабораторий и исследовательских организаций: Университета Индианы (США), Юлихского исследовательского центра (Германия), Технологического Института Карлсруэ (Германия), Общества Макса Планка (Max Planck Computing and Data Facility, Германия), Научно-исследовательского вычислительного центра Министерства энергетики США в Национальной лаборатории Лоуренса в Беркли.
Пять инноваций A100
Вычислительные возможности GPU NVIDIA A100 стали возможны благодаря пяти ключевым инновациям:
Архитектура Ampere — в основе GPU A100 лежит новая архитектура NVIDIA Ampere с более чем 54 млрд транзисторов, что делает его крупнейшим в мире 7-нм процессором.
Тензорные ядра третьего поколения с TF32 — получившие широкое применение тензорные ядра NVIDIA стали еще более гибкими, быстрыми и простыми в использовании. Теперь они поддерживают TF32 для ИИ, что поднимает скорость ИИ-вычислений до 20 раз для FP32 без каких-либо изменений кода. Также, тензорные ядра теперь поддерживают FP64, что повышает скорость работы в HPC-приложениях до 2.5 раз по сравнению с предыдущим поколением.
Multi-instanceGPU (MIG) позволяет разделить A100 на максимум семь отдельных GPU для выполнения задач разной степени сложности для оптимизации использования GPU и эффективности инвестиций.
NVIDIANVLink третьего поколения — удваивает скорость высокоскоростного соединения между GPU для более эффективного масштабирования вычислений.
Structuralsparsity— технология удваивает производительность, используя разреженность данных в задачах ИИ.
Вместе эти возможности превращают NVIDIA A100 в идеальное решение для разнообразных требовательных задач, включая обучение нейросетей и инференс, научное моделирование, диалоговый ИИ, рекомендательные системы, геномику, анализ данных, сейсмическое моделирование и финансовое прогнозирование.
NVIDIAA100 доступен в новых системах, скоро в облаке
Система NVIDIA DGX A100™ включает восемь GPU NVIDIA A100, связанных интерфейсом NVIDIA NVLink. Система уже доступна у NVIDIA и будет доступна у партнеров компании.
Сервисы на базе A100 планируют предоставлять Alibaba Cloud, AWS, Baidu Cloud, Google Cloud, Microsoft Azure, Oracle и Tencent Cloud.
Ожидается широкая линейка серверов на базе A100 от ведущих производителей, включая Atos, Dell Technologies, Fujitsu, GIGABYTE, H3C, HPE, Inspur, Lenovo, Quanta/QCT и Supermicro.
Чтобы ускорить разработку серверов, NVIDIA создала референсный дизайн модулей HGX A100 в форме интегрируемых плат с различными конфигурациями GPU.
Соединение 4-х GPU в модулях HGX A100 обеспечивает технология NVLink. В модулях же с восьмью GPU взаимодействие GPU-to-GPU происходит через NVIDIA NVSwitch™. Благодаря новой технологии MIG, модуль HGX A100 можно разбить на 56 отдельных GPU, каждый из которых будет быстрее NVIDIA T4. Общая производительность сервера с восьмью GPU на борту в ИИ-вычислениях составляет 10 петафлопс.
Программные оптимизации NVIDIAв A100
NVIDIA также анонсировала несколько обновлений своего программного стека, включая новые версии более чем 50 библиотек CUDA-X, используемых для ускорения графики, моделирования и ИИ; для CUDA 11; для NVIDIA Jarvis, мультимодального фреймворка для диалоговых ИИ-сервисов; для NVIDIA Merlin, фреймворка для рекомендательных систем; и NVIDIA HPC SDK, который включает компиляторы, библиотеки и инструменты, помогающие HPC-разработчикам отлаживать и оптимизировать свой код для A100.
Графический процессор GeForce GTX 780 обеспечивает высокую производительность и плавную картинку в компьютерных играх нового поколения, таких, как Call of Duty: Ghosts, Watch Dogs и Battlefield 4. Кроме того, финальная версия программного ...
ASUS объявила о выходе видеокарты R7 265 DirectCU II, созданной на базе графического процессора AMD Radeon R7 265. В этом устройстве реализовано множество эксклюзивных технологий ASUS, включая систему охлаждения DirectCU II, высококачественные ...
ASUS представила двухпроцессорную видеокарту R9 295X2, оснащенную 8 гигабайтами скоростной памяти GDDR5 и высокоэффективной гибридной системой охлаждения. Для управления всеми параметрами устройства предлагается эксклюзивная программная утилита GPU ...
ASUS представила новый продукт в геймерской серии Republic of Gamers (ROG) - видеокарту Striker Platinum GTX 760 с графическим процессором NVIDIA GeForce GTX 760 и сразу четырьмя гигабайтами высокоскоростной памяти GDDR5. Обладая таким же ...
Профессиональная видеокарта AMD FirePro W600 -- первая профессиональная видеокарта компании, в которой применяется архитектура AMD Graphics Core Next и 28-нм технология производства. Она предназначена для управления настенными многоэкранными ...
Компания Intel поведала об особенностях новых видеокарт, встроенных в процессоры Intel Core четвертого поколения. На этот раз производитель решил создать три разных типа графических адаптеров, для того чтобы что-то по своему вкусу смогли найти ...
MSI представила геймерскую видеокарту GeForce GTX 780 Gaming, которая получила 3 ГБ памяти типа GDDR5, а также программное обеспечение, позволяющее пользователям нажатием одной кнопки переключаться между игровым и энергосберегающим режимами. Кроме ...
NVIDIA представила графические процессоры серии GeForce RTX ™ 30 на базе архитектуры NVIDIA Ampere, которые демонстрируют самый большой в истории GeForce® отрыв в производительности от предыдущего поколения. Задавая новые стандарты ...
Inno3D отчиталась о запуске новых видеокарт iChill GeForce GTX 650 Ti Boost и Inno3D GeForce GTX 650 Ti Boost. Обе видеокарты оснащены 768 ядрами CUDA, 192-битной памятью GDDR5 RAM объемом 2ГБ и могут похвастаться разогнанными частотами работы – ...
GIGABYTE анонсировала игровую видеокарту премиум-категории – GV-TITANBLKD5-6GD-B. Основанная на графическом процессоре GeForce GTX TITAN BLACK, GV-TITANBLKD5-6GD-B построена с использованием 28-нм технологического процесса, имеет 6 ГБ видеопамяти ...
Одними из важнейших параметров компьютеров являются характеристики его видеокарты. Перед тем, как купить выдеокарту, каждый пользователь должен понимать какими они могут быть и как устроены. Существуют 2 основных типа таких устройств: - ...
Inno3D отчиталась о запуске новой видеокарты Inno3D GeForce GTX 780. Новинка знаменует революцию в игровой производительности, обеспечивая очень быструю, плавную и тихую работу. Видеокарта оборудована мощным GPU NVIDIA Kepler с 2304 ядрами, что на ...