Недавно стало известно, что компания AMD прекращает производство графических ускорителей Radeon VII, которые не пробыли в продаже и года. Как показали тесты видеокарты Radeon RX 5700 XT, новинка способна заменить пользователям Radeon VII. Разница в стоимости между двумя ускорителями практически двукратная не в пользу зимней новинки, а в плане производительности Radeon RX 5700 XT отстает от Radeon VII лишь на 10%. Кроме того, ввиду использования сложного GPU и памяти HBM2 компания AMD не может снизить стоимость Radeon VII.
Как стало известно сегодня, к концу своего жизненного цикла пришли еще два графических адаптера калифорнийского процессорного гиганта. Речь идет о видеокартах Radeon RX Vega 64 и Radeon RX Vega 56, которые тоже снимаются с производства. В них также используется дорогая память HBM2, в связи с чем существенно снизить их стоимость компания AMD не в состоянии.
Рис.1 AMDRXVega 56 в исполнении от компании MSI
Отметим, что согласно первым тестам видеокарт поколения Navi, даже Radeon RX 5700 оказалась быстрее, чем Radeon RX Vega 64 при огромной разнице в энергопотреблении. На данный момент и Radeon RX Vega 64, и Radeon RX Vega 56 есть в продаже.
Рис.2 AMDRXVega 64 в исполнении от компании MSI
NighBandwidthMemory (НВМ)
НВМ — память с высокой пропускной способностью — высокопроизводительный интерфейс ОЗУ для DRAM с многослойной компоновкой кристаллов в микросборке от компаний AMD и Hynix, применяемая в высокопроизводительных видеокартах и сетевых устройствах; основной конкурент технологии Hybrid Memory Cube от Micron. AMD Fiji и AMD Arctic Islands являются первыми видеопроцессорами, использующими НВМ.
HBM была стандартизирована JEDEC в октябре 2013 года как JESD235, HBM2 стандартизована в январе 2016 года под кодом JESD235a. На середину 2016 года сообщалось о работах над HBM3 и более дешёвым вариантом HBM.
12 января 2016 HBM2-память была стандартизирована как JESD235a.
HBM2 позволяет разместить до 8 схем на штабеле, что удваивает пропускную способность.
AMD начала разработку HBM в 2008 году, чтобы решить проблему постоянно растущего энергопотребления и уменьшения форм-фактора памяти. Среди прочего, группой сотрудников AMD во главе с Брайаном Блэком разработана технологии упаковки интегральных схем в стек. Партнеры: SK Hynix, UMC, Amkor Technology и ASE были также вовлечены в разработку. Массовое производство началось на заводах Hynix в Ичхоне в 2015 году.
Революция: HBM2
В то время как производители GDDR пошли по пути совершенствования памяти предыдущего поколения, разработчики появившейся в 2013 году технологии HBM (High Bandwidth Memory — память с высокой пропускной способностью) используют совсем другой подход. Эта память подразумевает объединение микросхем в стек. Стеки располагаются на промежуточном слое — интерпозере. Задача интерпозера заключается в соединении дорожек между памятью и видеочипом. Благодаря коротким дорожкам (чипы памяти расположены на подложке GPU) достигается невероятная скорость и энергоэффективность. Однако, поскольку плотность хранения отдельно взятого стека в первом поколении ограничена гигабайтом, а размер интерпозера – четырьмя стеками, в сумме на GPU приходится только четыре гигабайта, а этого для поддержки игры в 4K, виртуальной реальности или высокопроизводительных вычислений слишком мало.
HBM2 – это память будущего GDDR5X позволяет выпускать доступные видеокарты с быстрой памятью большого объема.
Вторая модификация HBM2, которая вышла в начале 2016 года, решает данную проблему. Возможным это становится благодаря повышению плотности размещения данных на микросхему, увеличению тактовой частоты с 500 МГц до 2 ГГц и использованию режима псевдоканалов, который разбивает один аппаратный канал памяти на два виртуальных, что, подобно гиперпоточности ЦП, приводит к более эффективному задействованию ресурсов. Samsung запустила серийное производство чипов с четырьмя стеками, а SK Hynix планирует начать его в этом квартале. Спецификация теперь позволяет использовать до восьми микросхем в стопке. Исходя из этого, оба производителя намерены еще в этом году увеличить емкость стека до восьми гигабайт.
Первые устройства, которые фактически используют память HBM2, — это ускорители NVIDIA Tesla P100 для серверов и рабочих станций. Пропускная способность видеокарт на архитектуре Pascal с 16 Гбайт памяти достигает 720 Гбайт/с — это в три раза больше, чем пропускная способность предыдущих топовых карточек поколения NVIDIA Maxwell. AMD же планирует выпустить первые видеокарты на HBM2 в розничную продажу в начале 2017 года.
Сравниваем турбо-память для видеокарт: GDDR5X против HBM2
Виртуальная реальность требует графической производительности, в несколько раз превышающей таковую при использовании монитора. Количество ошибок программ по распознаванию речи методами глубинного обучения (deep learning) снижается на 40% при увеличении объемов анализируемых выборок в десять раз. И виртуальная реальность, и искусственный интеллект задействуют ресурсы графических процессоров, отлично подходящих для решения задач, хорошо поддающихся распараллеливанию, что, в свою очередь, требует памяти очень большой емкости и очень высокой скорости для обработки постоянно растущих объемов данных.
Компьютерные игры, которые становятся все более реалистичными, тоже жаждут быстрой видеопамяти. «Обычная» память типа DDR для ПК всегда была в лучшем случае слабым решением для требований видеокарт. Специально для использования в графических картах была разработана память GDDR (Graphics DDR), в настоящее время уже выросшая до пятого поколения. Однако из-за требований разрешения 4K, виртуальной реальности и Искусственного интеллекта даже она доходит до пределов своих возможностей. Новые технологии GDDR5X и HBM2 должны решить эту проблему.
GDDR5X вдвое превосходящая GDDR5 по пропускной способности.
Эволюция: GDDR5X
Новая спецификация GDDR5X была утверждена в январе этого года, а нынешним летом в продажу поступила первая видеокарта NVIDIA GeForce GTX 1080, оснащенная такой памятью.
В GDDR5X традиционная структура памяти, представленная отдельными микросхемами, соединенными с ГП линиями передачи данных, адаптирована под новые требования. При этом основная структура карты изменилась мало. Обновился техпроцесс, и в итоге все это вместе держит в узде цены на память GDDR5X. По сравнению с предыдущей, вышедшей еще в 2008 году памятью GDDR5, новая технология обладает следующими преимуществами.
Предвыборка данных (prefetch) увеличилась с 8n до 16n. Теперь благодаря оптимизации внутренних линий передачи данных за один цикл доступа к памяти контроллер может выбирать не 32, а все 64 байта на чип, в результате чего пропускная способность памяти увеличивается вдвое без необходимости повышения тактовой частоты. Благодаря улучшенному техпроцессу повысилась энергоэффективность: рабочее напряжение с 1,5 В снизилось до 1,35 В, что, в свою очередь, уменьшает тепловыделение.
Емкость отдельно взятой микросхемы новой памяти составляет 4, 8 или 16 Гбит (у GDDR5, для сравнения, — от 512 Мбит до 8 Гбит). Вместе с тем, помимо степеней двойки, спецификация включает два новых промежуточных объема — 6 и 12 Гбит, что позволяет более гибко варьировать общий объем наборной памяти, прежде всего в мобильных устройствах.
Список использованной литературы:
1. Список графических процессоров Nvidia: история изменений: https://ru.wikipedia.org/w/index.php?title=%D0%A1%D0%BF%D0%B8%D1%81%D0%BE%D0%BA_%D0%B3%D1%80%D0%B0%D1%84%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D1%85_%D0%BF%D1%80%D0%BE%D1%86%D0%B5%D1%81%D1%81%D0%BE%D1%80%D0%BE%D0%B2_Nvidia&stable=1 Текст: Электронный
2.Описание High Bandwidth Memory: https://ru.wikipedia.org/wiki/High_Bandwidth_Memory Текст: Электронный
3. Сравниваем турбо-память для видеокарт: GDDR5X против HBM2: https://ichip.ru/tekhnologii/sravnivaem-turbo-pamyat-dlya-videokart-gddr5x-protiv-hbm2-96398 Текст: электронный
4. Поставки графических процессоров AMD Vega первого поколения прекращаются: https://3dnews.ru/989641 Текст: электронный.