Amd rx 5700 xt обзор

Обзор AMD Radeon RX5700 XT: архитектура RDNA — провал или гениальное улучшение?

Недавно AMD пошатнула лидерство Intel на рынке флагманских процессоров. Теперь настал черёд потягаться за сегмент топовых видеокарт — с помощью линейки Radeon RX 5000, представленной публике летом. Новинки получили долгожданный GPU NAVI и свежую архитектуру RDNA. Спасёт ли это ситуацию и как обстоит дело с трассировкой лучей — разбираемся в обзоре.

Что было до? Архитектуры TeraScale и GCN

Чтобы понять новшества архитектуры RDNA, необходимо разобраться, что было до неё. История современных Radeon началась с перехода к унифицированным шейдерам. С их помощью AMD хотела обеспечить выдающуюся производительность GPU — а там уже пусть игровые студии решают, на что её пустить. Предполагалось, что с переездом на DX10 и OpenGL 3.0 на видеокарту ляжет множество сложных задач, поэтому она будет загружена гораздо сильнее, чем раньше. Вместо разделения на вершинные и фрагментные шейдеры применили набор универсальных блоков: разработчики сами могут писать код игрового движка, выбирая, чем и в какой момент займётся GPU. Использование одной длинной инструкции (VLIW) с длительной обработкой отлично вписалось в концепцию «одна сложная операция — много данных», да ещё и на высокопараллельном железе. Распределение нагрузки и оптимизацию столь сложных задач возложили на компилятор и драйвер.

От D3D9 к D3D10 и унифицированным шейдерам

Архитектура TeraScale разрабатывалась в нулевые с прицелом на активное внедрение технологий, которые только начинали жизненный цикл. Высокое разрешение текстур, бамп-маппинг и карты нормалей, HDR и глобальное освещение требовали приличную пропускную способность как памяти, так и GPU. Спецэффекты больше не дополняли кадр в отдельных местах, а многократно применялись буквально в каждом пикселе.

Сравните Half-Life 2 (2004) и Titanfall (2014) — насколько изменилась картинка. А ведь в основе один и тот же движок — Source.

Железо и впрямь получилось выдающимся, но вот оптимизация драйверов оставляла желать лучшего. В негативном ключе вспоминают качество ПО «красных» до сих пор — кто в шутках, а кто всерьёз, не владея актуальной информацией. С выходом DirectX11 и появлением прямого доступа к GPU стало ясно, что дальнейшая доработка TeraScale нецелесообразна. Если уж автоматика не могла разрулить нагрузку по сложной архитектуре графического чипа, то что говорить про ручное управление? На замену «тераскейлу» пришёл чип Graphics Core Next (GCN), который лёг в основу Radeon 7970 и консолей восьмого поколения (Xbox One, PlayStation 4).

Внутреннее устройство видеоядра сильно усложнилось.

Для обеспечения схожего уровня производительности GCN требовалось больше управляющей логики, зато упростился сам процесс постановки задач для шейдерных процессоров. Теперь разработчики могли не только взаимодействовать с моделями и текстурами, но и производить общие вычисления. Инженеры AMD планировали, что центральный процессор займётся выполнением скриптов, обсчётом AI и выдачей команд на отрисовку. А фотореалистичная графика, сложная физика и вспомогательные вычисления будут проводиться на GPU.

D3D12 и прямое управления графическим конвейером

Новые API позволили при схожем уровне производительности GPU реализовывать потрясающие спецэффекты за счёт эффективной загрузки железа сложной математикой. Красоты, на которые раньше компьютеру не хватало ресурсов, стало обыденностью. Например, освещение с честным преломлением лучей, активное применение тесселяции, различные эффекты, требующие постоянного обращения к карте глубин (боке, объёмный туман, длинные тени), пообъектное размытие моделей и даже их отдельных частей.

Сильные и слабые стороны предшественника

Управление видеокартой напрямую, как в консолях, — это удобно, особенно если речь про огромный объём вычислений для каждого кадра. Писать код для параллельного выполнения чрезвычайно сложно (хотя бы по той причине, что человеческий мозг исполняет осознанные задачи последовательно, быстро переключаясь между контекстами). Поэтому архитектура GCN проектировалась с прицелом на предсказуемость поведения и временных затрат на операции разного рода. 16-битные вычислительные блоки были сгруппированы по 64 штуки в один юнит и получили общий 64-битный планировщик инструкций. Так программист мог разом выдавать одну команду на четыре такта для работы на 64 ядрах.

Проблема пришла откуда не ждали: революцию отменили приставки.

Из-за сравнительно слабой начинки консолей прогнозы по перспективам 3D-графики не совпали с реальностью. Вместо повального увлечения всякими Ultra HD студии бросились развивать «визуальные обманки»: использовали низкие разрешения отрисовки и сложные спецэффекты. В ход шли даже данные с предыдущего кадра — зачем тратить ресурсы на обсчёты того, что почти не изменилось? Архитектура, эффективная при одинаковой нагрузке на большое число одинаковых ядер, оказалась не лучшим решением в ситуациях, когда требовалось выполнять разные вычисления на малых объёмах данных. В консолях это было незаметно из-за скромных возможностей видеоядра, под завязку загруженного задачами на отрисовку. А с выходом PS4 Pro и Xbox One X сохранилась общая тенденция к целевым 30 fps, но в более высоком разрешении. Исключения, разумеется, случались, но не такие частые.

Нововведения в RDNA

Первое, что нужно отметить, — RDNA в текущем виде нельзя назвать полностью новой архитектурой. Да, изменений немало, но это не тотальная смена дизайна, как было, например, в случае перехода от DX9 к DX10 или замены VLIW TeraScale на GCN. Общая логика и устройство GPU на базе RDNA взяты у предыдущего поколения. Просто инженеры решили технические проблемы, которые ограничивали потенциал мощнейшего железа, — и дело не в семи нанометрах или высоких рабочих частотах, а в эффективной загрузке видеокарты.

Конец жизни текущих консолей. Актуальные технологии в играх

Проблему невозможности честной отрисовки суперсложных кадров в высоком разрешении перестали решать в лоб. Научный подход к развитию алгоритмов масштабирования породил много новых технологий, обманывающих пользователя. Динамическое изменение разрешения отрисовки (как общее, определяемое сложностью кадра, так и частное, зависящее от важности объекта в сцене) позволило не выполнять лишних расчётов там, где пользователь не заметит разницы. Обучение нейросетей привело к созданию алгоритмов масштабирования и сглаживания в условиях недостатка данных — всё для эффективной экономии ресурсов: картинка ухудшается на 5-10%, зато вычислений меньше уже на 30-50%. Вершиной развития DX12 стала аппаратно-ускоренная трассировка реалистичного освещения и отражений.

Изменения в архитектуре: причины и следствия

Одна из основных проблем GCN — недостаточная гибкость. Видеокарта загружалась на 100%, когда обсчитывала кадр в высоком разрешении, однако начинала сдавать позиции, если картинка была сравнительно простой. Ведь выполнять множество одинаковых операций над различными данными не требовалось. Аналогичным образом обстояли дела с короткими инструкциями — 16-битные операции делались с той же скоростью, что и 64-битные (за 4 такта). То есть на графиках производительности GPU был занят, а в реальности — ждал завершения «пустых» тактов для выполнения следующей задачи.

Блоку из 64 ядер сохранили общую логику, но внутри поделили пополам, поставив каждой половинке собственный планировщик. Так GPU может гибче реагировать на различные условия работы. Изменился и дизайн ядер: вместо запуска длинной 64-битной инструкции за несколько тактов теперь используются короткие 32-битные, причём выполняются они за один такт. Теоретически это ускоряет операции от двух до четырёх раз, в зависимости от их сложности. На практике прирост меньше — помимо самих вычислений, есть операции с памятью (чтение и запись), имеющей задержки ввода-вывода. Да и шейдеры обсчитываются не одновременно, а последовательно наслаиваются на результаты вычислений предыдущих.

Графический конвейер упростили, а GPU стал гибче реагировать на различные ситуации.

Улучшили и 7-нм техпроцесс, впервые применённый в Radeon VII (архитектура GCN). Увы, здесь конкретных подробностей не раскрывают, но энергоэффективность Navi относительно Vega и Polaris подросла. Подсистема памяти относительно простая — вместо дорогой HBM2, которой оснащали прошлогодние «Веги», применили банальную GDDR6. По сравнению с прошлым поколением пропускная способность практически не пострадала. И даже выросла, если сопоставить с бюджетной линейкой Polaris, оснащённой GDDR5.

Проверяем на практике

Само собой, объёмная теория тут не для красоты. Эффективность нововведений мы протестировали на двух моделях семейства Navi — AMD Radeon RX 5700 (36 CU) и RX 5700 XT (40 CU). Для оценки результата сравним fps с прямыми конкурентами «зелёных». Для полноты картины мы взяли игры, имеющие встроенные бенчмарки, и усреднили результаты трёх прогонов тестов — так результат нагляднее.

Конфигурация демостенда

Свежие «Радеоны» показали себя превосходно. Эффективность нововведений наглядно отражает ситуация с RX Vega 64 — на бумаге она в полтора раза мощнее младшей RX 5700, а на практике показывает сравнимые цифры. Обе новинки вписались между непосредственными конкурентами и их более дорогими альтернативами — серией RTX Super. Прямого соперничества не вышло: при сопоставимых характеристиках модели Radeon либо дешевле, либо мощнее RTX 2060 Super. Правда, у NVIDIA всё ещё остаётся трассировка лучей…

Но и на этот случай у AMD есть козырь в рукаве.

Из официальных заявлений и многочисленных утечек известно, что следующее поколение консолей Xbox и PlayStation вновь получит начинку AMD — центральный процессор на базе Ryzen 3000 и графический ускоритель с архитектурой NAVI и поддержкой трассировки освещения. У RX 5700 и 5700 XT отсутствуют специализированные модули для аппаратного ускорения подобных расчётов — а без них производительность столь низкая, что о полноценном применении в играх можно забыть. Вместе с тем в сеть попал патент, рассказывающий о планах AMD по внедрению RT.

Что нас ждёт?

«Красные», в отличие от NVIDIA, отказались от использования выделенных RT-ядер. Ведь они усложняют архитектуру, занимают место на кристалле, удорожают производство и не выполняют никаких других задач, кроме злосчастного рейтрейсинга. Необходимую логику внедрят непосредственно в каждый «вычислительный юнит» — с прямым доступом к данным, которые уже обсчитываются шейдерными процессорами. Подобный подход позволит сэкономить драгоценные такты на взаимодействие с памятью — операции производятся сразу, вместо копирования данных в выделенный кэш, применения математической магии и отправки результатов назад. Использование небольшой модификации универсальных ядер ещё и упростит топологию кристалла GPU. А значит, уменьшит процент брака и снизит конечную стоимость.

Итоги

Предыдущая архитектура «Радеонов» обладала отличным потенциалом, но высокая производительность достигалась лишь в ряде случаев (в основном, когда GPU был нагружен сверх нормы). RDNA позволила семейству RX 5000 реализовать заложенный потенциал в любых сценариях. Для пользователей это означает следующее — теперь продукция «красных» интересна не только во время распродаж 8-гиговых RX 570 за 10 тысяч рублей. С выходом Ryzen у AMD получилось расшевелить Intel и прекратить стагнацию сегмента центральных процессоров, теперь пора изменить расстановку сил на рынке видеокарт. И серия RX 5000 — отличный дебют.

RX 5700, как любят говорить у нас в комментариях, — «топ за свои деньги». Это превосходная альтернатива RTX 2060, рейтрейсинг которой скорее похож на баловство, чем на реально полезную фишку. За вычетом лучей Radeon уделывает соперницу во всём: больше памяти, выше fps, особенно на высоких разрешениях. Да и ощущение, что покупкой «красной» карты поддерживаешь конкуренцию и развиваешь отрасль, дорогого стоит.

RX 5700 XT метит в альтернативы RTX 2070, и здесь победитель не столь однозначен. С трассировкой эта модель NVIDIA худо-бедно справляется, так что выбор тут больше идеологический. В любом случае XT показала, что «Радеоны» способны конкурировать с топовыми решениями «зелёных» — а там и до битвы за звание самого быстрого GPU 2020 недалеко.

Одно небольшое изменение в логике графического процессора превратило отстающую по всем фронтам архитектуру GCN в конкурентоспособную RDNA. Она оказалась настолько удачной, что в NVIDIA и Intel пересмотрели планы и цены. Такой успех однозначно стоит поддерживать рублём.

Обзор и тестирование видеокарты MSI Radeon RX 5700 XT Evoke OC

Прикладывая руку к сердцу, скажем, что последние годы у компании AMD в сфере графических ускорителей выдались очень трудными: постоянные отсрочки и роль догоняющего игрока, невозможность навязать техническое преимущество . И только переломный переход на измененную архитектуру GPU под кодовым наименованием «Navi», уменьшенный техпроцессор 7-нм и переезд на мощности TSMC позволил «красным» сделать уверенный шаг вперед и влиться в верхний сегмент видеокарт, где, как и процессоры AMD Ryzen, громко заявить о себе. И пока мы находимся в ожидании младших и старших решений (RX 5300/5500/5800), внимательно рассмотрим текущее поколение.

Компания MSI одной из первых анонсировала нереференсные видеокарты семейства Radeon RX 5700 (XT), которые отличались оригинальностью и фирменными технологиями. Особенно выделялась MSI Radeon RX 5700 XT Evoke OC — модель «цвета шампанского», как ее называл сам производитель, дизайнеры которой были явно под впечатлением от линейки Sapphire Nitro+. Но создатели привнесли и множество собственных нововведений, о которых мы и поговорим.

  • Производитель: MSI;
  • Модель: Radeon RX 5700 XT Evoke OC;
  • Графический процессор: Navi 10 XT;
  • Техпроцесс: 7 нм;
  • Частота GPU: 1437 МГц;
  • Частота GPU Boost в играх: 2074 МГц;
  • Количество шейдерных процессоров: 2560;
  • Видеопамять: 8 Гб;
  • Тип видеопамяти: GDDR6;
  • Разрядность шины видеопамяти: 256 бит;
  • Частота видеопамяти: 1750 МГц (12 ГГц QDR);
  • Поддержка CrossFireX: присутствует;
  • Порты: 3 x DisplayPort 1.4, HDMI 2.0b;
  • Разъем дополнительного питания: 8-pin + 6-pin;
  • Параметр TDP: 225 Вт;
  • Длина: 254 мм.

Упаковка и комплектация

Внутри упаковки скрывается картонная коробка с мягким наполнителем. Видеокарта спрятана в антистатический пакет, и ее окружает следующая комплектация:

  • Руководство пользователя;
  • Благодарственная брошюра;
  • Буклет с фирменной продукцией MSI.

Различные кабели, переходники, наклейки и держатели отсутствуют.

Внешний вид и дизайн

Длина графического ускорителя составляет всего лишь 254 мм, ширина — до 129 мм, а вот в корпусе новинка перекроет 2.5-слота расширения, к чему стоит быть готовым.

Дополнительное питание MSI Radeon RX 5700 XT Evoke OC осуществлено по схеме «8+6»-pin, обеспечивая видеокарту до 300 Вт энергией. Уровень потребления и TDP значительно ниже, они ограничены на отметке 225 Вт, но благодаря расширению Power Limit мы имеем возможность увеличить данный показатель до 270 Вт при высоком разгоне.

Для удобства подключения два коннектора утоплены в корпус, позволяя сделать более красивый кабель-менеджмент.

На задней интерфейсной панели расположились широкие прорези для беспрепятственного выхода горячего воздуха и эталонные видеовыходы, соответствуя референсу:

  • 3 x DisplayPort 1.4;
  • 1 x HDMI 2.0b.

Система охлаждения

В первую очередь, это касается клейкой основы между бэкплейтом и кожухом кулера, направленной на уменьшение вибрации и сокрытие между ними стыка. Непосредственно сама система охлаждения получилась массивной и внушительной, о чем косвенно говорят 2.5-слота расширения.

Охладитель представляет собой радиатор единой секции, пронизанный четырьмя тепловыми трубками и набранный 52 пластинами. Все соединения аккуратно пропаяны.

В основании располагается медная никелированная пластина, накрывающая тепловые трубки для равномерного распределения нагрева. Подошва отполирована до зеркального состояния, но не идеально. Дополнительная вставка накрывает восемь микросхем видеопамяти. Как ранее и сообщалось пользователями, производитель посредственно отнесся к охлаждению 2 центральных чипов, контакт с которым получился ужасным, а память GDDR6 — очень горячей.

За активное охлаждение отвечают фирменные вентиляторы TORX 3.0 с двумя типами лопастей. Перед нами модель PLD09210S12HH производства Power Logic со скоростью вращения 0-3400 об/мин и технологией Fan Stop.

К нам на тесты попала первая ревизия видеокарты MSI Radeon RX 5700 XT Evoke OC, которая отметилась недобросовестными термопрокладками на микросхемах памяти и их отсутствием на достаточно массивном металлическом бэкплейте, который инженеры могли бы задействовать.

Производитель знает о проблеме и, как нам стало известно, готовит обновленную модель MSI Radeon RX 5700 XT Evoke OC, получившая приписку «GP», с новыми термопрокладками.

Печатная плата

Сердцем героя обзора стал графический процессор Navi 10 XT. На текущий момент данный GPU является старшим чипом в линейке NAVI и включает 2560 шейдеров, 64 блока растеризации и 160 текстурных блоков.

Подсистема питания построена по девятифазной схеме (7+2, GPU/Mem) и управляется ШИМ-контроллерами IR35217 и NCP81022 соответственно.

В качестве видеопамяти выступают микросхемы Micron стандарта GDDR6 с маркировкой 9JA77 D9WCW. Их тактовая частота составляет 1750 МГц (эффективная частота 14000 МГц).

Конфигурация тестового стенда

  • Процессор: Intel Core i7-6800K (6 ядер, 3400 МГц);
  • Материнская плата: MSI X99A Workstation;
  • Кулер: Corsair H110i;
  • Термоинтерфейс: Arctic Cooling MX-2;
  • Память: 4 x 4 Гбайт DDR4 2800, Kingston HyperX Savage Black;
  • Видеокарта: MSI Radeon RX 5700 XT Evoke OC;
  • Накопитель SSD: Plextor PX-256M6Pro;
  • Блок питания: Corsair RM850x;
  • Корпус: Phanteks Evolv ATX;
  • Монитор:Samsung C34F791WQI, разрешение — 3440 x 1440;
  • Операционная система: Windows 10 64-bit.
  • Драйвера: AMD Adrenalin 19.10.2.

Для разгона видеокарт, а также мониторинга температур и оборотов вентиляторов использовалась фирменная утилита MSI Afterburner.

Проверка стабильности работы ускорителей в процессе разгона проводилась утилитой MSI Kombustor (режим GPU Burn-in, 1920 x 1080). Полученные частоты дополнительно проверялись пакетом тестов 3DMark, тестом устойчивости 3DMark Fire Strike Extreme с 20 прогонами и популярными играми.

Уровень шума измерялся при помощи цифрового шумомера TM-102 с погрешностью измерений не более 0.5 дБА. Измерения проводились с расстояния 0.3 м. Уровень фонового шума в помещении – не более 28 дБА. Все системные вентиляторы, включая установленный в блоке питания, отключались. Дополнительно снимались показания потребляемой мощности с помощью ваттметра Robiton PM-2 и температуры печатной платы ИК-термометром Fluke 59 Max.

Стандартные частоты

Производитель прошил видеокарту MSI Radeon RX 5700 XT Evoke OC последней версией BIOS с измененными тактовыми частотами GPU и кривой вентиляторов, оптимизируя графический ускоритель под новые требования пользователей, что делает обзор тем интереснее для рассмотрения новинки.

Заводской разгон MSI Radeon RX 5700 XT Evoke OC составляет 85 МГц в штатном режиме и до 40 МГц в бусте.

В простое вентиляторы останавливаются, делая новинку бесшумной. Благодаря массивному радиатору температуры ядра, памяти и силовой части находятся в комфортных рамках.

Приведем подробные характеристики микропрограммного обеспечения MSI Radeon RX 5700 XT Evoke OC. Показатель TDP не указан, расширение лимитов возможно в диапазоне от -50% до +20%, BIOS датируется 15 августом 2019 года.

Ранее разработчики получили множественные негативные отзывы на шумные вентиляторы и завышенное напряжение, приводящее к нагреву основных узлов видеокарты. Компания MSI постарались на программном уровне решить множественные недостатки модели Evoke и в будущем планирует выпустить обновленную версию, поэтому внимательно рассмотрим промежуточные исправления и поведение графического ускорителя.

MSI Radeon RX 5700 XT Evoke OC бустит до 1875 МГц, прогревается до 71*С по чипу и 81*С по подсистеме питания при скорости вентиляторов 2000 об/мин. Как можно заметить по графику, инженеры зафиксировали кривую вращения на данной отметке и выше она не поднимается. Уровень шума средний, комфортный для продолжительной работы. Энергопотребление GPU также ограничено при 200 Вт, а среднее напряжение составляет 1.137 В. Температура самого горячего участка чипа и видеопамяти приблизилась к высокой отметке 90*С, что говорит о необходимости дальнейших доработок.

Если волею судеб вы стали обладателем MSI Radeon RX 5700 XT Evoke OC, то процесс данвольтинга позволит охладить горячий нрав видеокарты. Новинка полностью стабильна при напряжении 1062 мВ и Power Limit -15%, тактовая частота ядра повысилась до

1900 МГц. Наблюдается странное поведение вентиляторов, где со временем их скорость понижается с 2000 об/мин до 1800 об/мин, и первоначальный разрыв по температурам уменьшается с 5-8*С до 3-4*С, что в принципе тоже неплохо, а уровень шума становится ниже среднего.

Ручной разгон

Уровень производительности MSI Radeon RX 5700 XT Evoke OC от ручного разгона возрастает на 4-7%.

К сожалению, из-за температурного режима MSI Radeon RX 5700 XT Evoke OC не может долго удерживать повышенные тактовые частоты, что приводит к посредственным результатам в играх при длительной нагрузке.

Сводные графики: температурный режим, уровень шума, потребление

Основная ценность подобных материалов – это не только перечисление доступных в продаже графических ускорителей, но и исследование потенциала систем охлаждения. И поскольку результаты были получены нами на одном стенде, есть возможность сравнения видеокарт практически в идеальных условиях.

График потребляемого электричества всего стенда в зависимости от частот видеокарт и рабочего напряжения GPU.

Энергопотребление в 2D замерялось при бездействии системы (на рабочем столе). Тестирование в 3DMark Fire Strike Extreme проводилось в режиме «Тест устойчивости», 20 прогонов.

Заключение

Основное отличительное достоинство видеокарты MSI Radeon RX 5700 XT Evoke OC — это оригинальный запоминающийся дизайн и нехарактерная цветовая гамма, выделяющая модель среди прочих. Разработчики постарались исправить некоторые недочеты модели после анонса, и, скажем честно, у них это частично, но получилось. В стоковом состоянии новинка теперь производительна, без сбрасывания тактовых частот и комфортна по уровню шума, основные температурные показания находятся в пределах нормы, кроме датчика памяти, результаты которого заставляют нас еще волноваться. Но на этом эффективность охлаждения теряет свой потенциал и дальнейший разгон только усугубляет ситуацию. Положение вещей должна исправить версия MSI Radeon RX 5700 XT Evoke GP, которая получит не только программные, но и «железные» доработки кулера и добавление термопрокладок для задействования массивного бэкплейта.

Подводя итоги: «первый блин комом». Над разработкой MSI Radeon RX 5700 XT Evoke OC дизайнеры, инженеры и маркетологи точно работали порознь и теперь в спешке компания MSI устраняет последствия. Но не все так плохо, как может показаться. При должном эффективном охлаждении внутри корпуса и отсутствии желания к ручному разгону, видеокарта MSI Radeon RX 5700 XT Evoke OC будет неплохо смотреться в игровом ПК с красивой кастомизацией, где ее грани наиболее ярко подчеркнет подсветка.

  • Высокий уровень производительности;
  • Внешний вид и дизайн;
  • Длина видеокарты.
  • Высокая температура видеопамяти.
  • Минимализм в дизайне;
  • Оригинальный оттенок.

Обзор AMD Radeon RX5700 XT

Недавно AMD пошатнула лидерство Intel на рынке флагманских процессоров. Теперь настал черёд потягаться за сегмент топовых видеокарт — с помощью линейки Radeon RX 5000, представленной публике летом. Новинки получили долгожданный GPU NAVI и свежую архитектуру RDNA. Спасёт ли это ситуацию и как обстоит дело с трассировкой лучей — разбираемся в обзоре.

Что было до? Архитектуры TeraScale и GCN

Чтобы понять новшества архитектуры RDNA, необходимо разобраться, что было до неё. История современных Radeon началась с перехода к унифицированным шейдерам. С их помощью AMD хотела обеспечить выдающуюся производительность GPU — а там уже пусть игровые студии решают, на что её пустить. Предполагалось, что с переездом на DX10 и OpenGL 3.0 на видеокарту ляжет множество сложных задач, поэтому она будет загружена гораздо сильнее, чем раньше. Вместо разделения на вершинные и фрагментные шейдеры применили набор универсальных блоков: разработчики сами могут писать код игрового движка, выбирая, чем и в какой момент займётся GPU. Использование одной длинной инструкции (VLIW) с длительной обработкой отлично вписалось в концепцию «одна сложная операция — много данных», да ещё и на высокопараллельном железе. Распределение нагрузки и оптимизацию столь сложных задач возложили на компилятор и драйвер.

От D3D9 к D3D10 и унифицированным шейдерам

Архитектура TeraScale разрабатывалась в нулевые с прицелом на активное внедрение технологий, которые только начинали жизненный цикл. Высокое разрешение текстур, бамп-маппинг и карты нормалей, HDR и глобальное освещение требовали приличную пропускную способность как памяти, так и GPU. Спецэффекты больше не дополняли кадр в отдельных местах, а многократно применялись буквально в каждом пикселе.

Сравните Half-Life 2 (2004) и Titanfall (2014) — насколько изменилась картинка. А ведь в основе один и тот же движок — Source.

Железо и впрямь получилось выдающимся, но вот оптимизация драйверов оставляла желать лучшего. В негативном ключе вспоминают качество ПО «красных» до сих пор — кто в шутках, а кто всерьёз, не владея актуальной информацией. С выходом DirectX11 и появлением прямого доступа к GPU стало ясно, что дальнейшая доработка TeraScale нецелесообразна. Если уж автоматика не могла разрулить нагрузку по сложной архитектуре графического чипа, то что говорить про ручное управление? На замену «тераскейлу» пришёл чип Graphics Core Next (GCN), который лёг в основу Radeon 7970 и консолей восьмого поколения (Xbox One, PlayStation 4).

Внутреннее устройство видеоядра сильно усложнилось.

Для обеспечения схожего уровня производительности GCN требовалось больше управляющей логики, зато упростился сам процесс постановки задач для шейдерных процессоров. Теперь разработчики могли не только взаимодействовать с моделями и текстурами, но и производить общие вычисления. Инженеры AMD планировали, что центральный процессор займётся выполнением скриптов, обсчётом AI и выдачей команд на отрисовку. А фотореалистичная графика, сложная физика и вспомогательные вычисления будут проводиться на GPU.

D3D12 и прямое управления графическим конвейером

Новые API позволили при схожем уровне производительности GPU реализовывать потрясающие спецэффекты за счёт эффективной загрузки железа сложной математикой. Красоты, на которые раньше компьютеру не хватало ресурсов, стало обыденностью. Например, освещение с честным преломлением лучей, активное применение тесселяции, различные эффекты, требующие постоянного обращения к карте глубин (боке, объёмный туман, длинные тени), пообъектное размытие моделей и даже их отдельных частей.

Сильные и слабые стороны предшественника

Управление видеокартой напрямую, как в консолях, — это удобно, особенно если речь про огромный объём вычислений для каждого кадра. Писать код для параллельного выполнения чрезвычайно сложно (хотя бы по той причине, что человеческий мозг исполняет осознанные задачи последовательно, быстро переключаясь между контекстами). Поэтому архитектура GCN проектировалась с прицелом на предсказуемость поведения и временных затрат на операции разного рода. 16-битные вычислительные блоки были сгруппированы по 64 штуки в один юнит и получили общий 64-битный планировщик инструкций. Так программист мог разом выдавать одну команду на четыре такта для работы на 64 ядрах.

Проблема пришла откуда не ждали: революцию отменили приставки.

Из-за сравнительно слабой начинки консолей прогнозы по перспективам 3D-графики не совпали с реальностью. Вместо повального увлечения всякими Ultra HD студии бросились развивать «визуальные обманки»: использовали низкие разрешения отрисовки и сложные спецэффекты. В ход шли даже данные с предыдущего кадра — зачем тратить ресурсы на обсчёты того, что почти не изменилось? Архитектура, эффективная при одинаковой нагрузке на большое число одинаковых ядер, оказалась не лучшим решением в ситуациях, когда требовалось выполнять разные вычисления на малых объёмах данных. В консолях это было незаметно из-за скромных возможностей видеоядра, под завязку загруженного задачами на отрисовку. А с выходом PS4 Pro и Xbox One X сохранилась общая тенденция к целевым 30 fps, но в более высоком разрешении. Исключения, разумеется, случались, но не такие частые.

Нововведения в RDNA

Первое, что нужно отметить, — RDNA в текущем виде нельзя назвать полностью новой архитектурой. Да, изменений немало, но это не тотальная смена дизайна, как было, например, в случае перехода от DX9 к DX10 или замены VLIW TeraScale на GCN. Общая логика и устройство GPU на базе RDNA взяты у предыдущего поколения. Просто инженеры решили технические проблемы, которые ограничивали потенциал мощнейшего железа, — и дело не в семи нанометрах или высоких рабочих частотах, а в эффективной загрузке видеокарты.

Конец жизни текущих консолей. Актуальные технологии в играх

Проблему невозможности честной отрисовки суперсложных кадров в высоком разрешении перестали решать в лоб. Научный подход к развитию алгоритмов масштабирования породил много новых технологий, обманывающих пользователя. Динамическое изменение разрешения отрисовки (как общее, определяемое сложностью кадра, так и частное, зависящее от важности объекта в сцене) позволило не выполнять лишних расчётов там, где пользователь не заметит разницы. Обучение нейросетей привело к созданию алгоритмов масштабирования и сглаживания в условиях недостатка данных — всё для эффективной экономии ресурсов: картинка ухудшается на 5-10%, зато вычислений меньше уже на 30-50%. Вершиной развития DX12 стала аппаратно-ускоренная трассировка реалистичного освещения и отражений.

Изменения в архитектуре: причины и следствия

Одна из основных проблем GCN — недостаточная гибкость. Видеокарта загружалась на 100%, когда обсчитывала кадр в высоком разрешении, однако начинала сдавать позиции, если картинка была сравнительно простой. Ведь выполнять множество одинаковых операций над различными данными не требовалось. Аналогичным образом обстояли дела с короткими инструкциями — 16-битные операции делались с той же скоростью, что и 64-битные (за 4 такта). То есть на графиках производительности GPU был занят, а в реальности — ждал завершения «пустых» тактов для выполнения следующей задачи.

Блоку из 64 ядер сохранили общую логику, но внутри поделили пополам, поставив каждой половинке собственный планировщик. Так GPU может гибче реагировать на различные условия работы. Изменился и дизайн ядер: вместо запуска длинной 64-битной инструкции за несколько тактов теперь используются короткие 32-битные, причём выполняются они за один такт. Теоретически это ускоряет операции от двух до четырёх раз, в зависимости от их сложности. На практике прирост меньше — помимо самих вычислений, есть операции с памятью (чтение и запись), имеющей задержки ввода-вывода. Да и шейдеры обсчитываются не одновременно, а последовательно наслаиваются на результаты вычислений предыдущих.

Графический конвейер упростили, а GPU стал гибче реагировать на различные ситуации.

Улучшили и 7-нм техпроцесс, впервые применённый в Radeon VII (архитектура GCN). Увы, здесь конкретных подробностей не раскрывают, но энергоэффективность Navi относительно Vega и Polaris подросла. Подсистема памяти относительно простая — вместо дорогой HBM2, которой оснащали прошлогодние «Веги», применили банальную GDDR6. По сравнению с прошлым поколением пропускная способность практически не пострадала. И даже выросла, если сопоставить с бюджетной линейкой Polaris, оснащённой GDDR5.

Проверяем на практике

Само собой, объёмная теория тут не для красоты. Эффективность нововведений мы протестировали на двух моделях семейства Navi — AMD Radeon RX 5700 (36 CU) и RX 5700 XT (40 CU). Для оценки результата сравним fps с прямыми конкурентами «зелёных». Для полноты картины мы взяли игры, имеющие встроенные бенчмарки, и усреднили результаты трёх прогонов тестов — так результат нагляднее.

Конфигурация демостенда

ПРОЦЕССОРAMD Ryzen 9 3900X (12 ядер, 24 потока @ 3,8-4,6 ГГц)МАТЕРИНСКАЯ ПЛАТА ASUS X570 ROG Crosshair HERO VIIIОПЕРАТИВНАЯ ПАМЯТЬ4×8 ГБ GeIL EVO X Rog Certified 3600 МГц CL17НАКОПИТЕЛЬPCIe 4.0 SSD Corsair MP600 2 ТББЛОК ПИТАНИЯbeQuiet Dark Power Pro 850 ВтКОРПУСAerocool Quartz

Свежие «Радеоны» показали себя превосходно. Эффективность нововведений наглядно отражает ситуация с RX Vega 64 — на бумаге она в полтора раза мощнее младшей RX 5700, а на практике показывает сравнимые цифры. Обе новинки вписались между непосредственными конкурентами и их более дорогими альтернативами — серией RTX Super. Прямого соперничества не вышло: при сопоставимых характеристиках модели Radeon либо дешевле, либо мощнее RTX 2060 Super. Правда, у NVIDIA всё ещё остаётся трассировка лучей…

Но и на этот случай у AMD есть козырь в рукаве.

Из официальных заявлений и многочисленных утечек известно, что следующее поколение консолей Xbox и PlayStation вновь получит начинку AMD — центральный процессор на базе Ryzen 3000 и графический ускоритель с архитектурой NAVI и поддержкой трассировки освещения. У RX 5700 и 5700 XT отсутствуют специализированные модули для аппаратного ускорения подобных расчётов — а без них производительность столь низкая, что о полноценном применении в играх можно забыть. Вместе с тем в сеть попал патент, рассказывающий о планах AMD по внедрению RT.

Что нас ждёт?

«Красные», в отличие от NVIDIA, отказались от использования выделенных RT-ядер. Ведь они усложняют архитектуру, занимают место на кристалле, удорожают производство и не выполняют никаких других задач, кроме злосчастного рейтрейсинга. Необходимую логику внедрят непосредственно в каждый «вычислительный юнит» — с прямым доступом к данным, которые уже обсчитываются шейдерными процессорами. Подобный подход позволит сэкономить драгоценные такты на взаимодействие с памятью — операции производятся сразу, вместо копирования данных в выделенный кэш, применения математической магии и отправки результатов назад. Использование небольшой модификации универсальных ядер ещё и упростит топологию кристалла GPU. А значит, уменьшит процент брака и снизит конечную стоимость.

Итоги

Предыдущая архитектура «Радеонов» обладала отличным потенциалом, но высокая производительность достигалась лишь в ряде случаев (в основном, когда GPU был нагружен сверх нормы). RDNA позволила семейству RX 5000 реализовать заложенный потенциал в любых сценариях. Для пользователей это означает следующее — теперь продукция «красных» интересна не только во время распродаж 8-гиговых RX 570 за 10 тысяч рублей. С выходом Ryzen у AMD получилось расшевелить Intel и прекратить стагнацию сегмента центральных процессоров, теперь пора изменить расстановку сил на рынке видеокарт. И серия RX 5000 — отличный дебют.

RX 5700, как любят говорить у нас в комментариях, — «топ за свои деньги». Это превосходная альтернатива RTX 2060, рейтрейсинг которой скорее похож на баловство, чем на реально полезную фишку. За вычетом лучей Radeon уделывает соперницу во всём: больше памяти, выше fps, особенно на высоких разрешениях. Да и ощущение, что покупкой «красной» карты поддерживаешь конкуренцию и развиваешь отрасль, дорогого стоит.

RX 5700 XT метит в альтернативы RTX 2070, и здесь победитель не столь однозначен. С трассировкой эта модель NVIDIA худо-бедно справляется, так что выбор тут больше идеологический. В любом случае XT показала, что «Радеоны» способны конкурировать с топовыми решениями «зелёных» — а там и до битвы за звание самого быстрого GPU 2020 недалеко.


источники:

http://i2hard.ru/publications/24061/

http://www.playground.ru/misc/opinion/obzor_amd_radeon_rx5700_xt-501752