ModernPC

Современный компьютер

Nvidia RTX 40 увеличит производительность трассировки лучей в 2-3 раза

https://c.dns-shop.ru/thumb/st1/fit/760/600/cda1130622ab2ad83466e2154b0c2df9/q93_d2d2a3ae5a130766363579daa1dd622ba3bd4bed858e1e2dac48d535a63c12a5.png.webp

Компания Nvidia объявила о значительном увеличении производительности трассировки лучей в своих видеокартах нового поколения Ada Lovelace, и это не только благодаря увеличению количества ядер CUDA, которыми Nvidia оснастила свои GPU нового поколения (их будет до 18 000).

Важной частью этого ускорения является новая технология, которую генеральный директор Nvidia Дженсен Хуанг называет Shader Execution Reordering (SER). Эта технология «перераспределяет работу на лету», обеспечивая 2/3-кратное ускорение трассировки лучей на картах Ada Lovelace. Хуанг сравнивает это с инженерной разработкой такого же масштаба, какую имела внеочередное исполнение для центральных процессоров, которая сегодня является важной функцией практически каждого процессора.

Также появилось новое ядро RT Core. Ядро RT Core является основным фактором производительности трассировки лучей в видеокартах Nvidia RTX, и оно уже подверглось серьезной модернизации в серии RTX 30. С Ada Lovelace оно снова станет больше и лучше, предлагая производительность 200 RT TFLOPS и в два раза большую пропускную способность пересечения треугольников лучей.

Частично это связано с двумя новыми аппаратными блоками в RT Core: новым движком микрокартины непрозрачности, который «ускоряет трассировку лучей геометрии альфа-теста в два раза», и новым движком микросетки, который «увеличивает геометрическую насыщенность без затрат на создание и хранение BVH».

Затем появилось новое ядро Tensor Core. Тензорные ядра — это ускоритель, стоящий за инструкциями, используемыми для машинного обучения и тому подобное, и этот новый Tensor Core 4-го поколения предлагает 1 400 TFLOPS тензорного программирования и механизм преобразования Hopper FP8, прямо из архитектуры Hopper, которую Nvidia ранее анонсировала для центров обработки данных.

https://cdn.mos.cms.futurecdn.net/HyQmAJ8AHGst32VMKh2nS-1200-80.png.webp

Таким образом, все эти изменения, по сути, означают большой шаг вперед в производительности трассировки лучей, и Хуанг объясняет, что было необходимо увеличить производительность трассировки лучей Ады Лавлейс, потому что «трассировка лучей, как известно, трудно поддается распараллеливанию». По сути, трассировка лучей требует доступа к множеству различных вещей на GPU в разное время.

Именно здесь и приходит на помощь SER, поскольку этот блок повышает эффективность трассировки лучей «путем изменения расписания рабочих нагрузок шейдинга на лету, чтобы лучше использовать ресурсы GPU».

«Мы наблюдаем увеличение трассировки лучей в два-три раза, а общей производительности игры — на 25%», — продолжает Хуанг.

Другой частью решения задачи трассировки лучей, хотя и не связанной напрямую с аппаратным обеспечением GPU как таковым, является выпуск DLSS 3.0, который, как ожидает Nvidia, снова поможет повысить частоту кадров при включенных функциях RTX, как это уже делала DLSS ранее. Конечно, в настоящее время у нас есть больше возможностей, чем DLSS для сверхвысокого разрешения, но этот вариант оказался полезным и эффективным, поэтому приятно видеть, что на подходе новые улучшения.

И, конечно, какая польза от информации о новой архитектуре Ada Lovelace без информации о реальной видеокарте, которую можно купить на ее основе: RTX 4090. Она поступит в продажу 12 октября по цене 1 599 долларов США. Также на подходе две модели RTX 4080, модель с 12 ГБ и модель с 16 ГБ, по цене от $899.