¬аше окно в мир —јѕ–
 
Ќовости —татьи јвторы —обыти€ ¬акансии Ёнциклопеди€ –екламодател€м
—татьи

5 августа 2020

“ест-драйв HYPERPC PRO T7 STUDIO. ¬згл€д на платформу NVIDIA STUDIO в действии

„асть 1

ƒмитрий „ехлов

ƒмитрий „ехлов


 оллеги и друзь€! я рад приветствовать вас в очередном большом Ђмногосерийномї обзоре новинок компьютерного оборудовани€. ¬ прошлом году € активно тестировал ноутбуки, созданные на основе инициативы и платформы NVIDIA STUDIO и ориентированные на широкий круг пользователей. я протестировал два ноутбука от MSI (см. ссылки в конце публикации) и продемонстрировал возможности платформы NVIDIA STUDIO.


¬ этом году специалисты CG-индустрии и проектировани€ много говор€т о Blender и AI, а также ML, но € же, как всегда, в поиске интересных решений и способов применить возможности нового оборудовани€, такого как процессоры Intel Core 10-го поколени€ и NVIDIA TITAN RTX. ќказалось, что с помощью таких систем можно решать самые разнообразные вычислительные задачи параллельно.

»так, мы в M&E и области проектировани€ всегда испытываем определенные трудности при нехватке вычислительной мощности рабочих станций. Ќо в то же врем€ хотим приобретать компьютеры, которые будут сто€ть на рабочем месте не один год и выполн€ть самые разнообразные задачи, Ђпривет дженералистам!ї* .

¬ новейшем тестировании и практической оценке решени€ и демонстрации возможностей NVIDIA STUDIO € постаралс€ собрать максимум информации о дес€том поколении процессоров Intel Core i9 и GPU линейки TITAN RTX и изучить возможности технологии NVIDIA NVLink.

—разу замечу, что каждое из приложений по-своему использует возможности CPU и GPU, а также может поддерживать и не поддерживать режим NVIDIA SLI и в частности NVLink, а это может потребовать создани€ глобальных конфигураций системы под определенные задачи.

* ƒженералист (Generalist) Ц в индустрии M&E €вл€етс€ специалистом широкого профил€, способным решать самые разнообразные задачи за короткое врем€. Ц прим. автора.


’арактеристики протестированной рабочей станции HYPERPC PRO T7 STUDIO

¬ прошлом году мне довелось протестировать превосходные ноутбуки на основе платформы NVIDIA STUDIO. ƒанные обзоры были с интересом встречены профессиональными пользовател€ми. «имой 2020 года компани€ NVIDIA объ€вила о расширении платформы NVIDIA STUDIO и на настольные системы. »де€ заключаетс€ в том, чтобы создавать сбалансированные рабочие станции с применением единого многофункционального драйвера Ц STUDIO DRIVER, который содержит не только обширные настройки и шаблоны дл€ игровых приложений, но и реализует поддержку профессиональных приложений и графических ускорителей линейки NVIDIA Quadro, а пользовател€м GPU линейки GeForce станов€тс€ доступны новые возможности, ранее доступные только в линейке GPU NVIDIA Quadro. ћне же, как профессиональному пользователю, было интересно взгл€нуть и протестировать современные приложени€ на современном оборудовании с поддержкой многих передовых технологий и сравнить, как изменилась производительность нового процессора по сравнению с CPU предыдущих поколений и даже с CPU от AMD. ѕри этом € планирую обновл€ть свою рабочую станцию, и € непременно рискнул предоставленной мне возможностью протестировать современный компьютер.
HYPERPC PRO T7 STUDIO

‘отографи€ пришедшего ко мне на тест-драйв компьютера

¬ свежем обзоре € рассматриваю новинку этого лета, а именно высокопроизводительную рабочую станцию HYPERPC PRO T7 от компании HYPERPC в кастомной конфигурации.

ƒл€ вашего удобства € подготовил сводную таблицу всех ключевых характеристик протестированной мною рабочей станции.

“аблица 1. ’арактеристики и краткие спецификации рабочей станции HYPERPC PRO T, участвовавшей в тестировании

’арактеристики HYPERPC PRO T7 STUDIO
Matherboard ASUS WS X299 SAGE Intel LGA-2066
DDR4 4200MHz
Dual M.2 & U.2 support
Intel X299 CEB Motherboard for IntelЃ CoreЩ X-Series Processors
Suport 2-, 3-, 4-Way NVIDIAЃSLIЃ or AMDЃ CrossfireXЩ
CPU Intel Core i9-10940X (@3.30 GHz) 14-cores / 28-threads
Cache L3: 19.25 MB IntelЃ Smart Cache
Max Turbo Frequency @4.6 GHz
TDP: 165W
RAM 128 Gb DDR4-2400 (@1200 MHz)
HDD Seagate IronWolf 10Tb ST10000VN0008
SATA 6 √бит/с
7200 RPM
256 Mb cache memory
SSD M.2 Samsung SSD 970 EVO Plus 2 Tb PCIe Gen 3.0 x4, NVMe 1.3
Samsung 2GB Low Power DDR4 SDRAM buffer memory
Read: 3500 Mb/s
Write: 2500 Mb/s
GPU_1 NVIDIA TITAN RTX CUDA cores: 4608
Tensor cores: 576
RT cores: 72
Base Clock (MHz): 1350 MHz
Boost Clock (MHz): 1770 MHz
Memory Clock: 7000 MHz
L2 Cache Size: 6144 Kb
Total Video Memory: 24 GB GDDR6
Memory Interface: 384-bit
Total Memory Bandwidth: 672 GB/s
Texture Rate (Bilinear): 510 GigaTexels/sec
Connectors: 3 x DisplayPort , 1 x HDMI, 1 x USB Type-C
GPU_2 NVIDIA TITAN RTX
GPU_SLI GEFORCE RTX NVLINK BRIDGE 3
CPU Fan Be Quiet! DARK ROCK PRO 4


 ак € писал в ранних обзорах, ключевыми дл€ платформы NVIDIA STUDIO €вл€ютс€ нескольких правил, обеспечивающих высокую производительность в работе. ѕо сути, мы увеличиваем размер системы от мобильного форм-фактора до полноценной рабочей станции, с возможностью более гибкой кастомизации. ј формат настольного ѕ  дл€ этого подходит лучше всего.

ƒл€ моего тестировани€ была подготовлена модификаци€ компьютера с двум€ GPU NVIDIA TITAN RTX, поставл€емых с 24 √б графической пам€ти и созданных на основе чипа TU102 на базе архитектуры NVIDIA Turing.

¬ качестве платформы была выбрана материнска€ плата ASUS WS X299 SAGE, созданна€ на основе чипсета X299 и поддерживающа€ процессоры Intel Core 10-го поколени€. ƒл€ работы с большими массивами данных € попросил укомплектовать компьютер 128 √б ќ«”, что позволило протестировать приложени€ с »», а также протестировать визуализацию комплексных моделей и сцен.

—ердцем всей системы €вл€етс€ процессор Intel Core i9-10940X. ѕроцессоры 10-го поколени€ стали доступны совсем недавно и пока в основном дл€ компаний производителей компьютерного оборудовани€. “ак как плата поддерживает установку двух и более GPU, дл€ тестов разработчики системы предложили установить два GPU NVIDIA TITAN RTX, объединенные мостом NVLink, чтобы протестировать производительность системы в различных задачах и приложени€х, требовательных к системной пам€ти и пам€ти GPU. Ёто особенно актуально в задачах обработки видео и композитинга, где могут активно использоватьс€ возможности GPU дл€ ускорени€ вычислений и хранени€ кэша данных.

ѕеред тем как € поделюсь результатами тестировани€ и подробнее опишу ключевые особенности каждого из протестированных компонентов, € хочу сделать небольшое отступление и описать процессы и задачи, которые используют определенные компоненты системы (CPU, GPU, SSD, HDD). ќдним из важных моментов €вл€етс€ тестирование совокупности компонентов системы, когда в вычислени€х активно участвуют и CPU и GPU, а также дополнительное оборудование, обеспечивающее ускорение вычислений в специализированных задачах, например обработке звука или оцифровке видеосигнала.

¬заимодействие в различных процессах

ќдним из проблемных мест многих обзоров €вл€етс€ то, что все тесты выполн€ютс€ с учетом того, что нагрузке подвергаетс€ определенный элемент компьютерной системы, например процессор или видеокарта. Ќо когда мы работаем, программа задействует практически все компоненты системы, например считывает данные с жесткого диска или SSD-накопител€, а также может обратитьс€ к сетевому хранилищу. «атем они загружаютс€ в системную пам€ть и далее их визуализацию выполн€ет графический ускоритель, и вот здесь важность обработки данных и последовательности операций, выполн€емых внутри приложений, возрастает.

ќпира€сь на личный опыт, € стараюсь не использовать параллельно и CPU, и GPU и считаю особой расточительностью отдавать пам€ть GPU, даже если еЄ объем составл€ет 11 или даже 24 √б, под хранение кэша страниц веб-браузера. ј вот использовать GPU как инструмент дл€ кэшировани€ данных в процессе анимации, визуализации и композитинга гораздо выгоднее.

 аждое приложение обладает определенным набором инструментов, классические приложени€ зачастую большинство вычислений выполн€ют с помощью CPU, а GPU выполн€ет визуализацию изображени€ в окне проекции или на экране. “о есть когда мы выполн€ем действие, чтобы GPU отобразил изображение, необходимо, чтобы CPU предварительно выполнил вычисление. Ёто хорошо заметно в играх, когда при манипул€ции персонажем анимаци€ и дополнительные трансформации рассчитываютс€ CPU, а GPU формирует кадр, и это все должно происходить в 1/60 секунды и даже быстрее. Ќо в играх, по сути, мы работаем с кэшем, заранее подготовленными наборами операций и анимации, а если говорить про создание моделей, их анимацию и визуализацию Ц здесь процесс измен€етс€, и CPU может быстро не обработать данные, из-за чего мы видим снижение производительности. “акие приложени€, как Autodesk Maya, обладают внутренними инструментами дл€ профилировани€ и оптимизации сцены. “ехнические специалисты могут заранее продумать, какие задачи будут выполн€тьс€ на CPU, а какие на GPU, или они будут выполнены параллельно.

„тобы система корректно справл€лась с поставленными задачами и были минимальные задержки, необходимо подбирать компоненты, которые способны быстро выполн€ть как последовательные, так и параллельные вычислени€. ј дл€ этого необходима надежна€ и высокоскоростна€ передача данных между CPU и GPU, за что обычно отвечают шина PCI-E и системна€ шина, осуществл€юща€ передачу данных из системной пам€ти в CPU и обратно.

–ассмотрим три примера возможных рабочих процессов, в которых пользователь выполн€ет определенные операции, но задействует различные инструменты, разработанные дл€ выполнени€ на CPU, GPU или в гибридном режиме (CPU/GPU).

HYPERPC PRO T7 STUDIO

–ис. 1. –абочий процесс взаимодействи€ операций, выполн€емых пользователем, и оборудовани€

¬ приведенном на рис. 1 примере вы можете видеть единый рабочий процесс, состо€щий из нескольких операций, например создание модели с применением различных инструментов программы, какие-то из которых разработаны дл€ выполнени€ на CPU, а какие-то на GPU. ¬ большинстве процессов мы создаем контент, использу€ CPU. ¬ыполн€€ действие в программе, процессор осуществл€ет вычислени€ и затем, передава€ обновленные данные алгоритму визуализации, визуализирует с помощью GPU. ¬ иных случа€х GPU может выступать как со-ускоритель вычислений и не только формировать визуальный результат, но и выполн€ть соответствующий расчет.
HYPERPC PRO T7 STUDIO

–ис. 2. –абочий процесс, в котором использованы три подхода к выполнению операций

¬торой возможный сценарий выполнени€ операций Ц это применение инструментов с различными функци€ми и возможност€ми аппаратного ускорени€. ћы можем простые операции переложить на плечи CPU, и в то же врем€ массивные параллельные вычислени€ можно передать GPU. Ёто хорошо видно в процессе работы с видеоконтентом и его кодированием/декодированием. ¬ р€де задач, например в процессе гибридного рендеринга или процессе дополнительных вычислений при изменении модели, могут быть применены как CPU, так и GPU. ¬ случае если внесены изменени€ в лопатки турбореактивного двигател€, сами лопатки и их форму перестроить не сложно, а вот обработать модель, изучить потоки воздуха и завихрени€ Ц такой расчет может быть переложен на плечи GPU или выполнен в гибридном режиме.
HYPERPC PRO T7 STUDIO

–ис. 3. –абочий процесс, в котором использован гибридный подход к вычислени€м

Ќаиболее оптимальным, но не всегда реализуемым посто€нно €вл€етс€ гибридный процесс, когда используютс€ возможности CPU и GPU и правильно скомбинированы инструменты дл€ работы. Ќа рис. 3 приведен пример подобного процесса, когда операции пользовател€ выполн€ютс€ и на CPU, и на GPU, но посто€нно. “акой подход широко используетс€ специалистами по компьютерной визуализации и цифровому композитингу. Ёто позвол€ет посто€нно использовать возможности всей системы в целом, а не отдавать все ресурсы одной задаче.

»спользование многопроцессорных, многопоточных архитектур позвол€ет создавать сложные рабочие конвейеры дл€ достижени€ максимальной производительности в работе. »спользование возможностей виртуализации значительно расшир€ет границы по созданию комплексных вычислительных систем в рамках одной рабочей станции. Ќо это потребует дополнительного финансировани€, так как аппаратное ускорение виртуальных сред пока доступно только в решени€х NVIDIA Quadro и NVIDIA Tesla.

ѕроцессы могут быть разнообразными, и многие из них реализуемы в большинстве программных решений, доступных на рынке. «на€ возможности инструментари€ приложени€, пользователь может активно использовать возможности аппаратного обеспечени€, что € и постараюсь продемонстрировать в данной статье на нескольких примерах, а также остановлюсь на возможност€х драйвера NVIDIA STUDIO.

—овременные решени€ от ASUS и NVIDIA могут быть сконфигурированы под решение целого р€да задач. ќдни задачи требуют меньшего энергопотреблени€, а другие большего, и дл€ каждой из них может быть создан свой профиль.

ќбзор и тестирование компонентов системы NVIDIA STUDIO

» вот мы подобрались к самому вкусному Ц тестированию и оценке каждого компонента системы, созданной на основе концепции платформы NVIDIA STUDIO. ¬ этом обзорном тестировании € провел тесты современных CPU и GPU, а также систем хранени€ данных. Ќачну свой обзор с CPU Intel Core i9-10940X.
ѕроцессор Intel Core i9-10940X

¬ основе первоначальной идеи платформы NVIDIA STUDIO лежали мобильные процессоры Intel Core 7-го и 9-го поколений. ¬ св€зи с расширением возможностей и областей применени€ платформы NVIDIA STUDIO, а также расширени€ функционала драйверов, а также позиционирование на область настольных компьютеров. ¬ 2020 году Intel выпустила дес€тое поколение процессоров Intel Core. ¬се процессоры дес€того поколени€ начинаютс€ с цифры 10. Ќаиболее выигрышными, с точки зрени€ функционала и возможностей дл€ оверклокинга, €вл€ютс€ процессоры Core серии X. ƒл€ тестировани€ мне потребовалось даже подождать, пока на рынке по€в€тс€ процессоры Core i9 дес€того поколени€. ¬озможность даже небольшой корректировки частоты процессора или каких-то определенных параметров материнской платы может помочь оптимизировать производительность системы в целом.

¬ предоставленной мне на тест-драйв системе специалисты из HYPERPC установили процессор Intel Core i9-10940X, с техническими характеристиками которого вы могли познакомитьс€ выше в таблице 1.

ѕроцессор Core i9-10940X относитс€ к архитектуре Cascade Lake, €вл€ющейс€ результатом оптимизации архитектуры Skylake и ее 14-нанометрового процесса производства. ќдним из важных нововведений €вл€етс€ оптимизаци€ энергопотреблени€ и тепловыделени€. “акже разработчики добавили поддержку модулей пам€ти на основе 3D XPoint.  роме того, в новую архитектуру были добавлены инструкции Deep Learning Boost и были уменьшены риски, св€занные с аппаратными у€звимост€ми Meltdown и Spectre.

HYPERPC PRO T7 STUDIO

–ис. 4. »нформаци€ о процессоре Intel Core i9-10940X в утилите CPU-Z

ѕомимо оптимизации энергопотреблени€ и тепловыделени€ разработчики ставили перед собой задачу повысить производительность вычислений. “ак, тестируемый мною образец содержит 14 €дер/28-потоков, работает на частоте 3.3 GHz, а благодар€ технологии Turbo Boost 2.0 частота процессора может быть увеличена до 4.6 GHz дл€ одного €дра и до 4.1 GHz дл€ всех €дер. ѕри использовании Turbo Boost 3.0 частота процессора может быть повышена до 4.8 GHz, что в р€де вычислительных задач позвол€ет значительно нарастить производительность. Ќовый процессор обладает кэшем третьего уровн€ (L3 cache) объемом 19.25 Mb и поддерживает 4 канала пам€ти, с максимальной пропускной способностью в 94GB/s, стандарта DDR4-2933.

«а последние годы € протестировал несколько моделей процессоров разных поколений и от нескольких производителей. Ёто позволит нам проследить за изменением производительности в вычислени€х оптимизированной архитектуры Intel Cascade Lake.

я всегда провожу тестирование с помощью наборов профессиональных синтетических тестов от SPEC, охватывающих большинство задач, выполн€емых с помощью современных высокопроизводительных компьютеров. “акже € провожу тестирование с помощью практических приложений, таких как Autodesk Maya, Blender, DaVinci Resolve и других.

 онечно, результат напр€мую зависит от поддержки функционала новой архитектуры и еЄ возможностей. ќбычно дл€ оптимизации программного обеспечени€ под новую архитектуру требуетс€ от полугода до года. “акже необходимо помнить и понимать, что разработчики могут реализовать определенные инструменты, разработанные с учетом возможностей новой архитектуры процессора, которые могут быть недоступны в системах, построенных на предыдущем поколении процессоров. Ёто особенно актуально в свете многофункциональной и очень развитой архитектуры современных графических ускорителей от NVIDIA.

¬ процессе тестировани€ € выдел€ю несколько областей и тестирую CPU с помощью синтетических и практических тестов, а затем свер€юсь с ранее собранными данными.

¬ новом тестировании € постаралс€ провести сравнение производительности нескольких поколений CPU от Intel и сравнил с ранними тестами CPU от AMD. ’очетс€ сказать сразу, что процессор от Intel 10-го поколени€ мен€ порадовал так же, как в свое врем€ мен€ впечатлили решени€ от AMD на основе архитектуры ZEN. я же сейчас опираюсь на свою оценку на основе свежего тестировани€ с применением современного программного обеспечени€, разработанного в последние пару лет, с учетом поддержки всех необходимых инструкций процессора и API.

ƒавайте взгл€нем на результаты тестировани€ процессора Intel Core i9-10940X.

–езультаты тестов CPU в SPECwpc 3

Ќабор тестов от SPEC давно стал дл€ мен€ важным инструментом в подготовке обзоров и тестировании оборудовани€. ≈го разработкой занимаютс€ не первый год, и он включает в себ€ множество разнообразных тестов, которые опираютс€ на реальные приложени€ и алгоритмы. ѕоэтому с его помощью можно хорошо протестировать систему в самых разнообразных нагрузках.

HYPERPC PRO T7 STUDIO

–ис. 5. –езультаты теста SPECwpc M&E CPU

“ест SPEC M&E используетс€ дл€ определени€ производительности CPU в визуализации трехмерной графики, кодировании/декодировании видео. ¬ основе теста лежит измерение времени, затрачиваемого на визуализацию растрового изображени€ с помощью Blender и LuxRender. “акже тест включает в себ€ измерение скорости кодировани€ видео с помощью приложени€ Handbrake с понижением разрешени€ из формата 4K и кодировани€ с помощью кодеков H.265 и H.264.  ак видно из приведенной на рис. 5 диаграммы, новый процессор от Intel не уступает своему предшественнику, а в р€де задач превосходит его и своего конкурента в лице AMD Ryzen Threadripper 2950X, протестированного мною ранее. ≈сли выбирать процессор дл€ выполнени€ визуализации и кодировани€/декодировани€ видео, согласно тестам SPECwpc € рекомендую присмотретьс€ к новому процессору от Intel.
HYPERPC PRO T7 STUDIO

–ис. 6. –езультаты теста SPECwpc Product Development CPU

¬ области разработки продуктов новый процессор от Intel также показал хороший результат. Ќе счита€ странного снижени€ производительности в тесте Viewperf, св€занного с SolidWorks (Sw-03). ≈сли присмотретьс€ к производительности CPU от AMD, то он лидирует в тестах, св€занных с вычислени€ми с плавающей точкой. “ак, процессор AMD показывает наибольшую производительность в тестах CalculiX и Rodinia (CFD). ј тест WPCcfd основан на пакете вычислительной гидродинамики с открытым исходным кодом OpenFOAM. –ешатель сгорани€ XiFoam из OpenFOAM используетс€ дл€ решени€ задач предварительно смешанного или частично предварительно смешанного горени€ с моделированием турбулентности.
HYPERPC PRO T7 STUDIO

–ис. 7. –езультаты теста SPECwpc Life Sciences CPU

¬ группе тестов Life Sciences новый процессор Intel показал очень хороший результат, незначительно уступа€ процессору Threadripper 2950X. «десь процессор от AMD за счет большего количества вычислительных €дер и потоков показывает результат лучше.
HYPERPC PRO T7 STUDIO

–ис. 8. –езультаты теста SPECwpc Financial Services CPU

¬ задачах, св€занных с вычислени€ми алгоритмов в финансовых операци€х, процессор Intel Core i9-10940X показывает хороший результат в тесте с алгоритмом Monte Carlo, но также из-за меньшего количества €дер уступает процессору AMD.  онечно, увеличение или достижение равного с AMD результата можно получить с помощью замены процессора на старшую модель, например Core i9-10980X.
HYPERPC PRO T7 STUDIO

–ис. 9. –езультаты теста SPECwpc General Operations CPU

¬ задачах работы с Python и 7-Zip новинка от Intel показывает свое превосходство. ”читыва€ тот факт, что процессор AMD более производителен с точки зрени€ технических характеристик, обновленна€ архитектура Intel и оптимизаци€ программного обеспечени€ дают серьезное повышение производительности.
HYPERPC PRO T7 STUDIO

–ис. 10. –езультаты теста SPECwpc Energy CPU

¬ таких требовательных к вычислительным мощност€м област€х, как геологи€ и энергетика, в наборе тестов от SPEC новый процессор от Intel также показал себ€ с хорошей стороны, при этом значительно уступив в двух тестах своему младшему коллеге и представителю конкурента. Ќаихудший результат в данном тесте Core i9-10940X показал в тесте SRMP, который выполн€ет вычислени€ в области обработки сейсмических данных.
–езультаты тестировани€ в Autodesk Maya 2020 и MtoA 4
ѕакет Autdoesk Maya и €дро визуализации SolidAngle Arnold активно используют возможности CPU и GPU дл€ выполнени€ разнообразных вычислений. ќтличительной особенностью Maya €вл€етс€ поддержка возможностей дл€ использовани€ пам€ти GPU дл€ кэшировани€ данных сцены, а если в рабочей станции используетс€ большой объем пам€ти, то аниматоры получают возможность активно использовать инструментарий Playback Cache, а при создании кэша анимации использовать возможности многопоточных CPU и GPU. ѕомимо этого, специалисты по Look Development, работающие с €дром визуализации Arnold Renderer, могут использовать возможности таких CPU, как Core i9-10940X и GPU NVIDIA TITAN RTX дл€ увеличени€ производительности в работе с комплексными модел€ми, содержащими высококачественные текстурные карты в высоком разрешении и с детализацией, а также моментально вносить изменени€ в модель и сцену в целом, визуализиру€ изображение за несколько минут или даже секунд. ¬ данном тестировании € покажу вам, как работает Maya и Arnold Renderer (MtoA 4) на многопроцессорных и многопоточных системах.
HYPERPC PRO T7 STUDIO

–ис. 11. ѕример модели, используемой дл€ теста скорости визуализации 3D сцены

Autodesk Maya по праву считаетс€ одним из лидирующих приложений, активно использующим множество технологий. –езультатом активной совместной работы Autodesk и NVIDIA стала реализаци€ мощной системы кэшировани€ данных в виде Playback Cache и поддержка вычислений на GPU р€да требовательных к производительности вычислений деформеров. ядро Viewport 2.0 также разработано с применением возможностей API OpenGL и DirectX и поддерживает €зык программировани€ шейдеров GLSL и расширени€ от NVIDIA (доступно в Maya SDK).

Ќачина€ с Maya 2020, приложение получило поддержку новейшего формата данных Ц USD (Universal Scene Description) и специального графического €дра Hydra. Ёто внутренн€€ разработка PIXAR Animation Studios, опубликованна€ в открытом доступе. ƒанные технологии легли в основу платформы NVIDIA Omniverse.

HYPERPC PRO T7 STUDIO

–ис. 12. –езультаты тестировани€ скорости визуализации сцены NVIDIA SOL с помощью CPU

ќдним из ключевых продуктов компании Autodesk, который поддерживает NVIDIA RTX и дл€ которого оптимизируютс€ драйверы NVIDIA STUDIO, €вл€етс€ €дро визуализации SolidAngle Arnold 6. Ќа рис. 12 приведена диаграмма, сравнивающа€ производительность различных компонентов компьютерных систем.  ак видите, графические ускорители на основе GPU NVIDIA Turing. ¬ протестированной мною рабочей станции HYPERPC PRO 7T STUDIO установлены два GPU NVIDIA TITAN RTX, объединенных мостом NVLink. ƒанна€ конфигураци€ позволила использовать вычислительные возможности двух GPU дл€ ускорени€ вычислений в процессе визуализации. Ќа визуализацию представленной на рис. 11 сцены им потребовалось 99 секунд. Ёто наилучший показатель из протестированных мною GPU и систем в целом. “акже хочетс€ отметить, что Arnold Renderer превосходно поддерживает NVLink и позвол€ет использовать возможности передачи данных между GPU на максимальной скорости. ¬се тесты с двум€ GPU, представленными в данной статье с системами визуализации, выполнены с поддержкой NVlink.
–езультаты тестировани€ в Blender 2.8
ѕакет компьютерной графики и анимации Blender давно вызывает большие дискуссии в профессиональном сообществе. ≈му удел€етс€ много внимани€ среди пользователей. Ќа текущий момент в Blender доступны два мощных инструмента Ц €дро визуализации Cycles и €дро аппаратной визуализации EEVEE. ядро EEVEE как раз наделало много шума и сразу было тепло встречено пользовател€ми. ≈го ключевым преимуществом €вл€етс€ поддержка высококачественной аппаратной визуализации, выполн€емой с помощью GPU, при этом такие графические ускорители, как NVIDIA TITAN RTX, могут быть использованы дл€ создани€ высококачественного образа, с высококачественными текстурами и сложными эффектами дл€ затенени€. ƒл€ работы с визуализацией с помощью EEVEE наличие объемов графической пам€ти более 16 √б становитс€ крайне желательным, так как вывод изображени€ на дисплеи с большим разрешением и подготовка текстурных карт в разрешени€х 4K и 8K требуют загрузки данных в пам€ть GPU.
HYPERPC PRO T7 STUDIO

–ис. 13. —цена из проекта Grossbery, используема€ дл€ замера скорости визуализации кадра

HYPERPC PRO T7 STUDIO

–ис. 14. —равнение производительности различных моделей и поколений процессоров в Blender Cycles Engine

—корость визуализации трехмерных сцен нагл€дно демонстрирует развитие производительности центральных процессоров последних поколений.  лассические €дра визуализации, такие как V-Ray, RenderMan, Arnold и др., ориентированы на разработчиков ѕќ, расшир€ющих их функционал. ѕри всей привлекательности GPU, на CPU выполн€етс€ большинство задач, при этом персонализированные разработки выгоднее вести на CPU и только затем портировать решение на GPU.  лассические алгоритмы Path Tracing и Monte Carlo превосходно работают на GPU, но вот решени€ на основе Bucket Rendering зачастую реализуютс€ только на CPU, за р€дом исключений.

я уже не первый год активно тестирую производительность CPU на тестах визуализации с помощью Cycles Renderer и вижу, как развиваютс€ CPU и сам пакет Blender в плане производительности. ƒиаграмма на рис. 14 нагл€дно показывает прирост производительности в современных CPU в последние 3Ц4 поколени€.

¬ качестве основы можно вз€ть моего старого верного помощника Ц Intel Xeon E3-1240 v2, который у мен€ используетс€ как опорна€ точка. “акже в текущем тестировании € сравнил результаты тестов из своих предыдущих исследований, посв€щенных процессорам AMD Ryzen Threadripper первого и второго поколений. —огласно приведенной диаграмме, новейшее поколение процессоров Intel показывает очень хороший результат в производительности визуализации трехмерной графики. ќптимизаци€ €дра Blender Cycles, выполненна€ разработчиками, также сказываетс€ на результатах тестировани€. ќтмечу, что Cycles становитс€ production ready решением и уже получил независимую редакцию в виде standalone приложени€.

Ќа диаграмме отчетливо видно, как Intel Core i9-10940X даже при базовых характеристиках и без разгона показывает хорошую производительность. Ёто особенно хорошо заметно в визуализации сложной комплексной сцены с процедурными эффектами из проекта Grossbery. Ѕлиже к нему подходит процессор 7-го поколени€ Core i9-7900X, протестированный мною около двух лет назад в тестах процессоров AMD Ryzen Threadripper. ≈сли же сравнить с Threadripper, то Core i9-10940X показал высокую производительность в визуализации именно сложных процедурных эффектов, наподобие формировани€ травы, меха и волос.

¬згл€д на Autodesk Fusion 360 и многопоточные вычислени€

ѕакет Fusion 360 от Autodesk €вл€етс€ одной из самых динамично развивающихс€ —јѕ– на рынке решений дл€ машиностроени€, 3D-печати, генеративного дизайна и анализа комплексных моделей. ≈го возможности как локального приложени€, выполн€емого на персональном компьютере пользовател€, значительно расширены с помощью облачного сервиса Fusion 360.

HYPERPC PRO T7 STUDIO

–ис. 15. ћодуль CAM во Fusion 360 использует дл€ вычислений многопоточные CPU и GPU дл€ интерактивной визуализации процесса создани€ детали

Fusion 360 превосходно подходит под концепцию платформы NVIDIA STUDIO и может быть использован на таких рабочих станци€х, как T7 STUDIO от HYPERPC. ѕриложение использует возможности нескольких GPU дл€ ускорени€ вычислений и визуализации модели, активно использует многопоточные процессоры дл€ выполнени€ моделировани€ CAM и CFD.

ѕрименение многопоточных процессоров, таких как Intel Core i9-10940X, превосходно подходит дл€ моделировани€ сложной геометрии. Ётот момент важно учитывать при выборе рабочей станции, так как истори€ создани€ модели может достаточно долго вычисл€тьс€, особенно в комплексных сборках и высокодетализированных элементах.

–езультат теста в RealFlow 10

ћоделирование жидкостей и сложных динамических эффектов всегда €вл€лось ресурсоемкой задачей, особенно когда речь заходит о моделировании сложных и реалистичных сцен, в которых взаимодействуют множество объектов моделируемой среды (вода, гель, газ и т. п.).

¬ своей работе € обычно использую пакет RealFlow 10, обладающий большим функционалом и на основе математического €дра которого разработан инструментарий, вход€щий в поставку пакета Dassault Systèmes Simulia, нос€щий им€ XFLOW.

ѕакет RealFlow поддерживает вычислени€ не только на CPU, но также активно развивает ускорение с помощью GPU. » такие решени€, как NVIDIA TITAN RTX, помогают специалистам по моделированию жидкостей и динамических эффектов быстро решать производственные задачи. Ќа рис. 16 приведен пример модели всплывающей подводной лодки из демонстрационного проекта RF10. ƒл€ эксперимента € создал модель продолжительностью 64 кадра, которые процессор смоделировал за 139 минут.

HYPERPC PRO T7 STUDIO

–ис. 16. ћодель всплывающей подводной лодки в RealFlow 10. ћоделирование эффекта с помощью Core i9 10940X зан€ло 139 минут

¬о врем€ тестировани€ процессора AMD Ryzen Threadripper 2950X данный тест был пройден за 176 минут. Ѕольша€ производительность Core i9-10940X объ€сн€етс€ оптимизацией самой архитектуры процессора, бќльшим количеством €дер и потоков, а также оптимизацией €дра Hybrido, используемого в RF10 дл€ моделировани€ динамических эффектов. ¬ разделе, посв€щенном NVIDIA STUDIO и GPU NVIDIA TITAN RTX, € продемонстрирую пример вычислений с помощью €дра Dyverso, доступного в RF10 и поддерживающего NVIDIA CUDA.
Ќакопители данных
ќдним из ключевых элементов каждой системы на основе платформы и концепции NVIDIA STUDIO €вл€етс€ высокоскоростной NVMe SSD накопитель, подключенный посредством шины PCE-E. —корость шины PCI-Express 3.0 превосходит стандартный SATA 6√бит/сек, что позвол€ет активно использовать данные накопители в работе с видео в формате 4K, 6K и 8K. ѕрименение накопителей SSD актуально также при работе с кэшированием данных, например в процессе вычислений динамических эффектов (пример из RealFlow 10), и при работе с алгоритмами машинного обучени€, искусственного интеллекта и в процессе исследовани€ данных. –абоча€ станци€ HYPERPC PRO T7 STUDIO, присланна€ мне на тест-драйв, укомплектована 2Tb SSD M.2 от Samsung и 10Tb HDD от Seagate.
HYPERPC PRO T7 STUDIO

–ис. 17. —равнение производительности SSD-накопител€ Samsung SSD 970 EVO Plus и HDD-накопител€ Seagate IronWolf

¬ысока€ производительность SSD-накопител€ позвол€ет достичь высокой скорости в чтении и записи данных, особенно временных данных, таких как наборы данных дл€ обучени€ или кэш частиц динамической модели.

 ак видно из теста DiskMark, SSD накопитель Samsung может работать на скорости более 3000 MB/s, в то врем€ как классический HDD показывает скромные 248 MB/s. Ќа рис. 18 приведен пример трех тестов, выполненных с помощью DaVinci Resolve и демонстрирующих возможности скоростных характеристик SSD накопител€ дл€ сборки видео в форматах 4K и преобразовани€ 4K в DCI (2048х1080).

HYPERPC PRO T7 STUDIO

–ис. 18. —равнение скорости сборки видео в DaVinci Resolve при чтении данных с SSD-накопител€ Samsung SSD 970 EVO Plus и HDD-накопител€ Seagate Iron Wolf

¬ажный момент заключаетс€ в том, что SSD-накопитель и классический HDD незначительно вли€ют на скорость сборки видео, состо€щего из данных, записанных в RAW форматах или наход€щихс€ в формате QuickTime. Ёто единый файл, занимающий определенную область на диске. Ќо когда необходимо работать с секвенци€ми статичных кадров, например в 32-bit формате OpenEXR с компрессией ZIP, тогда каждый кадр будет представлен как отдельна€ единица, которую необходимо прочитать, декодировать и загрузить в оперативную пам€ть. ј если файл объемом около 97 Mb, то классические жесткие диски значительно уступают в производительности SSD накопител€м. я всегда рекомендую использовать SSD накопители дл€ кэшировани€ данных и дл€ работы над текущими проектами, что позвол€ет ускорить рабочий процесс в монтаже видео и при создании визуальных эффектов на этапе композитинга.
ћатеринска€ плата ASUS WS X299 SAGE
¬ основе систем RTX STUDION от HYPERPC лежат высокопроизводительные и многофункциональные материнские платы ASUS. ¬ предоставленной мне на тест-драйв модели HYPERPC PRO T7 STUDIO использована материнска€ плата дл€ рабочих станций ASUS WS X299 SAGE, созданна€ на основе чипсета Intel X299. ƒанна€ материнска€ плата превосходно подходит дл€ создани€ рабочих станций с несколькими GPU и с процессорами Intel Core серии X. ќна предоставл€ет поддержку технологий NVIDIA 4-Way SLI и AMD 4-Way CrossFireX. Ќаличие семи портов PCI-E позвол€ет создавать конфигурации, содержащие до семи графических ускорителей. ј это позвол€ет разрабатывать системы дл€ таких задач, как фотореалистична€ высококачественна€ визуализаци€, обработка комплексных моделей и обработка данных, включа€ машинное обучение.
HYPERPC PRO T7 STUDIO

–ис. 19. ћатеринска€ плата ASUS WS X299 SAGE, использованна€ в протестированной конфигурации

¬о всех решени€х ASUS реализовано многофункциональное приложение ASUS AI Suite 3. ƒанное приложение позвол€ет производить настройку аппаратных компонентов системы и создавать профили конфигураций под различные задачи. Ёто становитс€ особенно удобно при использовании комплектующих с разгонным потенциалом, таких, какие были использованы в протестированном мною решении от HYPERPC.
HYPERPC PRO T7 STUDIO

–ис. 20. –еализовать возможности дл€ разгона системы помогает утилита AI Suite 3 ќт ASUS

— помощью утилиты ASUS AI Suite вы можете настраивать напр€жение, измен€ть частоты процессора и оперативной пам€ти, конфигурировать кулеры, установленные в системе, и создавать профили индивидуально под конкретное приложение. »менно за счет этого функционала такие компании, как HYPERPC, и специалисты, собирающие высокопроизводительные игровые компьютеры, выбирают решени€ от ASUS.

¬озможности платформы NVIDIA STUDIO с NVIDIA TITAN RTX

ћы подошли к самому интересному Ц к тестированию двух высокопроизводительных графических ускорителей NVIDIA TITAN RTX. ѕо своей концепции платформа NVIDIA STUDIO объедин€ет оборудование, API, SDK и программное обеспечение, но нацелена на применение профессиональными пользовател€ми мобильных и настольных компьютеров. ѕлатформа NVIDIA STUDIO предоставл€ет р€д требований, которые должны быть соблюдены разработчиками мобильных и настольных компьютеров дл€ полноценного соответстви€ иде€м компании NVIDIA и разработчиков ѕќ.

HYPERPC PRO T7 STUDIO

–ис. 21

ѕокупа€ новый компьютер с маркером NVIDIA RTX STUDIO, вы получите сбалансированный по производительности и функционалу продукт, который будет решать поставленные перед вами задачи с минимизацией временных издержек на подготовку оборудовани€ и ѕќ дл€ работы.

 омпани€ NVIDIA совместно со своими партнерами, производител€ми компьютерного оборудовани€, давно создает уникальные решени€, оптимизированные дл€ профессиональных игроков и профессиональных дизайнеров, разработчиков, занимающихс€ разработкой приложений с применением CUDA и библиотек с возможност€ми искусственного интеллекта.

ѕочему была создана платформа?
  созданию новой платформы и концепции компанию NVIDIA подстегнули три фактора. ѕервый Ц огромное количество online ресурсов в сети »нтернет, второй Ц огромный массив данных, загружаемый в формате видео (только на YouTube в минуту загружаетс€ около 400 часов видео, по данным за 2019 год), и третий Ц это более 5 миллионов приложений дл€ устройств с Android и IOS. ¬се это досто€ние человечества и информационного мира становитс€ возможным только благодар€ развитию оборудовани€, творческого потенциала создателей и возможностей программного обеспечени€.

Ќо существующие на данный момент времени решени€ были разработаны с учетом предыдущих идей и требований к производственным процессам, присущим, в первую очередь, стационарным компьютерам и рабочим станци€м. —овременное поколение создателей медиа и графики ориентируетс€ на мобильность и высокую скорость работы как ѕќ, так и самого оборудовани€.

ƒоступные дл€ художников инструменты с GPU-ускорением
«а последнее дес€тилетие сформировалс€ определенный набор инструментов, обеспеченных стабильной поддержкой возможностей современных GPU и CPU, а также специальных модулей расширени€ (панелей управлени€, плат ввода/вывода и обработки видео и др.). ƒл€ создани€ платформы NVIDIA STUDIO разработчики выделили 5 ключевых направлений, а в каждом из них представлено по несколько приложений.

Ќаиболее активным и всеобъемлющим в плане применени€ технологий с активным использованием GPU €вл€етс€ направление 3D и MOTION GRAPHICS. Ёто и неудивительно, так как трехмерна€ графика, анимаци€ и фотореалистична€ визуализаци€ требуют высокой производительности при работе в режиме реального времени. ѕоэтому практически все наиболее попул€рные и распространенные приложени€ обладают поддержкой ускорени€ вычислений с помощью GPU.

HYPERPC PRO T7 STUDIO

–ис. 22

—ледующее направление Ц VIDEO EDITING. «десь стоит отметить важную причину такого акцента внимани€ на данную область. Ќа попул€рные сервисы видеохостингов загружаетс€ очень много контента, который необходимо смонтировать и подготовить за короткие сроки. ѕри этом уже давно пришла эра 4K форматов, и далеко не за горами следующий этап Ч 8K, но дл€ работы с данными форматами необходимо не только съемочное оборудование, но и системы хранени€, и высокопроизводительные рабочие станции. ќсобое внимание удел€етс€ повышению производительности в работе с видео в формате RAW (RED, ARRI, BlackMagick, Canon) и его подготовке на ранних этапах, еще на съемочной площадке. «десь ускорение вычислений с помощью GPU, кодирование и декодирование видео, высокопроизводительные SSD накопители, а также достаточный объем оперативной пам€ти (дл€ CPU и GPU) предоставл€ют высокий потенциал дл€ повышени€ скорости работы как операторов, так и монтажеров и специалистов по визуальным эффектам.

»з личного опыта могу сказать, что, выполн€€ съемки дл€ эффектов, мы работаем с форматом 4K, и зачастую нам хочетс€ получать удачные дубли еще на этапе съемок и сразу передавать на монтаж в DaVinci Resolve, куда заранее были отправлены данные о пути к файлам и их временным меткам. ¬о врем€ съемок мы заранее просматриваем материал, полученный с камеры, и необходимо быстро воспроизводить видео, что ранее было доступно только при наличии MacBook Pro или т€желовесной рабочей станции PC.

¬ направлении PHOTOGRAPHY всего два ключевых приложени€.  омпани€ Adobe активно продвигает свои решени€ дл€ фотографов и обеспечивает их удобными инструментами. » такие приложени€, как Photoshop CC и Lightroom CC, уже давно обладают поддержкой ускорени€ с помощью GPU. Ќо помимо решений от Adobe есть множество хороших инструментов от сторонних разработчиков, которые также используют возможности графических процессоров дл€ обеспечени€ высокой производительности фотографов и дизайнеров.

√рафический дизайн (GRAPHIC DESIGN) €вл€етс€, пожалуй, одним из самых динамичных и мобильных направлений в творчестве современных художников и дизайнеров. ќсобенно актуально это при работе над графическим оформлением видео или при разработке дизайна.

» самое наиболее активное и развивающеес€ направление в современных медиа Ч online трансл€ции и пр€мые эфиры. √лобальна€ сеть »нтернет и развитие мобильных технологий, а также развитие современных медиа, сделали направление BROADCASTING как никогда требовательным к производительным многофункциональным мобильным рабочим станци€м с высокой производительностью в компактном корпусе.

¬ыбор независимых художников
Ќова€ концепци€ и платформа NVIDIA STUDIO ориентируетс€ на независимых разработчиков контента. ƒл€ этого были проанализированы потребности среди независимых художников и дизайнеров, кому может быть полезна равномерна€ уравновешенна€ производительность, но по приемлемой цене, при этом закрывающа€ необходимость в мобильности устройства.
HYPERPC PRO T7 STUDIO

–ис. 23

Ќезависимые дизайнеры и художники используют ноутбуки и бюджетные рабочие станции дл€ создани€ видео, обработки фотографий, публикаций в социальных сет€х и медиа и дл€ удаленной работы над средними и крупными проектами (фрилансеры на аутсорсе). ¬се три группы были расположены между ключевыми группами Ц запись и производство в промышленных масштабах (студии и компании).

ѕомимо распределени€ по категори€м пользователей и выполн€емым ими задачам, при разработке NVIDIA STUDIO была учтена потребность пользователей в производительности и ключевые компоненты, которые пользователи желают обновить в своих компьютерах или ноутбуках.

—огласно проведенным опросам и исследовани€м, пользователи зачастую желают обновить GPU и увеличить объем оперативной пам€ти. » здесь есть больша€ дол€ правды, так как обновление данных компонентов может значительно повысить производительность в задачах и приложени€х, активно использующих вычислени€ на GPU и требовательных к объему ќ«”.

¬ведение в концепцию платформы NVIDIA STUDIO

¬ первую очередь, NVIDIA разработали концепцию платформы, которую могут реализовать производители компьютерной техники, опира€сь на выбор определенных правил и компонентов систем.

¬ основе лежат графические ускорители на основе архитектуры NVIDIA Turing. ѕлатформа NVIDIA STUDIO практически ознаменовала выход мобильных решений на основе GeForce RTX и Quadro RTX, предоставив возможность использовать трассировку луча и другие технологии в мобильных устройствах. “акже это первые мобильные устройства, в конфигураци€х которых можно выбрать GPU с объемом графической пам€ти, равным 16 √б и выше. “акже стоит отметить, что все мобильные системы, разрабатываемые под платформу NVIDIA STUDIO, будут обладать концепцией MAX-Q Design, обеспечивающей реализации тонкого и легкого устройства с высокой производительностью.

HYPERPC PRO T7 STUDIO

–ис. 24

–ассмотрим основные направлени€ и технологии, реализуемые в новых решени€х. ¬ первую очередь Ц NVIDIA RTX. ѕредставленна€ в 2018 году архитектура Turing позвол€ет выполн€ть трассировку луча в режиме реального времени, выполн€ть вычислени€ дл€ работы алгоритмов, использующих возможности »», и выводить высококачественное видео в высоком разрешении с большой частотой кадров.
NVIDIA Studio Stack и платформа NVIDIA RTX
 лючевыми компонентами стека NVIDIA STUDIO €вл€ютс€ форматы представлени€ и передачи данных (MDL и USD), графические API (OpenGL, DirectX и Vulkan) и API дл€ трассировки луча (OptiX, DXR и Vulkan), а также обширный набор библиотек и возможностей, относ€щихс€ к платформе NVIDIA RTX Platform.
HYPERPC PRO T7 STUDIO

–ис. 25

Ќаиболее актуальными на текущий момент развити€ и применени€ в приложени€х €вл€ютс€ рассмотренные ниже компоненты стека NVIDIA STUDIO.

”скорение трассировки луча и алгоритмов »»

Ёто, пожалуй, одна из самых интересных особенностей архитектуры Turing, так как увеличить скорость трассировки лучей удалось только за счет активного использовани€ много€дерных процессоров и алгоритмов прогрессивной визуализации. «десь возможности GPU по ускорению вычислений общего назначени€ показали себ€ лучше всего. Ќо вычисл€ть трассировку лучей в режиме реального времени удалось только в последние пару лет, когда такие API, как DirectX и OpenGL/Vulkan, смогли получить необходимые дл€ этого функции и элементы.

— анонсом архитектуры Turing были представлены решени€ дл€ визуализации, поддерживающие вычислени€ с помощью NVIDIA OptiX, DXR и VKray. ¬ частности, системы визуализации Autodesk Arnold, Autodesk VRED, Chaos Group V-Ray, Unreal Engine и многие другие уже предоставл€ют своим пользовател€м возможности ускорени€ вычислений трассировки лучей в режиме реального времени с помощью €дер RT cores.

HYPERPC PRO T7 STUDIO

–ис. 26

ѕомимо этого, фотографы и специалисты по обработке изображений, использующие Photoshop Lightroom, получили возможность использовать алгоритмы »» дл€ улучшени€ качества фотоснимков.  омпани€ BlackMagic активно развивает новейшую версию DaVinci Resolve 16 Studio с их новым €дром DaVinci Neural Engine, в котором активно используютс€ алгоритмы »». ј Resolve 16.2 получил обновление и расширение функционала с поддержкой »». ¬ данной статье € активно продемонстрировал скорость работы Neural Engine на двух NVIDIA TITAN RTX.

 онечно, реализаци€ новой концепции в первую очередь нацелена на интеграцию в рабочие процессы, в которых активно используетс€ множество приложений, особенно в таких случа€х, когда их используют независимые художники и дизайнеры, у которых высока необходимость применени€ нескольких приложений.

HYPERPC PRO T7 STUDIO

–ис. 27

я однажды сам столкнулс€ с тем, что в последних верси€х Maya возросло потребление графической пам€ти, и зачастую это приводит к некоторому снижению производительности, особенно на GPU с пам€тью меньше 6 √б. ѕоэтому € обновил свой графический ускоритель, приобрет€ NVIDIA GeForce RTX 2080 SUPER. Ќо такие решени€, как протестированна€ мною рабоча€ станци€ HYPERPC PRO 7T STUDIO, показывают более высокую производительность в обработке видео во врем€ монтажа с применением алгоритмов »» и при работе с комплексными модел€ми, что во многом объ€сн€ет применение GPU с 24 √б ќ«”.
HYPERPC PRO T7 STUDIO

–ис. 28

NVIDIA GeForce RTX Studio, NVIDIA TITAN RTX и NVIDIA Quadro RTX Studio

–азработчики платформы NVIDIA STUDIO не стали значительно измен€ть своим иде€м из предыдущих поколений. √рафические ускорители GeForce в первую очередь предназначены дл€ развлечений и разработки игровых приложений, а также дл€ большинства задач, св€занных с разработкой 3D моделей и анимации. Ќо если ваши задачи интенсивно используют графическую пам€ть и есть необходимость в продолжительной поддержке оборудовани€, сертификации от производителей (особенно актуально при работе с госорганизаци€ми и в крупных компани€х), гибком управлении IT-»нфраструктурой и аппаратной обработке видео, включа€ захват и вывод на множество дисплеев, то здесь по-прежнему остаетс€ выбор за профессиональными GPU линейки Quadro.

’очу заметить, что необходимость акцентировать внимание на том, что графические €дра таких приложений, как 3ds max, Maya и т. п., оптимизированы под Quadro, уже давно ушла в историю, сейчас графические €дра приложений компании Autodesk и многих других вендоров сбалансированы функционально и дают высокую производительность как на GeForce, так и на Quadro. «десь нужно делать выбор именно в контексте деталей и определенных задач, которые вы будете выполн€ть с помощью мобильной или настольной рабочей станции и выбранного дл€ нее GPU. ќ возможных процессах применени€ GPU как ускорител€ вычислений € писал в самом начале статьи.

ѕри выборе компьютера, оптимизированного дл€ платформы NVIDIA STUDIO, вам также становитс€ доступна возможность выбора GPU, оснащенного 24+ √б графической пам€ти, что очень актуально при работе с такими €драми визуализации, как Octane Renderer, V-Ray RT GPU, RedShift и другие, а также при загрузке и отображении текстур с высоким разрешением (8K, 12K) и при применении эффектов затенени€ (Ambient Occlusion, MSAA, Lighting и т. п.).

»так, помимо того, что к опорным системным требовани€м NVIDIA STUDIO разработчики относ€т компоненты, подобные представленным в таблице 1,†они также предъ€вл€ют требовани€ к наличию большого объема ќ«” и SSD-накопителей.  онечно, если выбирать дисплей с разрешением 4K дл€ визуализации большого массива пикселей, потребуетс€ более производительный GPU. ƒл€ этого стоит присмотретьс€ к GPU с объемами пам€ти от 8 √б, это на самом деле оптимальный старт дл€ работы с 4K диспле€ми и в то же врем€ дл€ обработки 3D пространства в редакторах компьютерной графики.

Ћинейка мобильных GPU линейки Quadro пополнилась новыми модел€ми. ћодели Quadro RTX 3000, Quadro RTX 4000 и Quadro RTX 5000 предоставл€ю все возможности и функции, за€вленные разработчиками в спецификаци€х к NVIDIA STUDIO. ј вот новые модели, Quadro T1000 и Quadro T2000, €вл€ютс€ представител€ми начального и среднего классов и ограничены в р€де функций, например в трассировке лучей и поддержке виртуальной реальности.

≈диный драйвер дл€ NVIDIA STUDIO GPU`s

“еперь и дл€ GeForce, и дл€ Quadro GPU вы можете загрузить и использовать единый драйвер NVIDIA STUDIO. ќднако хочу заметить, что вы вправе загрузить оригинальные драйверы, которые оптимизированы дл€ работы как с GeForce, так и с Quadro. ≈сли у вас Quadro и вам важен функционал корпоративного уровн€, то следует загружать драйвер Quadro, а дл€ работы с игровыми приложени€ми и дл€ разработки контента в игровых движках типа Unreal Engine или Unity на GPU линейки GeForce можно выбрать родной драйвер GeForce.

ѕомимо вход€щей в состав драйвера оптимизации под различные приложени€ и GPU, в NVIDIA STUDIO Stack также включен NVIDIA STUDIO SDK, который предлагает SDK и API дл€ ускорени€ трассировки лучей, визуализации, редактировани€ и обработки видео, векторной 2D анимации и многого другого. –азработчики приложений также могут добавл€ть в свои разработки функции искусственного интеллекта, такие как супермедленное движение или автоматические метки, с помощью платформы AI в CUDA-X, €вл€ющимс€ отраслевым стандартом дл€ развити€ искусственного интеллекта.

–езультат тестировани€ в практических и синтетических тестах

¬о врем€ тест-драйва рабочей станции HYPERPC PRO 7T STUDIO € сравнил производительность двух графических ускорителей NVIDIA TITAN RTX, объединенных мостом NVLink, который помогает значительно увеличить производительность в работе систем визуализации и алгоритмов машинного обучени€ и »».

HYPERPC PRO T7 STUDIO

–ис. 29. »нформаци€ о GPU NVIDIA TITAN RTX, установленных в системе тестируемой HYPERPC PRO 7T STUDIO

„тобы понимать, как определ€ть производительность GPU, необходимо помнить, что производительность определ€етс€ в решении определенной задачи: насколько быстрее она будет выполнена в сравнении с предыдущим поколением GPU или конкурирующим решением.

¬о врем€ тест-драйва € протестировал GPU с помощью тестов SPECwpc 3 и практических приложений. ¬ частности, превосходный результат показал движок EEVEE, вход€щий в пакет Blender. ƒанный движок очень быстро выполн€л аппаратную визуализацию практически в режиме реального времени.

–езультат тестировани€ NVIDIA TITAN RTX с помощью SPECwpc и SPECviewperf
ѕервый тест затрагивает производительность в вычислени€х на GPU. ¬ тесте использованы приложени€ LuxRender, CAFFE и FAH. ¬ то врем€ как LuxRender и любое другое €дро визуализации может выполн€тьс€ как на CPU, так и на GPU, тесты, посв€щенные машинному обучению и обработке данных, полностью завис€т от GPU.
HYPERPC PRO T7 STUDIO

–ис. 30. –езультат тестов SPECwpc GPU Compute

¬ то врем€ как тестовую сцену LuxRender визуализировал с практически идентичным CPU результатом, алгоритмы, полностью зависимые от GPU, не выполн€лись на CPU. ¬ качестве API был выбран OpenCL, как универсальный дл€ CPU Intel и GPU NVIDIA.

Ќо так как в моем распор€жении была рабоча€ станци€ с двум€ GPU, € протестировал еЄ возможности с помощью теста SPECviewperf в режиме без SLI и активным режимом SLI и сравнил с результатами тестов из моих прошлых обзоров. ƒанный тест показал хорошую производительность графических ускорителей TITAN RTX как в режиме без SLI, так и в режиме SLI.

HYPERPC PRO T7 STUDIO

–ис. 31. –езультаты теста SPEC Viewperf 13 дл€ нескольких систем и моделей GPU

Ќо как показало тестирование, в режиме SLI классические OpenGL приложени€, такие как —јѕ– и приложени€ M&E, могут обладать немного меньшей производительностью. Ќо плюсом таких решений €вл€етс€ возможность более оптимально и рационально использовать графическую пам€ть в модел€х с текстурами, освещением и эффектами затенени€.

’очетс€ заметить, что современные —јѕ– приложени€, такие как Autodesk Fusion 360, поддерживают multi-gpu системы и активно используют возможности всех GPU, объединенных мостом SLI (NVlink).

—интетические тесты показывают только определенные сценарии, заранее проработанные их создател€ми. ¬ практических приложени€х рабочий процесс значительно отличаетс€ и неравномерен. ƒалее € приведу результаты тестов в р€де практических приложений и решении определенных задач, требовательных к высокопроизводительным компонентам системы.

ћоделирование жидкостей в RealFlow 10 с применением GPU

–еализованное в RF10 €дро Dyverso поддерживает вычисление на CPU, на GPU с поддержкой OpenCL и GPU с поддержкой CUDA. ѕри этом разработчики реализовали систему так, что если у вас используетс€ GPU от NVIDIA, то дл€ него автоматически становитс€ доступен алгоритм на CUDA. —тоит отметить, что RF10 поддерживает вычислени€ только на одном GPU. ѕоэтому в multi-gpu системах вы можете выделить один из GPU, который может выполн€ть вычислени€ на CUDA.

HYPERPC PRO T7 STUDIO

–ис. 32. –езультат теста RF Dyverso в расчете 780 кадров анимации карамели

ѕакет RF10 €вл€етс€ хорошим примером применени€ возможностей GPU и архитектуры CUDA дл€ ускорени€ вычислений сложных физических моделей. Ќа основе €дра RF10 создан пакет XFlow, вход€щий в поставку SIMULIA, он также поддерживает вычислени€ на GPU. ≈сли вы занимаетесь расчетами физических моделей и планируете использовать GPU, € рекомендую присмотретьс€ к св€зке решений от NVIDIA и NexLimit дл€ получени€ высокопроизводительных комбинаций оборудовани€ и ѕќ.

¬изуализаци€ в Blender 2.8

Ѕуквально ворвавшийс€ на рынок компьютерной графики и получивший массу грантов от крупнейших вендоров, включа€ NVIDIA, пакет Blender стал активно использовать возможности библиотек NVIDIA CUDA и NVIDIA OptiX. –еализаци€ поддержки возможностей CUDA и OptiX сразу же определила его в качестве одного из самых важных решений, поддерживающих платформу NVIDIA STUDIO.

ƒл€ мен€ Blender остаетс€ отличным инструментом дл€ тестировани€ производительности оборудовани€ в задачах визуализации изображений. Ќа рис. 33 приведена диаграмма, в которой собраны результаты тестов вычислений на GPU нескольких сцен.

HYPERPC PRO T7 STUDIO

–ис. 33. –езультат визуализации трех сцен в пакете Blender

 ак видно из приведенного графа, чем производительнее система, тем меньше времени требуетс€ на визуализацию изображени€. Ќеоспоримым лидером сегодн€шнего теста оказалась система от HYPERPC с двум€ GPU NVIDIA TITAN RTX и при визуализации сцены с применением €дра Blender Cycles, использующего API OptiX. Ёто наименьшее врем€, которое потребовалось €дру дл€ визуализации сцен. ƒл€ большой и комплексной сцены с множеством элементов меха и волос потребовалось всего 132 секунды на кадр, что говорит о высочайшей производительности двух GPU TITAN RTX, работающих в паре и использующих возможности RTX cores и библиотеки NVIDIA OptiX.

¬изуализаци€ изображений с помощью Chaos Group V-Ray

ядро визуализации V-Ray интегрировано практически во все попул€рные 3D и CAD приложени€. ѕользователи 3ds max, Maya, Houdini, Revit, Rhino, Unreal Engine и других приложений используют возможности дл€ создани€ высококачественных образов. ƒаже € использую V-Ray как основное €дро визуализации, иногда переход€ на Arnold, дл€ решени€ специфических задач. „то выдел€ет V-Ray и св€зывает его с экосистемой NVIDIA и платформой NVIDIA STUDIO?

ѕоддержка NVIDIA CUDA Ц €дро V-Ray €вл€етс€ одним из первых решений, активно использующих возможности GPU дл€ ускорени€ процесса визуализации. “акже V-Ray поддерживает аппаратные шейдеры, созданные с помощью €зыка GLSL.

ѕоддержка NVIDIA MDL Ц разработчики шейдеров материалов и текстур могут использовать возможности €зыка описани€ материалов NVIDIA MDL, активно развиваемого сообществом и поддерживаемого системой визуализации NVIDIA iRay. ¬ процессе работы с V-Ray вы можете использовать библиотеку NVIDIA vMaterials, содержащую обширный набор процедурных материалов и текстур, разработанных с помощью NVIDIA MDL.

ѕоддержка NVIDIA OptiX Ц €дро визуализации V-Ray стало одним из первых решений, активно внедрившим поддержку NVIDIA RTX и NVIDIA OptiX. ѕлюсом внедрени€ OptiX €вл€етс€ поддержка высококачественного алгоритма устранени€ шума с помощью NVIDIA AI Denoiser. ƒанный подход позвол€ет значительно быстрее создавать предварительные тесты визуализации с применением Maya Playblast.

я дополнил свою библиотеку измерений и тестов центральных и графических процессоров, производимых с помощью теста V-Ray Benchmark.

HYPERPC PRO T7 STUDIO

–ис. 34. –езультат тестов CPU с помощью V-Ray Benchmark

ѕри тестировании процессор Intel Coe i9-10940X показал превосходство над всеми протестированными ранее процессорами. ¬ процессе работы над одним из проектов € провел несколько тестов с комплексной сценой, котора€ требует большого объема ќ«” и оперирует большими данными (рис. 36), о чем € расскажу ниже.
HYPERPC PRO T7 STUDIO

–ис. 35. –езультат тестов GPU с помощью V-Ray Benchmark

ћне довелось протестировать несколько GPU на различных системах. »спользованные в графической станции HYPEREPC PRO T7 STUDIO графические ускорители NVIDIA TITAN RTX на данный момент показали наиболее производительный результат в тесте, набрав 369 mpaths в режиме с одним GPU и 728 mpaths в режиме с двум€ GPU.
HYPERPC PRO T7 STUDIO

–ис. 36. ѕример комплексной модели, созданной в Maya и визуализируемой с помощью V-Ray for Maya

¬ процессе работы € использую V-Ray RT GPU дл€ разработки материалов, так как GPU позвол€ет выполн€ть данные операции гораздо быстрее по сравнению с CPU. ¬о врем€ тест-драйва HYPERPC PRO T7 STUDIO € протестировал возможности GPU NVIDIA TITAN RTX в процессе разработки образа и материалов дл€ комплексной модели.

 ак и проведенные мною тесты с помощью V-Ray Benchmark, в результате тестов на модели, представленной на рисунке 36, GPU NVIDIA TITAN RTX позволили выполн€ть предварительную визуализацию гораздо быстрее, даже в сравнении с использованной в моей предыдущей рабочей станции NVIDIA GeForce RTX 20870 SUPER.

ѕовысить производительность также можно с помощью обновлени€ оборудовани€, о чем € расскажу в следующем разделе.

ѕрактические тесты в DaVinсi Resolve 16.2
Ѕезоговорочным лидером в применении возможностей GPU дл€ ускорени€ вычислений €вл€етс€ пакет Resolve. Ёто обусловлено его архитектурой и модулем коррекции цвета. ќбработка и коррекци€ цвета €вл€етс€ достаточно требовательной к вычислительным ресурсам задачей. » внедрение поддержки GPU в данный процесс активно способствовало увеличению производительности вычислений в процессе обработки кадров.

Ќиже приведены результаты тестов набора секвенций в DaVinci Resolve, использованных мною в процессе написани€ предыдущих статей, посв€щенных NVIDIA STUDIO.

HYPERPC PRO T7 STUDIO

–ис. 37. —корость сборки видео в DaVinci Resolve с применением GPU NVIDIA и CPU Intel

HYPERPC PRO T7 STUDIO

–ис. 38. —корость сборки видео в DaVinci Resolve с применением алгоритма масштабировани€ на GPU NVIDIA

HYPERPC PRO T7 STUDIO

–ис. 39. —корость сборки видео в DaVinci Resolve с применением алгоритма масштабировани€ на GPU NVIDIA. ”величение видео в четыре раза

HYPERPC PRO T7 STUDIO

–ис. 40. —корость сборки видео в DaVinci Resolve с применением алгоритма »» дл€ замедлени€ и увеличени€ скорости видео

ѕроизводительность GPU NVIDIA TITAN RTX, которые установлены в HYPERPC PRO T7 STUDIO, нагл€дно представлена диаграммами на рисунках 37Ц40. «а счет применени€ алгоритмов на основе »» масштабирование видео, изменение его скорости и реконструкци€ деталей выполн€ютс€ за считанные секунды.  оррекци€ цвета и работа с масками также выполн€ютс€ значительно быстрее, особенно в сравнении с CPU.

–ешени€ на основе платформы NVIDIA STUDIO показывают высокую производительность в работе над сложнейшими проектами, когда выполн€ютс€ объединение 3D анимации, композитинга, процесса монтажа и визуализации. Ќо можно еще повысить производительность системы, выполнив подбор компонентов, которые будут обладать большей производительностью. ¬се задачи, которые € рассмотрел в текущей статье, хорошо поддаютс€ оптимизации и повышению производительности с помощью выбора более производительного CPU и GPU.

Ћинейки компьютеров HYPERPC PRO STUDIO

ќдно из важнейших преимуществ современной компьютерной техники Ц масштабируемость и функциональна€ расшир€емость. –ешени€ HYPERPC PRO выстраиваютс€ в виде трех вертикальных линеек, каждую из которых можно конфигурировать под определенные задачи и приложени€. Ёто удобно, так как легче сделать первоначальный выбор и впоследствии обновить комплектующие и увеличить производительность системы в целом. –ассмотрим вкратце линейку компьютеров HYPERPC PRO.

HYPERPC PRO G Ц младший представитель линейки компьютеров дл€ профессиональных пользователей. ¬ компьютерах линейки PRO G используютс€ процессоры Intel Core i7 и Intel Core i9 10-го поколени€ и графические ускорители линейки NVIDIA GeForce RTX.

ћаксимальный объем ќ«” составл€ет 128 √б (зависит от CPU). ¬ы можете выбрать базовую конфигурацию на основе CPU Intel Core i7 и GPU NVIDIA GeForce RTX 2060 SUPER и при повышении требований к вычислительной мощности компьютера заменить компоненты на CPU Intel Core i9 и GPU NVIDIA GeForce RTX 2080 Ti.

HYPERPC PRO Q Ц старший представитель линейки компьютеров дл€ высокопроизводительных вычислений, опирающийс€ на применение GPU NVIDIA Quadro RTX и ориентированный на применение в решении сложнейших инженерных задач и использующий возможности решений корпоративного уровн€. — помощью рабочих станций линейки Q можно не только решать задачи, св€занные с проектированием и визулизацией, но и развертывать системы виртуализации и работать в области обработки данных (Data Science), где может потребоватьс€ GPU с объемом пам€ти в 24 и 48 √б.  омпьютеры линейки PRO Q могут быть сконфигурированы с применением CPU Intel Core i9 и GPU NVIDIA Quadro RTX 4000 с возможностью расширени€ конфигурации с помощью NVIDIA Quadro RTX 8000. ¬ рабочую станцию может быть установлено до 128 √б ќ«” (в зависимости от CPU).

HYPERPC PRO T Ц линейка компьютеров, специально разработанна€ как баланс между линейками PRO G и PRO Q. я протестировал модель PRO T7, котора€ была сконфигурирована с двум€ GPU NVIDIA TITAN RTX, что позволило оценить производительность графического чипа TU102 в полной мере.  омпьютеры линейки PRO T могут быть сконфигурированы с применением процессоров Intel Core i9 10-го поколени€, и в каждый компьютер может быть установлено до четырех GPU NVIDIA TITAN RTX, что позвол€ет создавать сверхпроизводительные системы, ориентированные на работу с большим массивом данных. “акже компьютер может быть сконфигурирован до 128 √б ќ«”.

 омпьютеры линейки PRO Q и PRO T могут быть созданы на основе платформы AMD. ¬ данной конфигурации используютс€ процессоры AMD Ryzen Threadripper. —ущественным плюсом данной платформы €вл€етс€ доступность установки оперативной пам€ти до 256 √б и поддержка шины PCI-Express 4, что дает основу дл€ обновлени€ на GPU следующего поколени€.

Ѕлагодарности

Ѕлагодарю компании HYPERPC и NVIDIA за предоставленное дл€ тестировани€ и обзора оборудование и информационную поддержку в технических вопросах.

¬о второй части статьи

ѕоддержка возможностей платформы NVIDIA STUDIO в —јѕ–, демонстраци€ возможностей приложений дл€ анимации и игровых движков, знакомство с функционалом драйвера NVIDIA STUDIO и вли€ние на производительность. я продемонстрирую работу таких приложений, как LIRA 10, T-LEX CAD, Autodesk Revit, Autodesk Fusion 360 и других.


ќбзоры ноутбуков MSI на основе платформы NVIDIA STUDIO

Ќа портате RENDER.RU в прошлом году € открыл серию публикаций, посв€щенных платформе и стеку NVIDIA STUDIO. ¬ моем распор€жении оказались два ноутбука компании MSI:

MSI Prestige P65 Creator 9SF Ц инициатива RTX STUDIO в металле

“естирование мобильной рабочей станции MSI Mobile Workstation WS65

ƒополнительные материалы дл€ изучени€

ѕлатформа NVIDIA RTX

ѕлатформа NVIDIA Omniverse

—тек NVIDIA STUDIO


„итайте также:


¬акансии:

јктуальное обсуждение

RSS-лента комментариев

ƒавид Ћевин
ƒавид Ћевин
ќт редактора: √лавное отличие человека от животного в том, что он хочет знать
ѕроект ЂЌародное —јѕ–-интервьюї

—лучайна€ стать€:

isicad Top 10

—амые попул€рные материалы

   ‘орумы isicad:

isicad-2010 isicad-2008
isicad-2006 isicad-2004

ќ проекте

ѕриглашаем публиковать на сайте isicad.ru новости и пресс-релизы о новых решени€х и продуктах, о проводимых меропри€ти€х и другую информацию. јдрес дл€ корреспонденции - info@isicad.ru

ѕроект isicad нацелен на

  • укрепление контактов между разработчиками, поставщиками и потребител€ми промышленных решений в област€х PLM и ERP...
ѕодробнее

»нформаци€ дл€ рекламодателей


¬се права защищены. © 2004-2020 √руппа компаний «Ћ≈ƒј—»

ѕерепечатка материалов сайта допускаетс€ с согласи€ редакции, ссылка на isicad.ru об€зательна.
¬ы можете обратитьс€ к нам по адресу info@isicad.ru.