Автор — эксперт в области аппаратного обеспечения, ведущий направления «комплектующие ПК» сайта 3DNews.ru. Штатный и внештатный сотрудник нескольких IT-изданий, автор более шести сотен статей об аппаратном обеспечении. С 2005 года занимается регулярным тестированием оборудования для высокопроизводительных рабочих станций.
Публикуемая сегодня статья И.Гавриченкова, по согласованию со всеми заинтересованными сторонами, перепечатана с сайта fcenter.ru.
Следует особо отметить, что официальным производителем и поставщиком решений NVIDIA Quadro и Tesla на российском рынке является компания PNY Technologies.
- Введение
- Подробнее о NVIDIA Quadro P4000 и P2000
- Как мы тестировали
- Производительность в CAD/CAM-пакетах
- Вычислительная производительность
- Производительность в игровом 3D
- Энергопотребление
- Выводы
Введение
Совсем недавно мы опубликовали обзор Quadro P6000 и Quadro P5000 – флагманских представителей свежего семейства видеокарт NVIDIA для рабочих станций, которые были анонсированы в середине прошлого года. В нём говорилось о том, что NVIDIA обновляет линейки профессиональных видеоускорителей ступенчато, и выпуск основанных на архитектуре Pascal карт Quadro среднего уровня может состояться не слишком скоро. Однако реальность оказалась несколько иной, и в прошлом месяце линейка Quadro претерпела достаточно серьёзные изменения. NVIDIA решила одним махом обновить все свои профессиональные карты среднего и нижнего сегментов, и перевести их со старых архитектур Kepler и Maxwell на наиболее современную основу поколения Pascal. Кроме того, компания добавила в линейку продуктов не имеющий аналогов среди предшественников бескомпромиссный акселератор высокого уровня Quadro GP100, который, в отличие от всех остальных своих собратьев, получил сразу всё самое лучшее, что можно было собрать на современном технологическом этапе: чип GP100 «Big Pascal», HBM2-память и высокую производительность при работе с вещественными числами 64-битной разрядности.
Подробнее о NVIDIA Quadro P4000 и P2000
Детально о том, какие новые возможности архитектура Pascal может принести в профессиональные ускорители, мы уже говорили. Это отнюдь не одно только увеличение производительности, ставшее возможным благодаря внедрению при производстве графических процессоров современного технологического процесса с 16-нм нормами, который в свою очередь позволил производителю нарастить частоты GPU и добавить некоторое количество дополнительных CUDA-ядер. Чипы Pascal дают новым Quadro и новые возможности. Так, теперь благодаря поддержке DisplayPort 1.4 они могут работать с 5K-мониторами (с частотой вертикальной синхронизации 60 Гц), а также обладают технологией Simultaneous Multi-Projection (SMP), полезной для построения сцен в виртуальной реальности.Тем не менее, новые Quadro PXXXX чётко замещают собой предшественников из серий MXXXX и KXXXX, отправляя старые модели в категорию устаревших. За несколько последних лет NVIDIA смогла выработать сбалансированную матрицу продуктов, поэтому добавление каких-либо моделей с непривычным сочетанием цен, возможностей и TDP вряд ли имеет смысл. Иными словами, к Quadro P4000 и P2000 прежде всего стоит относиться к осовремененным альтернативам Quadro M4000 и M2000.
Тем не менее, Quadro P4000 обладает достаточно высоким уровнем быстродействия. Значительный рост тактовой частоты по сравнению с M4000 вкупе с добавлением некоторого числа дополнительных CUDA-процессоров делает P4000 примерно вдвое более производительным профессиональным акселератором по сравнению с предшественником. И даже более того, при сопоставлении новой и предшествующей линеек Quadro оказывается, что по вычислительной производительности P4000 почти на четверть превосходит и M5000.
Несмотря на значительный по сравнению с M4000 рост скоростных характеристик, Quadro P4000 может похвастать весьма умеренными тепловыми характеристиками. Расчётное тепловыделение платы составляет всего лишь 105 Вт, и это на 15 Вт ниже расчётного тепловыделения Quadro M4000. Таким образом, с точки зрения удельной производительности на каждый затраченный ватт P4000 лучше своей предшественницы более чем в 2,3 раза. Именно поэтому модернизация рабочих станций с переходом от M4000 к новой P4000 может иметь немалый смысл.
Поскольку Quadro P4000 – видеокарта с однослотовым дизайном, на ней имеется лишь четыре выхода DisplayPort 1.4, к которым можно подключать как 4K-мониторы (4096 x 2160) с частотой вертикальной синхронизации 120 Гц, так и 60-герцовые 5K-мониторы (5120 x 2880). Одной картой поддерживается до четырёх таких мониторов одновременно. Однако с применением двух дополнительных плат Quadro Sync II из восьми Quadro P4000 можно собрать единый массив, который сможет выводить информацию на объединённую «стену», составленную из 32 мониторов.
Стоимость Quadro P4000 прогнозируется на уровне $800, Quadro P2000 же, судя по имеющимся данным, будет стоить в районе $500. Поступление карт в продажу ожидается в ближайшее время.
Как мы тестировали
Тестирование профессиональных видеокарт мы выполняли, используя в качестве платформы рабочую станцию, основанную на восьмиядерном процессоре Intel Core i7-6900K с архитектурой Broadwell-E, разогнанном до частоты 4,0 ГГц. Также, в составе тестовой платформы использовалась материнская плата на чипсете Intel X99 и 32 Гбайт скоростной четырёхканальной памяти стандарта DDR4-2666 SDRAM. Вместе с профессиональными видеокартами, относящимися к поколению Pascal, в сравнении приняли участие флагманские карты предыдущего поколения.Таким образом, для тестов было задействовано следующее оборудование:
- Процессор: Intel Core i7-6900K на частоте 4,0 ГГц (Broadwell-E, 8 ядер + HT, 20 Мбайт L3).
- Процессорный кулер: Noctua NH-D15.
- Материнская плата: ASUS X99-Deluxe (LGA2011-v3, Intel X99).
- Память: 4 × 8 Гбайт DDR4-2666 SDRAM, 15-15-15-35 (2 x Patriot Viper 4 PV416G300C6K).
- Видеокарты:
- NVIDIA Quadro P5000;
- NVIDIA Quadro P4000;
- NVIDIA Quadro P2000;
- NVIDIA Quadro M5000;
- NVIDIA Quadro M4000;
- NVIDIA Quadro M2000.
- Дисковая подсистема: Kingston HyperX Savage 480 GB (SHSS37A/480G).
- Блок питания: Corsair RM850i (80 Plus Gold, 850 Вт).
Тестирование проводилось в операционных системах Windows 7 Professional SP1 x64 и Microsoft Windows 10 Enterprise Build 10240.
Использовавшиеся версии драйверов:
- Intel Chipset Driver 10.1.2.80;
- Intel Management Engine Interface Driver 11.0.0.1172;
- Intel Turbo Boost Max Driver Version 1.0.1.9;
- NVIDIA Quadro Driver Release 376.84.
Для тестирования производительности в CAD/CAM-пакетах Autodesk 3ds max, Autodesk Maya, Dassault Systèmes SolidWorks и в PTC Creo использовались тесты, специально разработанные корпорацией Standard Performance Evaluation Corporation (SPEC). Для оценки скорости работы в Autodesk AutoCAD использовался тест Cadalyst Systems Benchmark. Кроме того, для прочих аспектов производительности применялись некоторые синтетические тесты: Futuremark 3DMark 2.3.3663, Luxmark 3.1 и Compubench CL 1.5 Desktop Edition.
Производительность в CAD/CAM-пакетах
SPECviewperf 12.1
При тестировании профессиональных видеоускорителей первым делом мы всегда обращаемся к синтетическому тесту SPECviewperf, который за время своего существования занял место индустриального стандарта при первичной оценке производительности высокопроизводительных рабочих графических станций. Моделируя типовую нагрузку, этот тест показывает «чистую геометрическую» производительность ускорителей при работе через OpenGL и DirectX, которая определяется как аппаратными особенностями, так и качеством оптимизации драйверов. Принцип работы этого теста заключается в передаче графическому драйверу заранее сформированных трасс – последовательностей команд, задающих визуализацию сложных моделей, характерных для тех или иных профессиональных приложений.
Встроенные в SPECviewperf используемой нами двенадцатой версии скрипты воссоздают деятельность пользователя в окнах проекции в следующих профессиональных приложениях (в скобках приводятся названия соответствующих тестов): 3ds max 2016 (3dsmax-05), CATIA V6 R2012 (catia-04), Creo 2 (creo-01), Energy – абстрактный программный пакет для геологоразведки месторождений нефти и газа (energy-01), Maya 2013 (maya-04), Medical – проприетарное программное обеспечение для объёмного рендеринга изображений, формируемыми KT и МРТ сканерами (medical-01), Showcase 2013 (showcase-01), Siemens NX 8.0 (snx-02), Solidworks 2013 SP1 (sw-03). Результатом тестов выступает частота кадров при работе с теми или иными моделями. Тест выполнялся в разрешениях 1920 × 1200 и 3840 × 2160.
В частности, сравнительно недорогая Quadro P4000 не просто достаёт до уровня карты прошлого поколения, стоящей на ступеньку выше, как это происходило при смене семейств раньше. Она поднимается гораздо выше и обеспечивает очень заметное преимущество даже на фоне Quadro M5000. Аналогичным образом проявляет себя и Quadro P2000. Производительность этого ускорителя попадает в промежуток между M4000 и M5000. В итоге, произошедшее обновление линейки Quadro в какой-то мере можно назвать революционным. Дело в том, что благодаря внедрению архитектуры Pascal карт уровня P2000 и P4000 теперь может хватать для работы в системах автоматизированного проектирования и трёхмерного моделирования даже в 4K-разрешении.
Autodesk 3ds Max 2015
Тестирование в одном из популярнейших пакетов трёхмерного моделирования мы выполняли при помощи теста SPEC, который объединяет в себе 48 различных подтестов, направленных на комплексные измерения скорости моделирования, интерактивной графики и визуальных эффектов. Используемая нами версия этого бенчмарка работает с 3ds max 2015 SP4. Это – достаточно свежая версия пакета, а значит, в тесте задействуются новые шейдеры DirectX 11, векторные карты, новый движок визуализации окон проекции Nitrous и многие другие современные динамические и визуальные эффекты. Тесты проводились трижды: в разрешении 1920 × 1200 с использованием сглаживания 8x и без него, а также в разрешении 3840 × 2160 без сглаживания.
Более подробные данные о скорости работы новинок при различных аспектах нагрузки можно получить на следующих диаграммах.
Autodesk AutoCAD 2016
Ещё одно популярное приложение для трёхмерного проектирования, работающее через интерфейс DirectX – это AutoCAD. Нагрузка на ускорители, создаваемая этим пакетом, не слишком велика, и с работой в нём прекрасно справляются даже игровые графические карты, но, тем не менее, разница в производительности решений разного уровня вполне заметна и особенно отчётливо проявляется при повышении разрешения. Для проверки производительности в AutoCAD мы использовали тест Cadalyst Systems Benchmark, который был проведён как в стандартном разрешении 1920 × 1200, так и с 4K-монитором в разрешении 3840 × 2160.
Однако это всё же не совсем так. Дело в том, что некоторые режимы отображения 3D-моделей всё-таки создают заметную графическую нагрузку. Например, наибольшими аппетитами выделяются каркасный и реалистичный режимы (Wireframe и Realistic). Именно ради них и имеет смысл отдавать предпочтение новым профессиональным видеокартам поколения Pascal, которые могут обеспечить более высокую плавность и точность отображения.
PTC Creo Parametric 3.0
Система автоматизированного проектирования Creo – очень популярный инженерный инструмент, являющийся наследником пакета Pro/Engineer. Используемый нами бенчмарк разработки SPEC оперирует несколькими различными моделями, которые раскрывают разные аспекты производительности пакета Creo, в том числе и новые возможности, введённые в третьей версии этого программного обеспечения. Например, тест активирует порядко-независимую модель прозрачности поверхностей (Order Independent Transparency), методику SSAO (преграждение окружающего света в экранном пространстве), усовершенствованные материалы и рельефное текстурирование. Тесты проводились в двух разрешениях: 1920 × 1200 и 3840 × 2160.
Кроме того, не стоит забывать, что различные режимы отображения моделей в окнах проекции создают разнородную нагрузку, и в каких-то случаях более мощные профессиональные ускорители могут сыграть куда более значимую роль, чем показано на диаграмме с интегральным результатом теста. Для того, чтобы убедиться в этом, давайте посмотрим на производительность новинок в Creo Parametric 3.0 более подробно.
Autodesk Maya 2016
Популярный редактор трёхмерной графики Maya 2016 – это хороший пример профессионального приложения, использующего интерфейс OpenGL. Причём, графический движок Viewport 2.0 в последних версиях Maya наконец-то переведён на современную версию OpenGL 4.x, в то время как в старых версиях использовался OpenGL 2.x. Именно поэтому для Maya стало важным использовать современные профессиональные видеокарты, драйверы которых полноценно поддерживают этот API. Для тестирования производительности мы воспользовались бенчмарком разработки SPEC, который был адаптирован к современной версии Maya и 4K-разрешению.
Если же заняться анализом результатов более подробно, то можно получить следующую картину.
Solidworks 2015
SolidWorks — это распространённый программный комплекс САПР для автоматизации работ промышленного предприятия на этапах конструкторской и технологической подготовки производства. Используемый нами бенчмарк SPEC для этого пакета использует объёмные модели со сложностью до 4,75 миллионов треугольников и использует три новых эффекта отображения RealView, Ambient Occlusion и Shadows в сочетании с базовыми стилями: с затенением и с затенением с видимыми кромками. Кроме того, в тесте используется порядко-независимая прозрачность и полноэкранное сглаживание. Тесты проводились в разрешении 1920 × 1200 с полноэкранным сглаживанием и без него, и в разрешении 3840 × 2160 без сглаживания.
Всё перечисленные новые возможности могут быть весьма кстати именно в SolidWorks, так как эта САПР поддерживает сложные визуальные стили.
Включение RealView и Ambient Occlusion накладывает серьёзную нагрузку на GPU, поэтому в этом случае производительные ускорители действительно необходимы. Особенно хорошо это видно на последних диаграммах с результатами при активации Ambient Occlusion. Видеокарты поколения Pascal выступают здесь значительно убедительнее по сравнению с предшественницами. Quadro P2000 опережает не только M2000, но и M4000, а Quadro P4000 оказывается способной на соперничество с флагманами прошлого поколения.
Вычислительная производительность
Профессиональные графические карты могут использоваться и при финальном рендеринге. Многие алгоритмы рендеринга свободно переносятся на параллельные процессоры GPU, и за счёт этого получают возможность более эффективного исполнения. NVIDIA, например, даже развивает собственную технологию фотореалистичного рендеринга NVIDIA Iray. Но для целей тестирования мы пользуемся другим движком для построения фотореалистичных изображений методом трассировки лучей, использующим мощности графических карт через универсальный программный интерфейс OpenCL, – LuxRender. LuxRender имитирует распространение света в реальности при помощи специальных алгоритмов и существует в версиях для следующего специализированного ПО: Blender, 3dsmax, SketchUp, C4D, XSI, Poser и др.Для измерения скорости работы LuxRender мы воспользовались тестовым приложением LuxMark 3.1 и двумя сценами: Newmann TLM-102 SE средней сложности и Hotel Lobby с высокой сложностью.
Другим тестом, на базе которого мы делали выводы о вычислительной производительности, стал кроссплатформенный CompuBench CL. Он способен оценить вычислительную скорость графических процессоров при разной нагрузке, например, при физической симуляции частиц или поверхности жидкости, либо при распознавании лиц.
Производительность в игровом 3D
По традиции тестирование производительности профессиональных видеокарт мы завершаем, приводя их результаты в игровом тесте Futuremark 3DMark. Как нередко отмечается, у профессиональных карт обычно существуют геймерские прообразы. Сегодня же ситуация такова, что, хотя Quadro P4000 и P2000 и основываются на чипах GP104 и GP106, прямых аналогов среди игровых видеокарт у них нет. А потому тестирование производительности в 3DMark Fire Strike Ultra и представляет особый интерес: оно позволяет понять, на каком уровне находится DirectX-производительность рассмотренных решений.
Энергопотребление
Обновление профессиональных графических карт с внедрением архитектуры Pascal проведено таким образом, чтобы пользователи имели возможность заменить старые ускорители Quadro на новые без внесения каких-то изменений в систему питания или охлаждения. То есть, Quadro P4000 и P2000 номинально потребляют электроэнергии и выделяют тепла не более своих предшественников, а их габариты такие же, как у соответствующих карт поколения Maxwell.Для того, чтобы проверить ситуацию с энергетическими и тепловыми характеристиками на практике, мы измерили фактический уровень энергопотребления полных систем (без монитора), оснащённых различными профессиональными видеокартами. Используемый нами в тестовой системе новый цифровой блок питания Corsair RM850i позволяет осуществлять мониторинг потребляемой и выдаваемой электрической мощности, чем мы и воспользовались для практических измерений. То есть, на следующем ниже графике приводится полное потребление систем, измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается. Нагрузка для определения пикового потребления создавалась тестом FurMark 1.18.2, запущенным в режиме «Burn» в окне с разрешением 1280х720. Такой вариант нагрузки хорош тем, что он, как и большинство профессиональных приложений, использует API OpenGL.
Отдельно стоит сказать и о том, что применённые на средних картах поколения Pascal системы охлаждения отлично справляются со своей работой несмотря на достаточно скромные габариты. Процессоры GP104 и GP106 выпускаются с применением современного техпроцесса с 16-нм нормами, поэтому нагреваются они совсем не сильно. Даже при предельной нагрузке температура чипа GPU у Quadro P4000 и P2000 не выходит за пределы 80-85 градусов, а максимальная скорость вращения вентиляторов в обоих случаях составляет порядка 2500 оборотов в минуту. И это значит, что новые видеокарты заведомо не смогут причинить своим пользователям никакого акустического дискомфорта.
Выводы
Итак, профессиональные графические карты на базе архитектуры Maxwell стали, наконец, вчерашним днём. У всех карт серии Quadro MXXXX теперь есть достойные последователи с более новой архитектурой Pascal. Причём, на этот раз NVIDIA удалось сделать очень серьёзный шаг вперёд, который перевёл решения на базе Maxwell в категорию устаревших продуктов не только по формальным признакам. Производительность новых Quadro PXXXX действительно впечатляет. Так, любая из двух рассмотренных нами в обзоре средних карт нового поколения, P4000 и P2000, не только опережает свою прямую предшественницу, но и обгоняет карту прошлого поколения уровнем выше. А это значит, что быстродействие, которое раньше было свойственно лишь наиболее дорогим высокопроизводительным рабочим станциям, сегодня доступно по гораздо более низкой стоимости – в среднем ценовом сегменте.Впрочем, эти же тесты показали, что столь высокая производительность требуется далеко не всегда. Нагрузку, которая способна загрузить хотя бы карты уровня Quadro P4000 и P2000, создают далеко не все приложения, особенно если речь идёт о работе в FullHD, а не 4K-разрешениях. С другой стороны, инженерных пакетов, которые достойны видеоускорителей такого класса, не так уж и мало, и здесь в качестве примеров можно привести достаточно солидный список, включающий SolidWorks, Creo, Catia, Maya, 3ds max и проч. Многие средства проектирования и моделирования постепенно приходят к необходимости использования в окнах проекции улучшенных эффектов визуализации. Дополнительная реалистичность становится всё более востребована, так как она позволяет сделать работу инженера более комфортной и продуктивной. Ускорители класса Quadro P4000 и P2000 хорошо подходят для таких случаев: как мы видели, с ними включение затенений и отражений в окнах проекции не приводит к падению производительности до недопустимых уровней. И это значит, что для профессиональной работы в современных системах автоматизированного проектирования и трёхмерного моделирования они способны стать весьма достойным вариантом.
При этом стоит подчеркнуть, что если говорить о видеокартах именно для САПР, то во многих случаях предложения уровня Quadro P6000 и P5000 на сегодня являются избыточными. Об этом мы говорили в нашем прошлом обзоре, и можем повторить это снова. Quadro P4000 и P2000 же хороши тем, что при таких применениях они предлагают вполне адекватную скорость по сравнительно невысокой цене. И вполне вероятно, что благодаря данному сочетанию качеств именно эти видеокарты станут одним из самых популярных выборов среди профессиональных инженеров. Кроме того, Quadro P4000 выступает младшей профессиональной видеокартой NVIDIA, которая подходит для работы с виртуальной реальностью, что открывает перед ней дополнительные горизонты.
Официальным производителем и поставщиком профессиональных видеокарт NVIDIA Quadro в Россию является компания PNY Technologies.