11 лет назад 10 августа 2007 в 1:58 43

Долгожданный

Автор: Андрей Воленко 

Новое семейство Radeon ждали долго. Альянс AMD/ATI несколько раз переносил анонс нового чипа, в итоге Radeon HD 2900 XT вышел спустя полгода после начала продаж видеокарт на конкурентном чипе NVIDIA. Видеоядро R600 получилось сложным, именно это обусловило неоднократные отсрочки выхода. AMD обещала ускорить релиз, но опыт и арсенал компании не сильно помогли в доводке чипа. Что получилось в итоге, сейчас посмотрим.

ОСНОВНЫЕ МОМЕНТЫ

Чип R600 по сложности не уступает NVIDIA G80. Имея 700 миллионов транзисторов, он изготовляется по 80-нанометровым технологическим нормам. AMD в отличие от NVIDIA использует более прогрессивный технологический процесс для производства топового решения. Это позволило достичь более высоких частот по сравнению с G80. Так, если GeForce 8800 GTX работает на частоте 575 МГц, а Ultra-версия на частоте 612 МГц, то R600 на карте Radeon HD 2900XT по рекомендации ATI должен работать на частоте 750 МГц. Впрочем, стоит оговориться: поскольку разные вычислительные блоки современных видеочипов имеют разные частоты, то упоминание исключительно частоты видеоядра было бы некорректным. В чипах G80 частота шейдерного блока равна 1350 МГц для GTX-версии и 1512 МГц – для Ultra. В R600 шейдерный блок работает на частоте ядра. Radeon HD 2900 XT может иметь 512 или 1024 Мб видеопамяти типа GDDR3 или GDDR4. Пока в продаже доступна версия с 512 Мб GDDR3-памяти.

Примечательно, что карты на базе процессоров ATI, выполненных по более тонким технологическим нормам, с меньшим количеством видеопамяти потребляют больше конкурентных GeForce 8800. GeForce 8800GTX и его ускоренная версия GeForce 8800 Ultra оказываются заметно экономичней, потребляя около 175 Вт в режиме 3D против 215 Вт для Radeon.

АРХИТЕКТУРНЫЕ НОВОВВЕДЕНИЯ

Чтобы понять, что же нам предлагает ATI, рассмотрим некоторые архитектурные нововведения подробней.

Основной вычислительной мощью R600 являются 64 суперскалярных процессора, каждый из которых содержит по пять арифметико-логических устройств (Arithmetic and Logic Unit, ALU) и выделенному блоку выполнения ветвлений. Каждый из 64 процессоров способен выполнять до пяти инструкций за такт. При этом одна из этих инструкций может быть сложной (cos, sin, log, exp и т. д.). AMD в пресс-релизах указывает общее количество ALU, говоря о 320 потоковых процессорах.

Если сравнивать 128 скалярных процессоров чипа G80 и 64 суперскалярных R600, то нельзя однозначно сказать, что лучше. Каждая из архитектур имеет свои плюсы и минусы, поэтому выводы придется делать на основе результатов тестов, а не анализа архитектур.

Загрузкой вычислительных блоков работой занимается диспетчер потоков. Именно он, основываясь на текущих потребностях и приоритетах задач, выносит решение о том, чем будет заниматься каждый конкретный процессор в данный момент.

Использованная архитектура легко масштабируется в обе стороны. В качестве подтверждения можно вспомнить, что выхода бюджетных решений на базе новой архитектуры ATI долго ждать не пришлось, чипы появились достаточно оперативно, куда быстрее, чем долгожданные G84 и G86 – бюджетные последователи G80.

Текстурные блоки в новой архитектуре полностью отделены от потоковых процессоров. Это позволяет начинать выборку данных еще до того, как они запрошены шейдерным блоком. Команду на выборку данных дает диспетчер потоков, в итоге это несколько повышает производительность.

Текстурные блоки в R600 усовершенствованы, одно из главных достоинств в том, что они могут выбирать и билинейно фильтровать FP16 текстуры на той же скорости, что и 32-битные, а FP32 — на половинной, то есть, как и на G80. Также поддерживаются новые 32-битные HDR-форматы текстур, которые появились в DirectX 10, и объявлена поддержка трилинейной и анизотропной фильтраций для всех поддерживаемых текстурных форматов. Максимальное разрешение текстур увеличилось до 8192×8192 (как и у G80), представители AMD/ATI заявляют об улучшенном качестве текстурной фильтрации. В материалах AMD не говорится о “бесплатной” трилинейной фильтрации, так что, скорее всего, она снижает пиковую производительность блоков текстурирования, как во всех чипах, кроме G80.

R600 является первым чипом с поддержкой 512-битной шины памяти. Назвали эту шину Ring Bus, и она является одним из главных достоинств нового чипа. Новая шина включает восемь 64-битных каналов, соединенных внутренней 1024-битной шиной (по 512 бит в каждом направлении). Такая шина обеспечивает очень высокую пропускную способность и хорошо масштабируется. Даже с относительно медленной DDR3 на первых картах удалось переступить через отметку в 100 Гб/с для пропускной способности подсистемы памяти. Дальнейший рост пропускной способности можно легко обеспечить переходом на поддерживаемую контроллером более быструю GDDR-4 память.

Последняя уникальная особенность нового видеоядра – это встроенный программируемый блок тесселяции. Его R600 унаследовал у чипа ATI Xenos, используемого в консоли Microsoft Xbox 360. Тесселяция используется для увеличения геометрической сложности моделей. Повышение детализации низкополигональных моделей позволяет заметно снизить затраты производительности. Так, разработчики могут посылать GPU данные с меньшей сложностью, далее GPU протесселирует модель до нужной сложности и выполнит смещение вершин при помощи специальных текстур. Тесселяция позволяет снизить нагрузку на центральный процессор и шины данных.

При всех плюсах тесселяции не очень понятно, как отнесутся к ней разработчики, захочется ли им отдельно оптимизировать графику под чипы ATI. Только одно совершенно ясно, что портированные с Xbox 360 игры, использующие на консоли тесселяцию, будут использовать ее и на ПК.

Основные технические характеристики Radeon HD 2900 XT и GeForce 8800

AMD Radeon HD 2900 XT NVIDIA GeForce 8800 GTS NVIDIA GeForce 8800 GTX/Ultra
Графический процессор R600 G80 G80
Техпроцесс, нм 80 90 90
Число транзисторов, млн 700 681 681
Частота графического процессора, МГц 750 500 575/612
Эффективная частота работы видеопамяти, МГц 1650 1600 1800/2160
Объем памяти, Мб 512/1024 320/640 768
Тип поддерживаемой памяти GDDR3 / GDDR4
Разрядность шины обмена с памятью, бит 512 320 384
Число унифицированных шейдерных процессоров 320 96 128
Частота работы шейдерного блока, МГц 740 1200 1350/1512
Число текстурных блоков 16 24 32
Поддержка версии Pixel Shaders / Vertex Shaders 4.0 / 4.0
Полоса пропускания видеопамяти, Гб/с 106 64 86,4/103,6
Пиковая потребляемая мощность в 3D-режиме работы, Вт 215 130 175
Приблизительная стоимость, $ 470 330/430 620/790

ПЛАТА HIS RADEON HD 2900 XT

За несколько недель до анонса в Сеть начали просачиваться снимки инженерных образцов карты на новом чипе. Карта пугала огромными габаритами – 30 с небольшим сантиметров, ее длина заметно превышала размеры GeForce 8800 GTX/Ultra. Не каждый корпус принял бы такую карту, в остальных бы возникла масса трудностей из-за того, что карта попросту сильно мешала бы установке жестких дисков, подключению шлейфов и прочей периферии. Однако после выхода оказалось, что розничная версия карты в длину всего лишь 22 сантиметра, то есть на 5 мм короче GeForce 8800GTS.

Референтный дизайн Radeon HD 2900 XT предусматривает два разъема питания: один шестиконтактный, второй восьмиконтактный. Работа карты при этом возможна и при подключении двух шестиконтактных разъемов (как у GeForce 8800 GTX/Ultra), но о разгоне в таком случае можно забыть, должной стабильности не будет.

Система охлаждения традиционно для топового решения занимает два слота расширения в высоту. Штатный кулер видеокарты – это медный радиатор с парой тепловых трубок, охлаждаемый шумной (при максимальной скорости вообще ревущей) турбиной. Стоит отметить, что радиатор отводит тепло исключительно от чипа, для охлаждения памяти применена металлическая платина, не контактирующая с радиатором. Поскольку память на плате расположена также и с тыльной стороны, то и там она охлаждается металлической платиной. Решение достаточно сомнительное. ATI традиционно делает более шумную систему охлаждения, чем это обычно удается NVIDIA.

Конфигурация тестового стенда

Процессор

– Intel Core 2 Extreme X6800 (2,93 ГГц, 4 Мб, 1066 МГц)

Материнская плата

– ASUS P5NT WS (nForce 650i SLI)

Оперативная память

– 2x 1 Гб Corsair CM2X1024-6400C4 (800 МГц, 4-4-4-12)

Жесткий диск

– Seagate Barracuda 7200.7 120 Гб (IDE, 7200 об/мин)

Монитор

– Apple Cinema HD Display (30″, 2560×1600)

Операционная система

– Windows XP Professional Service Pack 2

Результаты тестирования

AMD Radeon HD 2900 XT NVIDIA GeForce 8800 GTS 320 Мб NVIDIA GeForce 8800 GTX
3DMark05 1024×768 17856 15603 17545
1280×1024, 4x AA, 16x AF 14089 11305 14598
2560×1600, 4x AA, 16x AF 7613 3935 8621
3DMark06, SM 2.0 1280×1024 4602 3863 5036
1280×1024, 4x AA, 16x AF 2911 3264 3956
2560×1600, 4x AA, 16x AF 1078 1847 2119
3DMark06, SM 3.0 1280×1024 5114 3856 5161
1280×1024, 4x AA, 16x AF 3166 2635 3650
2560×1600, 4x AA, 16x AF 971 1449 1853
F.E.A.R. 1280×1024 268 209 266
1280×1024, 4x AA, 16x AF 123 107 139
2560×1600, 4x AA, 16x AF 37 27 46
Prey 1280×1024 145 127 160
1280×1024, 4x AA, 16x AF 103 94 132
2560×1600, 4x AA, 16x AF 44 33 48
Call of Duty 2 1600×1200 76 54 77
1600×1200, 4x AA, 16x AF 27 37 65
2560×1600, 4x AA, 16x AF 9 26 33
Battlefield 2 1280×11024 143 139 145
1280×1024, 4x AA, 16x AF 119 105 145
2560×1600, 4x AA, 16x AF 53 25 98

ОЦЕНКА РЕЗУЛЬТАТОВ И ВЫВОДЫ

Оценка результатов может быть двоякой. Если смотреть на Radeon HD 2900 XT как на топовый продукт, то остается только расстроиться. Мы ждали новинки целых полгода, а она по производительности не дотягивает даже до GeForce 8800 GTX. Бдительная NVIDIA зря перестраховалась, выпуская GeForce 8800 Ultra, который оказался совершенно недостижим для нового Radeon.

С другой стороны, если оценивать продукт с чисто потребительской точки зрения, то ситуация оказывается чуть менее грустной. Дело в том, что рекомендованная цена на видеокарту – $399. В нашей рознице она немного выше, но сравнима с GeForce 8800 GTS c 640 Мб видеопамяти. По производительности HD 2900 XT у GeForce несколько выигрывает, поэтому может оказаться неплохим приобретением. Впрочем, по сравнению с GeForce у Radeon есть один очень существенный минус – огромное энергопотребление. Из этого минуса автоматически вытекают повышенные требования к мощности блока питания и эффективности системы охлаждения. Мы уже успели прочувствовать, насколько шумна штатная система охлаждения, которую непременно придется заменить или попросту выбрать карту с альтернативным кулером, когда такие появятся.

Окончательную расстановку сил покажут игры под DirectX 10, для которого новые карты разрабатывались. Однако с трудом верится, что сильное отставание Radeon превратится в преимущество при переходе на новый API.