В среду компания Nvidia раскрыла подробности о графическом процессоре нового поколения, известном под кодовыми именами G300, GT300 или NV60. Новое семейство процессоров, которое нарекли Fermi, создается с целью обеспечить большую вычислительную мощь в приложениях общего назначения.
"Очевидно, что GPU перестали быть просто графическими чипами - теперь они являются сопроцессорами, совмещающими задачи по просчету графики с задачами общего назначения. Архитектура Fermi, интегрированные инструменты, библиотеки и используемые механизмы обработки являются прямым результатом нашей совместной работы с тысячами разработчиками CUDA, разбросанных по всему миру. Через несколько лет мы оглянемся и увидим, что Fermi стала основой для новой отрасли GPU" - говорит Джен-Хсун Хуанг (Jen-Hsun Huang), исполнительный директор Nvidia Corp.
Флагманский графический процессор Fermi будет оснащен 512 потоковыми процессорами (которые организованы в 16 потоковых мультипроцессоров по 32 ядра в каждом), поддерживающими многопоточную технологию для увеличения использования ядер. Каждый потоковые процессор имеет конвейерным целочисленным ALU (абб. от arithmetic logic unit) и FPU (абб. от floating point unit). Чип содержит 3 миллиарда транзисторов, 384-битный контроллер памяти GDDR5 с ECC и оснащается кэшем второго уровня размером 768Кб, а также обладает более сложной иерархией кэша в целом. Линейка чипов Fermi совместима с DirectX 11, OpenGL 3.x и OpenCL 1.x. Новые чипы планируется изготавливать по 40нм технологическому процессу на мощностях TSMC.
В предыдущих GPU Nvidia использовалась арифметика плавающей точки IEEE 754-1985, а в архитектуре Fermi реализован новый стандарт операций с плавающей точкой под номером IEEE 754-2008, в котором добавлены новые инструкции - так называемые FMA-инструкции (абб. от fused multiply-add). По информации Nvidia, флагманский чип сможет обрабатывать до 512 FMA-операций за такт с плавающей точкой (однократной точности) или 256 FMA-операций за такт (двухкратной точности). As В результате новый чип может быть в 8.5 раз быстрее по сравнению со своим предшественником, чипом серии GeForce GTX 200, с точки зрения скорости обработки с двухкратной точностью на той же частоте. Пиковая пропускная способность чипа при операциях однократной точности превышает 2.13ТФЛОПс.
Для самой Nvidia семейство Fermi представляется чем-то большим, нежели новой линейкой графических процессоров. Компания заявляет, что новые GPU предназначены для решения вычислительных задач общего назначения, именно поэтому они оснащены массивным объемом кэш-памяти, поддерживают стандарт IEEE 754-2008 и т.д.
"Nvidia и команда Fermi сделала гигантский шаг вперед на пути к тому, чтобы сделать GPU привлекательнымы для более широкого класса приложений. Думаю, что история запомнит появление Fermi как важную веху в компьютерной индустрии" - заявил Дейв Паттерсон (Dave Patterson), директор лаборатории исследования параллельных вычислений в университете Беркли и соавтор книги "Компьютерная архитектура: количественный подход".
К сожалению, Nvidia не поделилась иной информацией о конфигурации графических процессоров, созданных на базе архитектуры Fermi, равно как и не сообщила ориентировочных сроков появления готовых решений.
Источник: http://www.xbitlabs.com
Перевод: deeper2k