Intel Xeon 5500 Series: архитектура Nehalem - особенности подбора процессора и памяти
27 июля 2009
30 марта 2009 года, состоялся выход на рынок процессоров фирмы Intel – Xeon серии 5500, основанный на архитектуре Nehalem. Вокруг этих процессоров еще задолго до их появления ходила масса слухов и домыслов, касающихся их невероятной производительности, каким-то совершенно особенным способом работы с оперативной памятью и самое интересное – это их интеллектуальное управление соотношением собственной производительности и энергопотребления. В этой статье будет рассмотрена важная дилемма, с которой сталкиваются специалисты при составлении конфигурации сервера, а именно, связке «Процессор+память».
Главной инновацией Intel при построении архитектуры Nehalem явилось интеграция контроллера памяти в CPU. Эта идея, в общем, не нова, но в данный момент развития многопроцессорных систем Intel пришлась очень вовремя. Разберемся подробнее, почему: ранее, память «общалась» с процессором посредством Front Side Bus (FSB), частоты которой вполне хватало для трансфера данных между CPU и RAM, но с появление многоядерных процессоров, нарастанием их вычислительной мощности с большой скоростью, пропускная способность FSB перестала успевать расти вслед за увеличивающейся огромными темпами производительностью CPU. Особенно сильно это проявилось при появлении 4х процессорных многоядерных систем. Даже повышение частоты FSB с 1333 МГц до 16000 МГц в старших моделях не могло исправить ситуацию, и инженерами Intel было найдено решение, воплотившееся в архитектуре Nehalem – им стало появление встроенного контроллера памяти в процессоре и появлением специализированной шины для обмена данными между северным мостом и CPU. Сам процессор разделен на две части, которые, хоть и расположены на одном кристалле, работают на разных частотах. Первая, так называемая Core-часть, включает собственно вычислительные ядра и кэши L1 и L2. В Uncore-части находятся кэш L3, контроллеры памяти и шины QuickPath Interconnect (QPI), о которой мы расскажем чуть ниже. Благодаря такому разделению Intel получила возможность гибко управлять частотами ядер, обеспечить работоспособность и приемлемое тепловыделение большого объема кэша L3.

Контроллер памяти, установленный в новую платформу Intel серии 5500 дает пропускную способность до 64 Гб/с по 6 каналам памяти. Платформа поддерживает до 3х каналов на процессор, причем на каждый канал приходится по 3 DIMM слота. Но действительное количество слотов зависит от дизайна материнской платы. Предполагается, что основное направление материнских плат будут иметь по два слота на канал, но окончательная конфигурация системы памяти зависит от клиента, его потребностей и пожеланий.
Процессоры Intel Xeon серии 5500 работает с памятью в следующих режимах:
· Рабочие частоты памяти: 800MHz, 1066MHzи 1333MHz
· Типы используемой памяти памяти: Регистровая (RDIMM) и небуферизованая (UDIMM) память; Single-rank (SR), dual-rank (DR) andquad-rank (QR).
Выбор процессора и памяти
Составляя конфигурацию на базе чипсетов Intel 5500/5520, в частности выбирая процессор и память, следует помнить, что это важнейшая связка в системе, определяющая производительность и ее выбор должен быть основан на требованиях приложения, с которым она будет работать.
В приведенной ниже таблице видно, как строятся конфигурации памяти
|
Требования к RAM
|
Максимальная пропускная способность
|
Сбалансированая производительность
|
Максимальная емкость
|
|
Примеры применения
|
Высокопроизводительные решения
|
Общие задачи, производственные нагрузки
|
Виртуальные решения
|
|
Память/Процессор
|
DDR1333 / 32Gb/s / 48 GB
|
DDR1066 / 25,5 Gb/s / 96 Gb
|
DDR800 / 19,2 Gb/s / 144 Gb
|
|
Производительный
8 Мб кеш-память
6,4 GT/s
HT
Турбо-режим
|
X5570 / 2,93 Ghz
X5560 / 2,80 Ghz
X5550 / 2,66 Ghz
|
X5570 / 2,93 Ghz
X5560 / 2,80 Ghz
X5550 / 2,66 Ghz
|
X5570 / 2,93 Ghz
X5560 / 2,80 Ghz
X5550 / 2,66 Ghz
|
|
Средний класс
8 Мб кеш-память
5,8 GT/s
HT
Турбо-режим
|
|
E5540 / 2,53 Ghz
E5530 / 2,40 Ghz
E5520 / 2,26 Ghz
|
E5540 / 2,53 Ghz
E5530 / 2,40 Ghz
E5520 / 2,26 Ghz
|
|
Начальный класс
4 Мб кеш-память
4,8 GT/s
|
|
|
E5506 / 2,13 Ghz
E5504 / 2,00 Ghz
E5502 / 1,86 Ghz
|
Практические примеры на основании таблицы:
Максимальная пропускная способность
Компоненты схемы:
- 6 модулей DDR3 c частотой 1333 МГц, по три для каждого CPU
- 2 процессора Intel Xeon X5550 (2,66 GHz) или старше, например два Intel Xeon X5560 (2,80 GHz)
Характеристики схемы:
- Максимальная емкость системы памяти- 48 Гб. Рабочая частота – 1333 MHz
- Пропускная способность системы памяти 32 Гб/с
Сбалансированная производительность
Компоненты схемы:
- 12 модулей DDR3 c частотой 1066 МГц, по шесть для каждого CPU. Рабочая частота – 1033 MHz
- 2 процессора Intel Xeon E5520 (2,26GHz) или старше, например E5550 (2,66 GHz)
Характеристики схемы:
- Максимальная емкость системы - 96 Гб
- Пропускная способность системы памяти 25,5 Гб/с
Максимальная емкость
Компоненты схемы:
- 18 модулей DDR3 c любой частотой, по девять для каждого CPU. Рабочая частота – 800 MHz
- 2 любых одинаковых процессора серии Intel Xeon E5500.
Характеристики схемы:
- Максимальная емкость системы - 144 Гб
Пропускная способность системы памяти 19,2 Гб/с
Сценарии для принятия решения при выборе комбинации RAM+CPU
Максимальная емкость:
Как правило, окружение в виде виртуальных серверов, получает максимальную отдачу от «железа» в случае использования больших объемов памяти и «топовых» высокопроизводительных процессоров.
Сбалансированная производительность:
При решении общих задач, когда емкость памяти и производительность процессора должна быть сбалансирована, в зависимости от нагрузки на процессор можно выбрать CPU из группы «Средний класс» или «Производительный», кроме того, наличие технологий Hyper Threading (увеличивающая производительность за счет распараллеливания вычислений и решения разнотипных задач, что характерно для сервера) и Turbo Boost (в моменты пиковой нагрузки позволяет увеличивать мощность процессора) будут хорошим подспорьем.
Максимальная производительность:
Выскоропроизводительные системы получат максимальную отдачу от использования процессоров Производительной группы, и памяти DDR3 на частоте 1333 MHz
Главные правила при оптимизации производительности памяти
При установке памяти, в первую очередь увеличивайте число занятых каналов
Делите поровну модули между каналами и процессорными сокетами.
Интегрированый в процессор контроллер памяти дает возможность для гибкого конфигурирования системы памяти, но при этом конфигурация такой системы сопряжена с некоторыми сложностями. Помните, более быстрый процессор в любом случае будет давать лучшую производительность. Если вам необходима максимальная пропускная способность памяти, конфигурируйте систему так, чтобы память работала на частоте 1333 МГц. В случае, если требуется максимальная емкость оперативной памяти, используйте любой процессор, с поправкой под требования ваших задач к тактовой частоте процессора.
Кроме того, есть общие правила, которые позволят максимизировать производительность системы.
Во-первых, старайтесь максимизировать число занятых каналов памяти.
Во-вторых, делите поровну модули между каналами и процессорными сокетами. Например, если вы поставили в канал для первого процессора один модуль памяти, вам следует установить такой же модуль, с такими же характеристиками, от того же производителя в тот же канал, но к другому процессору.
При выборе памяти для сервера, какой тип следует устанавливать (Registered DIMM или Unbuffered ECC) Intel рекомендует следующее:
Registered DIMM – в том случае, если используется трехканальный режим с установкой 4 или 8 Гб модулей, то есть подразумевается, что пользователю требуется большой объем памяти, либо требуется крайне высокая степень надежности. Для упрощения принятия решения, можно руководствоваться простым правилом – при установке более 12 Гб памяти необходимо устанавливать память типа Registered ECC DDR3.
Unbuffered ECC – в том случае, если планируется использовать 1 или 2 Гб модули, в совокупности с невысокой ценой и относительно небольшим объемом памяти – до 6 Гб.
Заключение.
В заключении рассмотрим три рекомендации, которые дает Intel специалистам, выбирающим сервер для себя или задач своих клиентов:
1. При выборе процессора и памяти следует помнить следующее: в архитектуре Intel Nehalem комбинация памяти и процессора являются строго взаимосвязанными компонентами, то есть выбор процессора и памяти должен осуществляться комплексно, с «оглядкой» друг на друга.
2. Выбирая процессор и память, внимательно изучите задачи, которые будет решать этот сервер/рабочая станция. Правильный ответ на вопрос «Что для меня важнее, частота или объем памяти?» позволит достигнуть от вложенных средств максимальной отдачи.
3. Если сервер не используется в критически важный областях, или не работает с приложениями чрезвычайной важности – выбирайте не менее надежную память Unbuffered ECC, это позволит сэкономить значительные средства.
назад
|