Command Rate 1T или 2T — что лучше?
В настройках BIOS можно встретить такую опцию, как Command Rate (в некоторых модификациях BIOS — DRAM Command rate). Особенно на нее стоит обратить внимание пользователям, желающим ускорить работу своего ПК. В этой статье рассмотрим, что такое Command rate, а также какое значение для параметра Command Rate лучше — 1T или 2T.
Command Rate (CR) – что это такое и на что влияет
Command Rate (CR) – что это такое и на что влияет данный параметр?
Прежде всего нужно понять принцип работы. Операционная система взаимодействует с оперативной памятью не напрямую, а — через контроллер памяти – микросхему управляющую памятью. Она является посредником между ОЗУ и ОС. Все данные проходят через нее. Операционная система при передаче данных контроллеру использует не физический, а виртуальный адрес, который необходимо преобразовать в физический. Данная операция потребляет некоторое количество ресурсов и занимает определенное время. А опция Command Rate в BIOS позволяет задать интервал задержки – 1 или 2 такта (1T или 2T) для выполнения конвертации адресов (в UEFI значения Command Rate могут быть 1N, 2N, 3N).
Command Rate 1T или 2T – какое значение лучше выбрать?
Command Rate 1T или 2T – какое же значение лучше выбрать для достижения максимальной производительности?
Зная за что отвечает данный параметр, логическим решением будет установка значения – 1T, ведь чем меньше задержка, тем больше операций будет выполнено за единицу времени. Максимальная производительность ОЗУ и компьютера в целом будет именно при таком значении.
Но не все модули оперативной памяти и контроллеры памяти способны работать с минимальным значением задержки в 1 такт. В случае, если устройства не будут справляться со своей задачей по передаче данных с заданным интервалом, то данные могут быть потеряны, что в свою очередь приведет к нестабильной работе компьютера: могут возникнуть лаги и различного рода ошибки в операционной системе.
Для того, чтобы не ошибиться и выбрать верное значение, нужно изучить техническую документацию материнской платы и модулей памяти, где стоит обратить внимание на наличие возможности работать с задержкой в 1 такт.
Конечно же, выяснить оптимальное значение можно и опытным путем. Достаточно просто поменять параметр Command Rate на 1T и проверить работоспособность системы. Если все работает и ошибок нет – то оставить данное значение. Если вдруг появятся ошибки или неисправности – установить интервал в 2 такта.
Также можно доверить компьютеру самостоятельно выбрать нужный интервал, задав параметру DRAM Command Rate значение «Auto», если таковое имеется, в результате чего значение будет взято из информации, запрограммированной в микросхему SPD.
Показатель эффективности данной настройки можно проверить с помощью программ анализаторов – Everest, CPU-Z и прочих.
Dram Command Rate
Другие идентичные названия опции: DRAM 1T/2T Command, SDRAM Command Rate.
DRAM Command Rate — это так называемый командный тайминг, функция задержки между этапами работы контроллера DRAM (микросхемы, которая управляет памятью). Тайминги составляют отдельную настраиваемую группу опций BIOS. В этой статье мы попробуем разобраться, какое значение данной функции является оптимальным и почему.
Принцип работы
Для наилучшего понимания смысла рассматриваемой опции необходимо проследить процесс чтения данных из памяти. Изначальный запрос на чтение информации, посылаемый операционной системой контроллеру памяти, не содержит в себе точных «координат», уникального физического адреса запрашиваемых данных. Система передает лишь условное обозначение, виртуальный адрес, с которым начинает работать контроллер памяти, преобразуя его в физический адрес. В то же самое время контроллер выполняет активацию банка памяти, содержащего необходимую системе информацию. Это происходит через присвоение сигнала этому банку с помощью команды Chip Select. Результатом конвертации или декодирования виртуального адреса является необходимый физический адрес данных; после его получения контроллер приступает к выполнению команд чтения.
То есть, проще говоря, вместо немедленной инициализации операции чтения контроллер задерживается для проведения конвертации адресов. Интервал тайминга прямо пропорционален объему обрабатываемой памяти и количеству ее банков. Соответственно, при увеличении «объема работ» контроллеру для проведения данной операции потребуется больше времени.
Тайминг BIOS DRAM Command Rate предоставляет возможность пользователю самостоятельно определить интервал вышеописанной задержки, выбрав между значениями 1Т или 2Т (такт).
Стоит ли включать опцию?
Казалось бы, выбор очевиден: чем меньше интервал задержки, тем быстрее обработка команд контроллера. Однако это не совсем так. Понятно, что при увеличении времени ожидания контроллер излишне задерживается и отправляет команды позже, чем нужно. В результате этого снижается быстродействие памяти, а также ухудшается производительность ОЗУ. Но при использовании слишком малого значения тайминга управляющая памятью микросхема просто не успевает выполнить декодирование и отправку адресов, вследствие чего информация может быть повреждена или утеряна.
В некоторых моделях и версиях BIOS встречается также третий вариант — Auto (или By SPD). Присвоение функции такого значения приведет к тому, что интервал будет взят из информации, запрограммированной производителем в микросхеме SPD (Serial Presence Detect).
Прежде чем экспериментировать с быстрым интервалом в 1Т, стоит изучить техническую документацию материнской платы на предмет такой возможности. Если нет уверенности в совершаемых действиях, то рекомендуем остановиться на значении Auto.
Разгон оперативной памяти DDR4 на AMD Ryzen и Intel Core
На github.com кто-то заморочился и сделал полноценный гайд по разгону оперативной памяти DDR4 на Intel и AMD Ryzen. А в качестве базовой информации в дополнении к нашему видео он будет полезен каждому.
Делимся переводом, приятного прочтения.
Подготовка
- Проверьте, что ваши модули находятся в рекомендуемых слотах DIMM (обычно 2 и 4).
- Перед разгоном памяти убедитесь, что ваш процессор полностью исправен, так как нестабильный процессор может привести к ошибкам памяти. При повышении частоты с жесткими (предельно сокращёнными) таймингами, ваш процессор может начать работать нестабильно.
- Убедитесь, что используется актуальная версия UEFI.
Утилиты тестирования памяти
Нужно всегда проводить различные стресс-тесты, чтобы убедиться в стабильности разгона.
Не рекомендуется
Мы бы не советовали тест памяти с помощью AIDA64 и Memtest64, поскольку обе эти утилиты не очень хорошо умеют находить ошибки памяти.
Рекомендуется
TM5 с любым из конфигов ниже:
- (рекомендую). Убедитесь, что конфиг загрузился: должно быть написано ‘Customize: Extreme1 @anta777’. на сборку TM5 с множеством конфигов.
- Если возникают проблемы с аварийным завершением всех потоков при запуске с экстремальным конфигом, может помочь изменение строки «Testing Window Size (Mb)=1408». Измените значение размера окна на значение, вычисленное путём деления общего количества оперативной памяти (за вычетом некоторого запаса для Windows) на количество доступных потоков процессора (например, 12800/16 = 800 Мб на поток).
OCCT, имеющая отдельный тест памяти с использованием инструкций SSE или AVX.
- Обратите внимание, что AVX и SSE могут различаться по скорости обнаружения ошибок. В системах на базе Intel, для тестирования напряжения IMC лучше подходит SSE, а AVX – для напряжения DRAM.
- Тест Large AVX2 CPU – это отличный тест стабильности для вашего процессора и оперативной памяти одновременно. Чем сильнее вы разгоняете свою оперативную память, тем сложнее будет добиться стабильности в этом тесте.
Альтернативные варианты
- Установите WSL и Ubuntu.
- В командной строке Ubuntu (bash shell) введите: sudo apt update
- Далее: sudo apt-get install stressapptest
- Чтобы приступить к тестированию: stressapptest -M 13000 -s 3600 -W --pause_delay 3600, где -M это объём тестируемой памяти (в Мб); -s это время тестирования (в секундах), --pause_delay — это время задержки (сек) между скачками напряжения. Чтобы пропустить тесты на скачки напряжения, это значение следует установить таким же, как и -s.
- В папке с y-cruncher.exe создайте новый файл с именем memtest.cfg и вставьте в него эти настройки, и сохраните.
- Создайте ярлык на y-cruncher.exe и добавьте в нем параметры запуска pause:1 config memtest.cfg. Путь запуска в ярлыке должен у вас выглядеть примерно так:
"c:\y-cruncher\y-cruncher.exe" pause:1 config memtest.cfg
Prime95 – метод ‘large FFTs’ также хорошо справляется с поиском ошибок памяти.
Мы использовали пользовательский диапазон FFT 800k — 800k, но любое значение FFT внутри диапазона large FFTs должно работать.
- Убедитесь, что не стоит флажок ‘Run FFTs in-place’.
- В файле prime.txt добавьте строку TortureAlternateInPlace=0 под TortureWeak, чтобы предотвратить in-place тестирование программой. In-place означает, что будет использоваться одна и та же небольшая область RAM, а это не то, что нам нужно.
Можно создать ярлык к prime95.exe, добавив -t к параметрам запуска, чтобы тестирование запускалось сразу при запуске, используя настройки из prime.txt.
Строка запуска объекта в ярлыке будет выглядеть примерно так:
Ещё можно изменить рабочий каталог файлов конфигурации Prime95, чтобы удобней было работать с разными конфигами – например, один для стресс-теста CPU, а другой для стресс-теста RAM.
- В папке с prime95.exe создайте ещё одну папку. Назовём её, к примеру, “RAM” (без кавычек).
- Скопируйте в неё файлы prime.txt и local.txt.
- Отредактируйте prime.txt, выставив необходимые значения настроек.
- Создайте второй ярлык к prime95.exe, добавив к параметрам запуска -t -W. У нас это так будет выглядеть: "c:\prime95\prime95.exe" -t -WRAM
- Теперь мы можем использовать этот ярлык для мгновенного запуска Prime95 с заданными настройками.
randomx-stress – полезен для тестирования стабильности FCLK.
Сравнение
Здесь сравнили между собой Karhu RAMTest, TM5 с экстрим-конфигом и GSAT.
TM5 – самый быстрый и самый «стрессовый», хотя у меня были случаи, когда я успешно проходил получасовые стресс-тесты TM5, но не проходил 10-минутные Karhu. И у другого пользователя было похожее. Но у всех по-разному может быть.
Работа и настройка таймингов
Утилиты для просмотра таймингов в Windows:
Intel:
- Z370(?)/Z390: Asrock Timing Configurator v4.0.4 (работает с большинством сторонних материнских плат).
- Z170/Z270(?)/Z490, а также материнки EVGA: Asrock Timing Configurator v4.0.3.
- Для Rocket Lake: Asrock Timing Configurator v4.0.10
Бенчмарки (тест производительности)
- AIDA64 – бесплатная 30-дневная пробная версия. Мы будем использовать тесты кэша и памяти (находятся в разделе Tools), чтобы посмотреть, как работает наша память. Щёлкнув правой кнопкой по кнопке запуска теста, можно выбрать запуск только тестов памяти, пропустив тесты кэша.
- Intel Memory Latency Checker – содержит множество полезных тестов для измерения производительности памяти. У него более обширный сбор данных, чем у AIDA64, и значения пропускной способности у тестов отличаются. Обратите внимание, что его необходимо запускать от имени администратора, чтобы отключить префетчинг. На системах AMD может потребоваться отключить его в BIOS.
- xmrig – очень чувствителен к памяти, поэтому его полезно использовать для проверки влияния определенных таймингов. Запустите от имени администратора с параметром —bench=1M в качестве аргумента командной строки, чтобы запустить бенчмарк. Используйте контрольное время (benchmark time) для сравнения.
- MaxxMEM2 – бесплатная альтернатива AIDA64, но тесты пропускной способности выглядят намного слабее, поэтому полностью сравнивать с AIDA64 не стоит.
- Super Pi Mod v1.5 XS – еще одна чувствительная к памяти бенчмарк-утилита, но я не использовал её так часто, как AIDA64. 1-8M значений [после запятой при вычислении числа π] будет вполне достаточно для быстрого теста. Вам лишь нужно посмотреть на последнее (общее) время, которое чем меньше, тем лучше.
- HWBOT x265 Benchmark – говорят, эта утилита также хорошо тестирует память, но я сам лично ей не пользовался.
- PYPrime 2.x – этот бенчмарк работает быстро и отлично сонастраивается с тактовой частотой ядра процессора, кэшем/FCLK, частотой памяти и таймингами.
Общая информация о RAM
Соотношение частот и таймингов
Частота оперативной памяти измеряется в мегагерцах (МГц) или миллионах циклов в секунду. Более высокая частота означает большее количество циклов в секунду, что означает более высокую производительность.
Многие ошибочно полагают, что частота оперативной памяти DDR4-3200 – 3200 МГц, однако на самом деле реальная частота памяти составляет всего 1600 МГц. Поскольку в памяти DDR (Double Data Rate) данные передаются как по нарастающему, так и по спадающему фронту тактового сигнала, реальная частота оперативной памяти равна половине количества транзакций в секунду. DDR4-3200 передает 3200 миллионов битов в секунду, а значит, 3200 МТ/с (МегаТранзакций в секунду) работает на частоте 1600 МГц.
Тайминги RAM измеряются в тактовых циклах или тиках. Более низкие тайминги означают меньшее количество циклов, необходимых для выполнения операции, что означает более высокую производительность. Исключением является tREFI – интервал обновления. Как следует из названия, tREFI (timeREFresh Interval) – это время между обновлениями. Пока оперативная память обновляется, она ничего не может делать, поэтому мы бы хотели обновлять ее как можно реже. Для этого время между обновлениями должно быть как можно больше. Это означает, что tREFI должен быть как можно выше.
Несмотря на то, что тайминги могут быть и низкими, производительность также зависит от частоты, на которой работает оперативная память. Например, DDR4-3000 CL15 и DDR4-3200 CL16 обладают одинаковой латентностью, несмотря на то, что у DDR4-3000 значение CL меньше. Это объясняется тем, что более высокая частота компенсирует увеличение CL.
Формула для вычисления фактического времени задержки (в наносекундах, нс) заданного тайминга выглядит так: 2000 * тайминг / ddr_speed.
- DDR4-3000 с CL15 это 2000 * 15 / 3000 = 10ns
- DDR4-3200 с CL16 это 2000 * 16 / 3200 = 10ns
Первостепенные, второстепенные и третьестепенные тайминги
Тайминги оперативной памяти делятся на 3 категории: первостепенные (primary), второстепенные (secondary) и третьестепенные (tertiary). Они обозначаются буквами ‘P’, ‘S’ и ‘T’ соответственно.
- Первостепенные и второстепенные тайминги влияют на латентность и пропускную способность;
- Третьестепенные – только на пропускную способность. Исключением является tREFI/tREF, который влияет и на пропускную способность, и на латентность. Кстати, на AMD его модифицировать нельзя.
Ожидания и ограничения
В этом разделе рассматриваются 3 компонента, влияющие на процесс разгона: микросхемы (чипы памяти), материнская плата и встроенный контроллер памяти (IMC).
Материнская плата
Самые высокие частоты достигаются на материнских платах с 2-мя слотами DIMM.
На материнских платах с 4-мя слотами DIMM максимальная частота памяти зависит от количества установленных планок.
- На материнских платах, работающих с цепочечной (daisy-chain) микроархитектурой RAM, лучше использовать 2 планки памяти. Использование 4-х планок может существенно снизить максимальную частоту памяти.
- Платы же с Т-образной топологией, напротив, наилучшие показатели при разгоне обеспечат с 4-мя планками. А использование 2-х планок не столь существенно повлияет на максимальную частоту памяти, как использование 4-х на daisy-chain (?).
- Большинство поставщиков не указывают используемую топологию, но её можно «вычислить» на основе прилагаемого к материнской плате списка совместимых устройств (QVL – Qualified Vendor List). Например, Z390 Aorus Master, вероятно, использует Т-топологию, поскольку наибольшая частота демонстрируется с использованием 4-х модулей DIMM. Если же максимальная частота демонстрируется на 2-х модулях DIMM, то, вероятно, используется топология daisy-chain.
- По словам известного оверклокера buildzoid’а, разница между Т-образной и цепочечной топологиями проявляет себя только на планках выше DDR4-4000. То есть, по логике buildzoid’а, если у вас Ryzen 3000, то топология значения не имеет, поскольку DDR4-3800 – как правило, максимум для частоты памяти при соотношении MCLK:FCLK 1:1.
Замечено также, что дешёвые материнские платы могут не разогнаться, возможно по причине низкого качества печатной платы и недостаточного количества слоёв.
Чипы памяти
Разогнать свою оперативную память можно и не вдаваясь в подробности особенностей чипов. Однако, зная, на каких микросхемах построена ваша RAM, можно понять, чего от неё ожидать.
Отчёты Thaiphoon Burner
Hynix CJR 8 Гб (одноранговая)
Micron Revision E 8 Гб (одноранговая)
- Отбракованные низкосортные чипы Micron реализует под брендом SpecTek.
- Многие стали называть этот чип “Micron E-die” или даже просто “E-die”. Если в первом случае ещё куда ни шло, то во втором уже возникает путаница, поскольку подобная маркировка («буква-die») используется у микросхем Samsung, например – “4 Гб Samsung E-die”. Под “E-die” обычно подразумевается чип Samsung, поэтому стоит уточнять производителя, говоря о чипах Micron Rev. E как об “E-die”.
Samsung B-die 8 Гб (двуранговая).
Наклейки на модулях
Поскольку отчет Thaiphoon может содержать некорректную информацию о микросхемах либо не содержать её вовсе, можно сверить его данные с информацией, указанной на наклейках у некоторых модулей. В настоящее время такую информацию, позволяющую идентифицировать тип микросхем, указывают только на планках Corsair, G.Skill и Kingston.
Corsair: код номера версии (Version Number)
Трёхзначный код номера версии у Корсаров поможет нам определить тип используемых микросхем.
Первая цифра – производитель:
- 3 = Micron
- 4 = Samsung
- 5 = Hynix
- 8 = Nanya
Вторая цифра – объём памяти.
- 1 = 2 Гб
- 2 = 4 Гб
- 3 = 8 Гб
- 4 = 16 Гб
Третья цифра – вариант модификации (Revision).
Полный список смотрите здесь
G.Skill: код «042»
G.Skill использует код, начинающийся с 042. Он также содержит искомую информацию о чипах
Давайте расшифруем такой код: 04213X8810B
- Первое из выделенных жирным значений – это объём. 4 = 4 Гб, 8 = 8 Гб, а 16 Гб кодируется буквой S.
- Второе выделенное значение кодирует производителя. 1 = Samsung, 2 = Hynix, 3 = Micron, 4 = PSC (Powerchip Semiconductors Corp), 5 = Nanya и 9 = JHICC.
- Третье выделенное значение – вариант модификации (Revision).
- Итак, мы получили Samsung 8 Гб B-die.
Полный список смотрите здесь.
Kingston
Код Kingston имеет такой вид: DPMM16A1823
- Под выделенной жирным буквой закодирован производитель. H = Hynix, M = Micron и S = Samsung.
- Следующие две цифры информируют нас о количестве рангов. 08 = одноранговая, 16 = двуранговая.
- Затем идёт месяц изготовления. 1-9, A, B, C.
- И следующие 2 цифры – год изготовления.
- Итак, в нашем примере мы имеем двуранговую память на чипах Micron, произведённую в октябре 2018.
О рангах и объёме
Одноранговые модули обычно работают на более высоких частотах, чем двуранговые, но в зависимости от типа теста, двуранговые модули могут достигать довольно значительного превосходства в скорости по сравнению с одноранговыми благодаря приросту производительности за счет чередования рангов*. Это можно наблюдать как в синтетических тестах, так и в играх.
- На новейших платформах (таких как Comet Lake и Zen3) поддержка двуранговой памяти в BIOS и контроллерах памяти значительно улучшилась. На многих платах Z490 двуранговая Samsung 8 Гб B-die (2×16 Гб) будет работать столь же быстро, как и одноранговая B-die, то есть вы получаете весь прирост производительности от чередования рангов практически без недостатков.
- * Чередование рангов позволяет контроллеру памяти распараллеливать запросы к памяти, например, записывать данные на один ранг, пока другой обновляется. Этот эффект легко можно наблюдать при анализе пропускной способности на тесте копирования в AIDA64. С точки зрения контроллера памяти, не имеет значения, находится ли второй ранг на том же DIMM (два ранга на одном DIMM) или на другом DIMM (два DIMM на одном канале). Однако это имеет значение с точки зрения разгона, когда нужно учитывать особенности топологии и требования BIOS.
- Наличие второго ранга также означает, что доступно в два раза больше групп банков. Из этого следует, что короткие (S) тайминги, такие как RRD_S, могут использоваться чаще, так как вероятность того, что будет доступна свободная группа банков, выше. Длинный (L) тайминг – к примеру, RRD_L – требуется, если приходится обращаться к одной и той же группе банков дважды по очереди, но когда вместо трех альтернативных банковских групп в распоряжении имеется 7, гораздо больше шансов избежать очередей.
- Это также означает, что поскольку банков в два раза больше, то в любой момент времени может быть открыто в два раза больше строк памяти. Вероятность того, что нужная вам строка будет открыта – больше. Не придется так часто закрывать строку A, открывать строку B, а затем закрывать B, чтобы снова открыть A. Вы реже задерживаетесь на таких операциях, как RAS/RC/RCD (когда ждете повторного открытия закрытой строки) и RP (когда ждете закрытия строки, чтобы открыть другую).
- Конфигурации с 16-разрядными чипами (x16) имеют вдвое меньше банков и групп банков по сравнению с традиционными конфигурациями x8, что означает меньшую производительность.
Объем важен при определении того, насколько можно разогнать память. К примеру, AFR 4 Гб и AFR 8 Гб разгоняться будут по-разному, несмотря на то, что называются одинаково. То же можно сказать и о Micron Rev. B, которые существует в вариантах 8 и 16 Гб. Микросхемы 16 Гб разгоняются лучше и продаются как в 16-гигабайтных модулях, так и в 8-гигабайтных, при этом в обоих случаях модули DIMM имеют по 8 чипов. Просто у 8-гигабайтных версий планок отредактирован SPD, и примером такого подхода являются топовые комплекты Crucial Ballistix (BLM2K8G51C19U4B).
С увеличением общего числа задействованных в системе рангов, возрастает и нагрузка на контроллер памяти. Обычно это означает необходимость увеличения питания, особенно напряжения VCCSA на Intel и SOC на AMD.
Масштабирование напряжения
Масштабирование напряжения попросту означает, как чип реагирует на изменение напряжения.
Во многих микросхемах tCL масштабируется с напряжением, что означает, что увеличение напряжения может позволить вам снизить tCL. В то время как tRCD и tRP на большинстве микросхем, как правило, не масштабируются с напряжением, а это означает, что независимо от того, какое напряжение вы подаёте, эти тайминги не меняются. Насколько известно, tCL, tRCD, tRP и, возможно, tRFC могут (либо не могут) видеть масштабирование напряжения.
Аналогичным образом, если тайминг масштабируется с напряжением, это означает, что вы можете увеличить напряжение, чтобы соответствующий тайминг работал на более высокой частоте.
Масштабирование напряжения CL11:
- На графике видно, что tCL у CJR 8 Гб масштабируется с напряжением почти ровно до DDR4-2533.
- У Samsung B-die мы видим идеально-ровное масштабирование tCL с напряжением.
- Столь же ровное масштабирование tCL с напряжением наблюдается у Micron Rev. E.
- Мы использовали эти данные в калькуляторе. Изменяя ползунки f и v на нужные нам частоту и напряжение, калькулятор вычисляет частоты и напряжения, достижимые при заданном CL (предполагается, что CL линейно масштабируется до 1,50 В). Например, DDR4-3200 CL14 при напряжении 1,35 В может работать как
DDR4-3333 CL14 при 1,40 В,
Масштабирование напряжения tRFC у B-die.
Видно, что tRFC довольно хорошо масштабируется на B-die.
Некоторые старые чипы Micron (до 8 Гб Rev. E) известны своим отрицательным масштабированием с напряжением. То есть при повышении напряжения (как правило, выше 1,35 В) они становятся нестабильными на тех же таймингах и частоте.
Ниже приведена таблица протестированных чипов, показывающая, какие тайминги в них масштабируются с напряжением, а какие нет:
Чип | tCL | tRCD | tRP | tRFC |
---|---|---|---|---|
Hynix 8 Гб AFR | Да | Нет | Нет | ? |
Hynix 8 Гб CJR | Да | Нет | Нет | Да |
Hynix 8 Гб DJR | Да | Нет | Нет | Да |
Micron 8 Гб Rev. B | Да | Нет | Нет | Нет |
Micron 8 Гб Rev. E | Да | Нет | Нет | Нет |
Micron 16 Гб Rev. B | Да | Нет | Нет | Нет |
Nanya 8 Гб B-die | Да | Нет | Нет | Нет |
Samsung 4 Гб E-die | Да | Нет | Нет | Нет |
Samsung 8 Гб B-die | Да | Да | Да | Да |
Samsung 8 Гб D-die | Да | Нет | Нет | Нет |
Тайминги, которые не масштабируются с напряжением, как правило необходимо увеличивать с частотой.
Ожидаемая максимальная частота
Ниже приведена таблица предполагаемых максимальных частот некоторых популярных чипов:
Чип | Ожидаемая максимальная частота(МТ/с) |
---|---|
Hynix 8 Гб AFR | 3600 |
Hynix 8 Гб CJR | 4133* |
Hynix 8 Гб DJR | 5000+ |
Nanya 8 Гб B-die | 4000+ |
Micron 8 Гб Rev. B | 3600 |
Micron 8 Гб Rev. E | 5000+ |
Micron 16 Гб Rev. B | 5000+ |
Samsung 4 Гб E-die | 4200+ |
Samsung 8 Гб B-die | 5000+ |
Samsung 8 Гб D-die | 4200+ |
- * – результаты тестирования CJR получился несколько противоречивыми. Тестировали 3 одинаковых планки RipJaws V 3600 CL19 8 Гб. Одна из них работала на частоте DDR4-3600, другая – на DDR4-3800, а последняя смогла работать на DDR4-4000. Тестирование проводилось на CL16 с 1,45 В.
- Не ждите, что одинаковые, но разнородные по качеству, чипы производителя одинаково хорошо разгонятся. Это особенно справедливо для B-die.
- Указанные значения следует понимать как усредненные возможности чипа, не забывая о других факторах, существенно влияющих на достижимость этих показателей, таких как материнская плата и процессор.
Биннинг
Суть биннинга заключается в разделении производителем полученной на выходе продукции «по сортам», качеству. Как правило, сортировка производится по демонстрируемым при тестировании характеристикам производительности.
Чипы, показывающие одну частоту, производитель отделяет в одну «коробку», другую частоту – в другую «коробку». Отсюда и название процедуры – “binning” (bin – ящик, коробка). Подробно об этом писали в статье: «Что такое биннинг? В погоне за лучшими чипами».
G.Skill – один из производителей, известных своим развитым биннингом и категоризацией. Нередко несколько различных товарных позиций G.Skill входят в один и тот же заводской бин (например, DDR4-3600 16-16-16-36 1,35 В B-Die входит в тот же бин, что и DDR4-3200 14-14-14-34 1,35 В B-Die).
B-die из коробки «DDR4-2400 15-15-15» намного хуже чем из коробки «DDR4-3200 14-14-14» или даже из «DDR4-3000 14-14-14». Так что не ждите, что третьесортный B-die даст образцовые показатели масштабирования напряжения.
Чтобы выяснить, какой из одинаковых чипов обладает лучшими характеристиками на одном и том же напряжении, нужно найти немасштабируемый с напряжением тайминг.
Просто разделите частоту на этот тайминг, и чем выше значение, тем выше качество чипа.
Например, Crucial Ballistix DDR4-3000 15-16-16 и DDR4-3200 16-18-18 оба на чипах Micron Rev. E. Если мы разделим частоту на масштабируемый с напряжением тайминг tCL, мы получим одинаковое значение (200). Значит ли это, что обе планки – одного сорта? Нет.
А вот tRCD не масштабируется с напряжением, значит его необходимо увеличивать по мере увеличения частоты.
3000/16 = 187,5 против 3200/18 = 177,78.
Как видите, DDR4-3000 15-16-16 более качественный чип, нежели DDR4-3200 16-18-18. Это означает, что чипы DDR4-3000 15-16-16 очевидно смогут работать и как DDR4-3200 16-18-18, а вот смогут ли DDR4-3200 16-18-18 работать как DDR4-3000 15-16-16 – не факт. В этом примере разница в частоте и таймингах невелика, так что разгон этих планок будет, скорее всего, очень похожим.
Максимальное рекомендованное повседневное напряжение
Спецификация JEDEC JESD79-4B указывает (стр. 174), что абсолютный максимум составляет 1,50 В
- Напряжения, превышающие приведенные в разделе «Абсолютные максимальные значения», могут привести к выходу устройства из строя. Это только номинальная нагрузка, и функциональная работа устройства при этих или любых других условиях выше тех, которые указаны в соответствующих разделах данной спецификации, не подразумевается. Воздействие абсолютных максимальных номинальных значений в течение длительного периода может повлиять на надежность.
В соответствии со спецификацией DDR4, это значение является официальным максимумом, на который должна быть рассчитана вся DDR4 память, однако многие микросхемы не способны справиться с такими высокими напряжениями длительное время. Samsung 8 Гб C-die может деградировать уже при напряжении всего 1,35 В, несмотря на соблюденные условия по тепловому режиму и качеству питания. С другой стороны, такие чипы как Hynix 8 Гб DJR или Samsung 8 Гб B-Die, выдерживают ежедневное напряжение, значительно превышающее 1,55 В. Выясните, какие напряжения безопасны именно для вашего чипа, либо же придерживайтесь напряжения в районе 1,35 В. И не забывайте про «кремниевую лотерею», то есть всё в определённой степени индивидуально. Будьте осторожны.
Одним из общих факторов, ограничивающих максимальное безопасное напряжение, с которым вы можете работать, является архитектура вашего процессора. Согласно JEDEC, VDDQ – напряжение вывода данных, – привязано к VDD, в просторечии называемому VDIMM или напряжением DRAM. Это напряжение взаимодействует с PHY (физическим уровнем) в CPU, и может привести к длительной деградации IMC, если установлено слишком высокое значение. Поэтому не рекомендуется повседневное использование напряжения VDIMM выше 1,60 В на Ryzen 3000 и 5000 или 1,65 В на процессорах Intel серии Comet Lake. Будьте осторожны, поскольку деградацию PHY у процессора измерить или заметить трудно, пока проблема не станет серьезной.
Для продуктов с заявленным напряжением 1,60 В вероятно безопасно использовать повседневное напряжение 1,60 В. Также, B-Die, 8 Гб Rev. E, DJR и 16 Гб Rev. B должны нормально работать с повседневным напряжении 1,60 В, при условии активного воздушного охлаждения. Повышение напряжения приводит к повышению тепловыделения, а высокая температура сама по себе снижает порог безопасного напряжения.
Ранговость
Ниже показано, как самые распространенные чипы ранжируются с точки зрения частоты и таймингов.
Оценка | Чипы | Описание |
---|---|---|
S | Samsung 8 Гб B-Die | Лучший DDR4 чип для универсальной производительности |
A | Hynix 8 Гб DJR, Micron 8 Гб Rev. E*, Micron 16 Гб Rev. B | Высокопроизводительные чипы. Известны тем, что не холостят на степпингах (‘clockwall’) и обычно хорошо масштабируются с напряжением. |
B | Hynix 8 Гб CJR, Samsung 4 Гб E-Die, Nanya 8 Гб B-Die | Чипы высокого класса, способные работать на высоких частотах с хорошими таймингами. |
C | Hynix 8 Гб JJR, Hynix 16 Гб MJR, Hynix 16 Гб CJR, Micron 16 Гб Rev. E, Samsung 8 Гб D-Die | Достойные чипы с хорошей производительностью и неплохим масштабированием по частоте. |
D | Hynix 8 Гб AFR, Micron 8 Гб Rev. B, Samsung 8 Гб C-Die, Samsung 4 Гб D-Die | Микросхемы низкого класса, обычно встречающиеся среди дешевых предложений. Большинство из них сняты с производства и более не актуальны. |
F | Hynix 8 Гб MFR, Micron 4 Гб Rev. A, Samsung 4 Гб S-Die, Nanya 8 Гб C-Die | Плохие чипы, неспособные уверенно дотянуть даже до требований базовой спецификации JEDEC. |
- Частично на основе оценок Buildzoid, но из-за давности его публикации, некоторые чипы не включены в наш список.
- Модификации ревизии 8 Гб Rev. E в основном различаются по минимально-достижимому tRCD и максимально-достижимой скорости без изменения VTT, с сохранением стабильности. Как правило, более новые редакции 8 Гб Rev. E (C9BKV, C9BLL и т.д.) обеспечивают более короткий tRCD и более высокую тактовую частоту без изменения VTT.
Температура и её влияние на стабильность
В целом, чем сильнее греется ваша оперативная память, тем менее стабильно она будет работать на высоких частотах и/или низких таймингах.
Тайминги tRFC очень сильно зависят от температуры, поскольку они связаны с утечкой конденсатора, вызванной температурой. При повышении температуры требуются более высокие значения tRFC. tRFC2 и tRFC4 – это тайминги, которые активируются, когда рабочая температура DRAM достигает 85°C. Ниже этих температур эти тайминги ничего не делают.
B-Die чувствительны к температуре, их идеальный диапазон
30-40°C. Некоторые экземпляры могут выдерживать и больше, это уж как повезёт. В свою очередь Rev. E, похоже, к температуре не столь чувствителен.
Вы можете столкнуться с ситуацией, когда при выполнении теста памяти все работает стабильно, а во время игры – крашит. Это происходит потому, что CPU и/или GPU во время игры выделяют больше тепла внутри корпуса, повышая при этом и температуру оперативной памяти. Поэтому для имитации стабильности в играх рекомендуется провести стресс-тест GPU во время выполнения теста памяти.
Встроенный контроллер памяти (IMC)
Intel: LGA1151
IMC Skylake от Intel достаточно устойчивый, поэтому при разгоне он не должен быть узким местом. Ну а чего ещё ждать от 14+++++ нм?
IMC Rocket Lake, если не считать ограничений, касающихся поддержки памяти Gear 1 и Gear 2, имеет самый сильный контроллер памяти среди всех потребительских процессоров Intel, причем с большим отрывом.
Для разгона RAM необходимо изменить два напряжения: System Agent (VCCSA) и IO (VCCIO). НЕ оставляйте их в режиме “Auto”, так как они могут подать опасные уровни напряжения на IMC, что может ухудшить его работу или даже спалить его. Большую часть времени можно держать VCCSA и VCCIO одинаковыми, но иногда перенапряжение может нанести ущерб стабильности, что видно из скриншота. Я не рекомендовал бы подниматься выше 1,25 В на обоих.
Ниже предлагаемые значения VCCSA и VCCIO для двух одноранговых модулей DIMM:
Мы не рекомендовали бы подниматься выше 1,25 В на обоих.
Ниже – предлагаемые значения VCCSA и VCCIO для двух одноранговых модулей DIMM:
Частота (МГц) | VCCSA/VCCIO (В) |
3000-3600 | 1,10 – 1,15 |
3600-4000 | 1,15 – 1,20 |
4000-4200 | 1,20 – 1,25 |
4200-4400 | 1,25 – 1,30 |
* — Если модулей больше, и/или используются двуранговые модули, то может потребоваться более высокое напряжение VCCSA и VCCIO.
tRCD и tRP взаимосвязаны, то есть, если вы установите tRCD на 16, а tRP на 17, то оба будут работать с более высоким таймингом (17). Это ограничение объясняет, почему многие чипы работают не очень хорошо на Intel и почему для Intel лучше подходит B-die. В UEFI Asrock и EVGA оба тайминга объединены в tRCDtRP. В UEFI ASUS tRP скрыт. В UEFI MSI и Gigabyte tRCD и tRP видны, но попытка установить для них разные значения приведет просто к установке более высокого значения для обоих.
Ожидаемый диапазон латентности памяти: 40-50 нс.
- Ожидаемый диапазон латентности памяти для Samsung B-Die: 35-45 нс.
- В целом, латентность варьируется от поколения к поколению из-за разницы в размере кристалла (кольцевой шины). В результате, 9900K будет иметь немного меньшую задержку, чем 10700K при тех же настройках, поскольку у 10700K и 10900K кристаллы одинаковы.
- Латентность зависит от значений RTL и IOL. Вообще говоря, ориентированные на разгон, да и просто качественные материнки имеют максимально короткие маршруты передачи данных и, соответственно, достаточно низкие RTL и IOL. На некоторых материнских платах изменение RTL и IOL не оказывает никакого влияния.
AMD: AM4
- MCLK: Master clock, реальная тактовая частота памяти (половина эффективной скорости RAM). Например, для DDR4-3200 частота MCLK равна 1600 МГц.
- FCLK: Infinity Fabric clock, частота шины Infinity Fabric.
- UCLK: Unified memory controller (UMC) clock, частота контроллера памяти. Половина частоты MCLK, если MCLK и FCLK не равны (десинхронизированный режим, 2:1).
- На Zen и Zen+ MCLK = FCLK = UCLK. Однако в Zen2 и Zen3 значение частоты FCLK можно менять. Если MCLK равен 1600 МГц (DDR4-3200) и вы установите FCLK на 1600 МГц, UCLK также будет 1600 МГц, если вы не установите соотношение MCLK:UCLK 2:1 (режим часто называется UCLK DIV MODE, хотя известны и другие названия). Однако, если вы установите FCLK на 1800 МГц, то UCLK будет работать на частоте половины от MCLK – 800 МГц (десинхронизированный режим).
- В Ryzen 1000 и 2000 IMC несколько привередлив к разгону и может не дать столь же высоких частот, как Intel. IMC Ryzen 3000 и 5000 намного лучше и более-менее наравне с новыми процессорами Intel на базе Skylake, т.е. 9-го и 10-го поколения.
- SoC voltage – это напряжение для IMC, и, как и в случае с Intel, не рекомендуется оставлять его в “Auto” режиме. Типичный диапазон этого значения 1,0 – 1,1 В. Более высокие значения, как правило, допустимы, и они могут оказаться необходимы для стабилизации памяти большого объёма, а также могут помочь стабилизировать FCLK.
- С другой стороны, неоправданно высокое напряжение SoC может наоборот дестабилизировать память. Такое обычно происходит между 1,15 В и 1,25 В на большинстве процессоров Ryzen.
В Ryzen 3000 есть также CLDO_VDDG (часто сокращается до VDDG, чтобы не путать с CLDO_VDDP), которое является напряжением для Infinity Fabric. Напряжение SoC должно быть, по крайней мере, на 40 мВ выше CLDO_VDDG, поскольку CLDO_VDDG формируется из напряжения SoC. В AGESA версии 1.0.0.4 и новее VDDG разделяется на VDDG IOD и VDDG CCD – для связующего кристалла ввода-вывода (I/O Die) и кристалл-чиплетов Сore Сomplex Die, соответственно.
1,01 В. Аналогично, если вы установили VDDG на 1.10 В и начнете повышать напряжение SoC, ваш VDDG вольтаж будет также повышаться. Точных цифр у меня нет, но можно предположить, что минимальное падение напряжения (Vin-Vout) составляет около 40 мВ. Из чего следует, что ваш ФАКТИЧЕСКИЙ вольтаж SoC должен быть, по крайней мере, на 40 мВ выше желаемого VDDG, чтобы ваша настройка VDDG вступила в силу.
Регулировка напряжения SoC сама по себе, в отличие от других регулировок, мало что даёт вообще. По умолчанию установлено значение 1.10 В, и AMD не рекомендует менять это значение. Увеличение VDDG в некоторых случаях помогает при разгоне матрицы, но не всегда. FCLK 1800 МГц должен быть выполнимым при значении по умолчанию 0,95 В, и для расширения пределов может быть полезно увеличить его до = <1,05 В (1,100 — 1,125 В SoC, в зависимости от нагрузки).
Источник: The Stilt
Ниже приведены ожидаемые диапазоны частот памяти для двух одноранговых модулей DIMM при условии отсутствия проблем со стороны материнской платы и чипов:
Ryzen | Ожидаемая частота (МГц) |
1000 | 3000-3600 |
2000 | 3400-3800* |
3000 | 3600-3800 (1:1 MCLK:FCLK) 3800+ (2:1 MCLK:FCLK) |
- Если модулей больше, и/или используются двуранговые модули, ожидаемая частота может быть ниже.
- * – 3600+ обычно достигается при 1 DIMM на канал (DPC), материнской плате с 2 слотами DIMM и если используются очень хорошие IMC. См. таблицу: https://docs.google.com/spreadsheets/d/1dsu9K1Nt_7apHBdiy0MWVPcYjf6nOlr9CtkkfN78tSo/edit#gid=1814864213
- * – DDR4-3400…DDR4-3533 – это максимум, если не всё, на что способны IMC Ryzen 2000.
- Количество протестированных образцов по максимально достижимой частоте памяти распределилось следующим образом: DDR4-3400 – 12.5% образцов; DDR4-3466 – 25.0% образцов; DDR4-3533 – 62.5% образцов
- Процессоры Ryzen 3000 с двумя CCD-чиплетами (3900X и 3950X) предпочитают 4 одноранговые планки вместо 2 двуранговых. Для моделей с двумя CCD конфигурация «2 одноранговых DIMM на канал», кажется, является наиболее подходящим вариантом. И 3600, и 3700X достигли 1800 МГц UCLK при конфигурации «1 двуранговый DIMM на канал», но в 3900X, скорее всего, из-за рассогласованности двух его CCD, едва удалось достичь 1733 МГц на этой конфигурации. В то время как с двумя однорангами на канал нет никаких проблем в достижении 1866 МГц FCLK/UCLK.
tRCD делится на tRCDRD (чтение) и tRCDWR (запись). Обычно есть возможность уменьшить tRCDWR по отношению к tRCDRD, но я не заметил каких-либо улучшений производительности от понижения tRCDWR. Так что лучше держать их одинаковыми.
Geardown Mode (GDM) автоматически включается на скорости выше DDR4-2666, что обеспечивает четность tCL, четность tCWL, четность tRTP, четность tWR и CR 1T. Если вы хотите выставить нечетный tCL, отключите GDM. При нестабильной работе попробуйте использовать CR 2T, но это может свести на нет прирост производительности за счет снижения tCL, и даже к менее стабильной работе, чем с включенным GDM. К примеру, если вы попытаетесь запустить DDR4-3000 CL15 с включенным GDM, CL будет округлено до 16. В понятиях производительности это выглядит так: GDM откл CR 1T > GDM вкл CR 1T > GDM откл CR 2T.
У процессоров Ryzen 3000 с одним CCD (процессоры серий ниже 3900X) пропускная способность записи вдвое меньше.
Ожидаемый диапазон латентности памяти:
Ryzen | Латентность (нс) |
1000 | 65-75 |
2000 | 60-70 |
3000 | 65-75 (1:1 MCLK:FCLK) 75+ (2:1 MCLK:FCLK) |
Достаточно высокий FCLK у Ryzen 3000 и 5000 может компенсировать потери от десинхронизации MCLK и FCLK, при условии, что вы можете назначить MCLK для UCLK.
Разгон
Дисклеймер: потенциал разгона сильно зависит от «кремниевой лотереи» (чип чипу рознь), поэтому могут быть некоторые отклонения от моих предложений.
Предупреждение: При разгоне оперативной памяти возможно повреждение данных. Рекомендуется периодически проводить проверку целостности системных файлов с помощью sfc /scannow.
Процесс разгона достаточно прост и выполняется в 3 шага:
- Выставляются очень большие (ослабленные) тайминги.
- Увеличивается частота DRAM до появления признаков нестабильности.
- Выставляются оптимально-малые («жесткие», «подтянутые») тайминги.
Нахождение максимальной частот
1. На Intel следует начинать с 1.15В на VCCSA и VCCIO. На AMD с 1.10В SoC
Напряжение SoC может называться по-разному в зависимости от производителя:
- Asrock: CPU VDDCR_SOC Voltage. Если не можете найти такое, используйте SOC Overclock VID в подменю AMD CBS. Значения VID (Voltage ID);
- Asus: VDDCR SOC;
- Gigabyte: (Dynamic) Vcore SOC. Обратите внимание, что Dynamic Vcore SOC это добавочное напряжение. Базовое напряжение изменяется автоматически при увеличении частоты DRAM. Напряжение 0,10 В на DDR4-3000 может привести к фактическому напряжению 1,10 В, а 0,10 В на DDR4-3400 приводит уже к фактическому напряжению 1,20 В;
- MSI: CPU NB/SOC.
2. Установите напряжение DRAM 1,4 В. Если у вас чипы спотыкаются об 1,35 В, то ставьте 1,35 В.
- «Спотыкаются» – имеется в виду работают нестабильно при попытках увеличить вольтаж, иногда вплоть до отказа при аппаратном самотестировании (POST).
- Список чипов, спотыкающихся на 1,35 В включает (но не ограничивается) следующие: 8 Гб Samsung C-die, ранние чипы Micron/SpecTek (до 8 Гб Rev. E).
3. Выставите основные тайминги следующим образом: 16-20-20-40 (tCL-tRCD-tRP-tRAS), а tCWL на 16.
- Большинству чипов требуется ослабить tRCD и/или tRP, потому я и рекомендую 20.
- Подробнее об этих таймингах читайте тут (на англ.)
4. Постепенно увеличивайте частоту DRAM до тех пор, пока Windows не откажет. Помните об ожидаемых максимальных частотах, упомянутых выше.
- На Intel, быстрый способ узнать, нестабильны ли вы, это следить за значениями RTL и IOL. Каждая группа RTL и IOL соответствует каналу. В каждой группе есть 2 значения, которые соответствуют каждому DIMM. Поскольку обе планки стоят во вторых слотах каждого канала, нужно посмотреть на D1 в каждой группе RTL и IOL. Значения RTL у планок не должны разниться между собой более чем на 2, а значения IOL более чем на 1. В нашем случае, RTL разнятся ровно на 2 (53 и 55), а значения IOL не разнятся вовсе (7 у обоих планок). Все значения в пределах допустимых диапазонов, однако имейте в виду, что это ещё не значит, что всё действительно стабильно.
- На Ryzen 3000 или 5000 – убедитесь, что частота Infinity Fabric (FCLK) установлена равной половине вашей действующей частоты DRAM.
5. Запустите тест памяти на свой выбор.
Windows потребуется около 2 Гб памяти для проведения тестирования, поэтому обязательно учтите это при вводе тестируемого объема ОЗУ, если предусмотрен ручной ввод. У нас 16 Гб RAM, из которых обычно тестируется 14000 Мб.
Минимальные рекомендуемые значения Coverage/Runtime:
- MemTestHelper (HCI MemTest): 200% на поток.
- Karhu RAMTest: 5000%. Убедитесь, что на вкладке “Advanced” кэш процессора включен (CPU cache: Enabled). Это ускорит тестирование на
6. При зависании/краше/BSOD, верните частоту DRAM на ступень ниже и повторите тестирование.
7. Сохраните ваш профиль разгона в UEFI.
8. Теперь вы можете либо попытаться перейти на ещё более высокую частоту, либо начать подтягивать тайминги. Не забывайте об ожидаемых максимальных частотах, о которых мы говорили ранее. Если вы достигли пределов возможностей чипа и/или IMC, то самое время заняться оптимизацией таймингов.
Пробуем повысить частоты
Этот раздел актуален только если вы ещё не достигли пределов возможностей своей материнской платы, чипов и IMC. И он не для тех, у кого проблемы со стабилизацией частот в ожидаемом диапазоне.
Обратите внимание, что некоторые платы имеют автоматические правила, которые могут препятствовать вашему вмешательству. Например, наличие правила tCWL = tCL — 1 может привести к нечетному значению tCWL. Раздел «Дополнительные советы» может помочь вам получить представление конкретно о вашей платформе и функциональности вашей материнской платы.
- Повысьте вольтажи VCCSA и VCCIO до 1,25 В.
- Установите командный тайминг (“Command Rate”, CR) на 2T, если ещё не установлен.
- Поменяйте значение tCCDL на 8. В UEFI Asus’ов нет возможности менять этот тайминг.
- Рассинхронизация MCLK и FCLK может привести к значительному ухудшению таймингов, поэтому вам лучше не оптимизировать их, чтобы сохранить MCLK:FCLK 1:1. Подробнее об этом см. выше, раздел AMD – AM4.
- Либо же установите FCLK на стабильное значение (если не уверены, установите на 1600 МГц).
2. Увеличьте основные тайминги до 18-22-22-42, а tCWL до 18.
3. Повысьте вольтаж DRAM до 1,45 В, если чип позволяет.
4. Выполните шаги 4-7 из раздела «Определение исходного уровня».
5. Выполните оптимизацию («подтягивание») таймингов.
Оптимизация таймингов
Обязательно после каждого изменения запускайте тест памяти и бенчмарк-тест, чтобы убедиться в повышении производительности. Мы бы рекомендовали выполнять бенчмарк-тесты 3-5 раз и усреднять результаты, так как тесты памяти могут немного отличаться.
Теоретическая максимальная пропускная способность (Мб/с) = Transfers per clock * Actual Clock * Channel Count * Bus Width * Bit to Byte ratio (Транзакций за такт*фактическая частота*количество каналов*ширина шины*соотношение битов к байтам).
- Transfers per clock – Передача данных за такт означает количество передач данных (транзакций), которое может произойти за один полный тактовый цикл памяти. В оперативной памяти DDR это происходит дважды за цикл – по нарастающему и спадающему фронтам тактовых импульсов.
- Actual Clock – фактическая частота памяти, измеряемая в МГц. Обычно эта частота отображается как реальная частота памяти такими программами, как CPU-Z.
- Channel Count – количество каналов памяти вашего процессора.
- Bus Width – ширина каждого канала памяти (шины), измеряемая в битах. Начиная с DDR1, это всегда 64 бита.
- Bit to Byte ratio – соотношение битов к байтам это постоянная величина, равная 1/8 (0,125).
Значения пропускной способности чтения и записи должны составлять 90-98% от теоретической максимальной пропускной способности.
- На процессорах Ryzen 3000/5000 с одним CCD пропускная способность записи должна составлять 90-98% от половины теоретической максимальной пропускной способности. Можно достичь половины теоретической максимальной пропускной способности записи.
- Процент теоретически максимальной пропускной способности обратно пропорционален большинству таймингов памяти. Другими словами, по мере сокращения таймингов оперативной памяти, этот процент будет увеличиваться.
1. Мы бы рекомендовали для начала подтянуть некоторые второстепенные тайминги в соответствии с таблицей ниже, поскольку они могут ускорить тестирование памяти.
Надёжно (Safe)
Оптимально (Tight)
Предельно (Extreme)
- Минимальное значение, при котором снижение tFAW возымеет эффект на производительность RAM, должно равняться 4-х кратному значению tRRDS либо tRRDL – в зависимости от того, какой из них меньше.
- Необязательно, чтобы все тайминги выставлялись в одном пресете. Вы, например, можете выставить tRRDS tRRDL tFAW в пресете “Tight”, а tWR – в пресете “Extreme”.
- На некоторых Intel-овских материнских платах tWR в UEFI ничего не делает, вместо него реальный контроль осуществляет tWRPRE (иногда tWRPDEN). Уменьшение tWRPRE на 1 приведет к уменьшению tWR на 1, следуя правилу tWR = tWRPRE — tCWL — 4.
2. Далее идёт tRFC. По умолчанию для чипов 8 Гб установлено значение 350 нс (обратите внимание на единицу измерения).
- Примечание: Перетягивание tRFC может привести к зависанию/блокировке системы.
- tRFC – это количество циклов, за которые происходит сброс или перезарядка конденсаторов DRAM. Поскольку разрядка конденсаторов пропорциональна температуре, то для памяти, работающей при высоких температурах, могут потребоваться значительно более высокие значения tRFC.
- Перевод в нс: 2000*timing/ddr_speed.
- Перевод из нс (то, что прописывается в UEFI): ns*ddr_speed/2000. Пример: 180 нс на DDR4-3600 = 180*3600/2000 = 324, соответственно в UEFI вам нужно ввести значение 324
- Ниже приведена таблица типичных значений tRFC в нс для наиболее распространенных чипов:
Что такое command rate 1t или 2t. Разгон — это просто: оперативная память. За что отвечает DRAM Command rate
Что такое тайминги оперативной памяти? Вот об этом и сегодня и поговорим.
Видео версия статьи:
Тайминги, как и другая полезная информация маркируется на корпусе планки оперативной памяти.
Тайминги состоят из группы цифр.
На некоторых планках тайминги указаны полностью, а на других указывается только CL задержка.
Указание только CL, а данном случае CL9
Что такое CL тайминг вы узнаете по ходу статьи.
В этом случае полный список таймингов можно узнать на сайте производителя планки, по номеру модели.
Любая оперативная память DDR (1,2,3,4) имеет одинаковые принципы работы.
Память имеет определённую частоту работы в МГц и тайминги.
Чем тайминги меньше, тем быстрее процессор может получить доступ к ячейкам памяти на микросхемах.
Соответственно получаются меньше задержек при считывании и записи информации в оперативную память.
Наибольшее распространение получил тип памяти DDR SDRAM , который имеет ряд особенностей.
С контроллером памяти она (память) общается на частоте в половину меньшей, чем та, которая указана на маркировке плашки оперативной памяти.
Например, DDR3 работающая на частоте 1866 МГц в диагностических программах, например, CPU-Z будет отображена как 933 МГц.
Так что на корпусе планки оперативной памяти указывается эффективная частота работы памяти, тогда как в реальности, частоты работы в два раза ниже.
Линии адреса, данных и управления передаются по одной шине в обе стороны, что и позволяет говорить об эффективной частоте работы оперативной памяти.
Данные передаются по 2 бита на один синхроимпульс, как по фронту, так и по спаду тактового импульса, что и удваивает эффективную частоту работу памяти.
P . S . Частота оперативной памяти складывается из коэффициента умножения (множителя) на частоту системной шины.
Например, частота системной шины процессора 200 МГц (какой ни будь Pentium 4), а множитель=2, то результирующая частота памяти будет 400 МГц (800 МГц эффективная).
Это значит, что для разгона оперативной памяти, нужно разогнать процессор по шине (либо выбрать нужный множитель памяти).
P .S. Все манипуляции по частотам, таймингам и напряжениям производятся в BIOS (UEFI) материнской платы.
Модули памяти, работающие на одной и той же частоте, но имеющие разные тайминги в тоге могут иметь разную итоговую скорость работы.
Тайминги указывают на количество тактовых импульсов, для выполнения микросхемой памяти той или иной операции. Например, поиска определённой ячейки и записи в неё информации.
Сама же тактовая частота определяет с какой скоростью в Мегабайтах в секунду будут идти операции чтения/записи, когда чип уже готов выполнить команду.
Тайминги обозначаются цифрами, например, 10-11-10-30 .
DDR3 1866 МГц 9-9-9-10-28 будет быстрее чем DDR3 1866 МГц 10-11-10-30 .
Если обратиться к базовой структуре ячейки памяти, то получится вот такая табличная структура.
То есть структура строк и столбцов, по номеру которых можно обратиться к тому или иному байту памяти, для чтения или записи данных.
Что же конкретно обозначают цифры таймингов?
Обратимся к примеру, выше DDR 3 1866 МГц 10-11-10-30.
Цифры по порядку:
10 – это CAS Latency (CL )
Одна из важнейших задержек (таймингов). От него в большей степени будет зависеть скорость работы оперативной памяти.
Чем меньше первая цифра из таймингов, тем она быстрее.
CL указывает на количество тактовых циклов, необходимых для выдачи запрашиваемых данных.
На рисунке ниже вы видите пример с CL =3 и CL =5 .
В результате память с CL =3 на 40% быстрее выдаёт запрашиваемые данные. Можно даже посчитать задержку в нс (наносекунда = 0,000000001 с).
Чтобы вычислить период тактового импульса для оперативной памяти DDR3 1866 МГц, нужно взять её реальную частоту (933 МГц) и воспользоваться формулой:
1/933 = 0,0010718113612004 секунды ≈ 1,07 нс.
1,07*10(CL) = 10,7 нс. Таким образом для CL10 оперативная память задержит выдачу данных на 10,7 наносекунды.
P . S . Если последующие данные располагаются по адресу следующему за текущем адресом, то данные не задерживаются на время CL, в выдаются сразу же за первыми.
11 – это RAS to CAS Delay (tRCD)
Сам процесс доступа к памяти сводится к активации строки, а затем столбца с нужными данными. Данный процесс имеет два опорных сигнала – RAS (Row Address Strobe) и CAS (Column Address Strobe) .
Также величина этой задержки (tRCD ) является числом тактов между включением команды «Активировать (Active )» и командой «Чтение» или «Запись».
Чем меньше задержка между первым и вторым, тем быстрее происходит конечный процесс.
10 – это RAS Precharge (tRP )
После того как данные получены из памяти, нужно послать специальную команду Precharge , чтобы закрыть строку памяти из которой считывались данные и разрешить активацию другой строки с данными. tRP время между запуском команды Precharge и моментом, когда память может принять следующую команду « Active » . Напомню, что команда « Active » запускает цикл чтения или записи данных.
Чем меньше эта задержка, тем быстрее запускается цикл чтения или записи данных, через команду « Active » .
P . S . Время которое проходит с момента запуска команды « Precharge » , до получения данных процессором складывается из суммы tRP + tRCD + CL
30 – это Cycle Time (tRAS) Active to Precharge Delay.
Если в память уже поступила команда « Active » (и в конечном итоге процесс чтения или записи из конкретной строки и конкретной ячейки), то следующая команда « Precharge » (которая закрывает текущую строку памяти, для перехода к другой) будет послана, только через это количество тактов.
То есть это время, после которого память может приступить к записи или чтению данных из другой строки (когда предыдущая операция уже была завершена).
Есть ещё один параметр, который по умолчанию никогда не изменяется. Разве что при очень большом разгоне памяти, для большей стабильности её работы.
Command Rate (CR , либо CMD ) , по умолчанию имеет значение 1 T – один такт, второе значение 2 T – два такта.
Это отрезок времени между активацией конкретного чипа памяти на планке оперативной памяти. Для большей стабильности при высоком разгоне, часто выставляется 2 T , что несколько снижает общую производительность. Особенно если плашек памяти много, как и чипов на них.
В этой статье я постарался объяснить всё более-менее доступно. Если, что, то всегда можно перечитать заново:)
Если вам понравился видео ролик и статья, то поделитесь ими с друзьями в социальных сетях.
Чем больше у меня читателей и зрителей, тем больше мотивации создавать новый и интересный контент:)
Также не забывайте вступать в группу Вконтакте и подписываться на YouTube канал.
Те, кто увлекаются оптимизацией работы компьютера по средствам настройки BIOS наверняка слышали о такой опции как Command rate. В некоторых модификациях BIOS она может называться DRAM Command rate. Из возможных значений, которые она может принимать значатся 1 (1T), 2 (2T) и Auto.
Довольно популярным вопросом является установка оптимального значения для Command rate. И чтобы ответить на него нужно разобраться в природе данного параметра.
За что отвечает DRAM Command rate?
Дело в том, что операционная система компьютера работает с оперативной памятью не напрямую. Чтение и запись данных ОЗУ осуществляется через контроллер памяти. Так как операционная система передает контролеру памяти не физический адрес, а виртуальный, последнему требуется время для преобразования виртуального адреса в физический. Так вот опция Command rate определяет интервал задержки в 1 (1T) или 2 (2T) такта для проведения контроллером этой конвертации.
Что лучше 1T или 2T?
Размышляя логически, можно прийти к выводу, что чем меньше задержка (время ожидания), тем больший объем данных можно обработать за одну и ту же единицу времени. То есть значение в 1T (такт) является наиболее оптимальным с точки зрения скорости работы памяти и компьютера в целом. Но вся загвоздка в том, что далеко не каждый модуль ОЗУ и контроллер памяти может работать стабильно с таким малым временем ожидания, как 1 такт. Возможны ошибки и потеря данных. Как следствие — нестабильная работа ПК, синие экраны смерти и так далее.
Для того, чтобы правильно принять решение об установке значения опции Command rate в BIOS, нужно изучить технические характеристики материнской платы и модулей памяти, установленные в каждом конкретном случае, на предмет поддержки работы в режиме задержки 1 такт.
На свой страх и риск можно попробовать установить значение 1T и посмотреть как будет работать компьютер. При появлении ошибок и сбоев DRAM Command rate нужно будет вернуть к значению 2T.
При значении в 2 такта память будет работать медленнее, стабильнее и с минимальным риском возникновения ошибок.
Также возможным значением для данной опции может быть AUTO. В этом случае BIOS сам установит оптимальное значение, сходя из параметров модуля памяти.
Значение AUTO позволяет компьютеру автоматически подобрать время задержки
Разгоняя компьютер, мы больше внимания уделяем таким компонентам как процессор и видеокарта, а память, как не менее важную составляющую, иногда обходим стороной. А ведь именно тонкая настройка подсистемы памяти может дополнительно увеличить скорость рендеринга сцены в трехмерных редакторах, уменьшить время на компрессию домашнего видеоархива или прибавить пару кадров за секунду в любимой игре. Но даже если вы не занимаетесь оверклокингом, дополнительная производительность никогда не помешает, тем более что при правильном подходе риск минимален.
Уже прошли те времена, когда доступ к настройкам подсистемы памяти в BIOS Setup был закрыт от лишних глаз. Сейчас их столько, что даже подготовленный пользователь может растеряться при таком разнообразии, не говоря уже о простом «юзере». Мы постараемся максимально разъяснить действия, необходимые для повышения производительности системы посредством простейших настроек основных таймингов и, при необходимости, некоторых других параметров. В данном материале мы рассмотрим платформу Intel с памятью DDR2 на базе чипсета от той же компании, и основной целью будет показать не то, насколько поднимется быстродействие, а то, как именно его необходимо поднять. Что касается альтернативных решений, то для памяти стандарта DDR2 наши рекомендации практически полностью применимы, а для обычной DDR (меньшие частота и задержки, и большее напряжение) есть некоторые оговорки, но в целом принципы настройки те же.
Как известно, чем меньше задержки, тем меньше латентность памяти и, соответственно, выше скорость работы. Но не стоит сразу же и необдуманно уменьшать параметры памяти в BIOS, так как это может привести к совершенно обратным результатам, и вам придется либо возвращать все настройки на место, либо воспользоваться Clear CMOS. Все необходимо проводить постепенно — изменяя каждый параметр, перезагружать компьютер и тестировать скорость и стабильность системы, и так каждый раз, пока не будут достигнуты стабильные и производительные показатели.
На данный момент времени самым актуальным типом памяти является DDR2-800, но он появился недавно и пока только набирает обороты. Следующий тип (вернее, предыдущий), DDR2-667, является одним из самых распространенных, а DDR2-533 уже начинает сходить со сцены, хотя и присутствует на рынке в должном количестве. Память DDR2-400 нет смысла рассматривать, так как она практически уже исчезла из обихода. Модули памяти каждого типа имеют определенный набор таймингов, а для большей совместимости с имеющимся разнообразием оборудования они немного завышены. Так, в SPD модулей DDR2-533 производители обычно указывают временные задержки 4-4-4-12 (CL-RCD-RP-RAS), в DDR2-667 — 5-5-5-15 и в DDR2-800 — 5-5-5-18, при стандартном напряжении питания 1,8-1,85 В. Но ничто не мешает их снизить для увеличения производительности системы, а при условии поднятия напряжения всего до 2-2,1 В (что для памяти будет в пределах нормы, но охлаждение все же не помешает) вполне возможно установить еще более агрессивные задержки.
В качестве тестовой платформы для наших экспериментов мы выбрали следующую конфигурацию:
- Материнская плата: ASUS P5B-E (Intel P965, BIOS 1202)
- Процессор: Intel Core 2 Extreme X6800 (2,93 ГГц, 4 Мб кэш, FSB1066, LGA775)
- Система охлаждения: Thermaltake Big Typhoon
- Видеокарта: ASUS EN7800GT Dual (2хGeForce 7800GT, но использовалось только «половина» видеокарты)
- HDD: Samsung HD120IJ (120 Гб, 7200 об/мин, SATAII)
- Привод: Samsung TS-H552 (DVD+/-RW)
- Блок питания: Zalman ZM600-HP
В качестве оперативной памяти использовалось два модуля DDR2-800 объемом 1 Гб производства Hynix (1GB 2Rx8 PC2-6400U-555-12), благодаря чему появилась возможность расширить количество тестов с различными режимами работы памяти и комбинациями таймингов.
Приведем перечень необходимого ПО, позволяющего проверить стабильность системы и зафиксировать результаты настроек памяти. Для проверки стабильной работы памяти можно использовать такие тестовые программы как Testmem, Testmem+, S&M, Prime95 , в качестве утилиты настройки таймингов «на лету» в среде Windows применяется MemSet (для платформ Intel и AMD) и A64Info (только для AMD) . Выяснение оправданности экспериментов над памятью можно осуществить архиватором WinRAR 3.70b (имеется встроенный бенчмарк), программой SuperPI , рассчитывающая значение числа Пи, тестовым пакетом Everest (также есть встроенный бенчмарк), SiSoft Sandra и т.д.
Основные же настройки осуществляются в BIOS Setup. Для этого необходимо во время старта системы нажать клавишу Del, F2 или другую, в зависимости от производителя платы. Далее ищем пункт меню, отвечающий за настройки памяти: тайминги и режим работы. В нашем случае искомые настройки находились в Advanced/Chipset Setting/North Bridge Configuration (тайминги) и Advanced/Configure System Frequency (режим работы или, проще говоря, частота памяти). В BIOS»е других плат настройки памяти могут находиться в «Advanced Chipset Features» (Biostar), «Advanced/Memory Configuration» (Intel), «Soft Menu + Advanced Chipset Features» (abit), «Advanced Chipset Features/DRAM Configuration» (EPoX), «OverClocking Features/DRAM Configuration» (Sapphire), «MB Intelligent Tweaker» (Gigabyte, для активации настроек необходимо в главном окне BIOS нажать Ctrl+F1 ) и т.д. Напряжение питания обычно изменяется в пункте меню, отвечающем за оверклокинг и обозначается как «Memory Voltage», «DDR2 OverVoltage Control», «DIMM Voltage», «DRAM Voltage», «VDIMM» и т.д. Также у различных плат от одного и того же производителя настройки могут отличаться как по названию и размещению, так и по количеству, так что в каждом отдельном случае придется обратиться к инструкции.
Если нет желания поднимать рабочую частоту модулей (при условии возможностей и поддержки со стороны платы) выше ее номинальной, то можно ограничиться уменьшением задержек. Если да, то вам скорее придется прибегнуть к повышению напряжения питания, равно как и при снижении таймингов, в зависимости от самой памяти. Для изменения настроек достаточно необходимые пункты перевести из режима «Auto» в «Manual». Нас интересуют основные тайминги, которые обычно находятся вместе и называются следующим образом: CAS# Latency Time (CAS, CL, Tcl, tCL), RAS# to CAS# Delay (RCD, Trcd, tRCD), RAS# Precharge (Row Precharge Time, RP, Trp, tRP) и RAS# Activate to Precharge (RAS, Min.RAS# Active Time, Cycle Time, Tras, tRAS). Также есть еще один параметр — Command Rate (Memory Timing, 1T/2T Memory Timing, CMD-ADDR Timing Mode) принимающий значение 1T или 2T (в чипсете AMD RD600 появилось еще одно значение — 3Т) и присутствующий на платформе AMD или в чипсетах NVidia (в логике от Intel он заблокирован в значении 2T). При снижении этого параметра до единицы увеличивается быстродействие подсистемы памяти, но снижается максимально возможная ее частота. При попытке изменить основные тайминги на некоторых материнских платах могут ожидать «подводные камни» — отключив автоматическую настройку, мы тем самым сбрасываем значения подтаймингов (дополнительные тайминги, влияющие как на частоту, так и на быстродействие памяти, но не так значительно, как основные), как, например, на нашей тестовой плате. В этом случае придется воспользоваться программой MemSet (желательно последней версии) и просмотреть для каждого режима работы памяти значения подтаймингов (субтаймингов), чтобы установить аналогичные в BIOS»e.
Если названия задержек не совпадут, то тут хорошо проявляет себя «метод научного тыка». Незначительно изменяя дополнительные настройки в BIOS Setup, проверяем программой, что, где и как изменилось.
Теперь для памяти, функционирующей на частоте 533 МГц, можно попытаться вместо стандартных задержек 4-4-4-12 (или какого-либо другого варианта) установить 3-3-3-9 или даже 3-3-3-8. Если с такими настройками система не стартует, поднимаем напряжение на модулях памяти до 1,9-2,1 В. Выше не рекомендуется, даже при 2,1 В желательно использовать дополнительное охлаждение памяти (простейший вариант — направить на них поток воздуха от обычного кулера). Но сперва необходимо провести тесты при стандартных настройках, например в очень чувствительном к таймингам архиваторе WinRAR (Tools/Benchmark and hardware test). После изменения параметров проверяем снова и, если результат удовлетворяет, оставляем как есть. Если нет, как это произошло в нашем тестировании, то при помощи утилиты MemSet в среде Windows (эта операция может привести либо к зависанию системы, либо, что еще хуже, полной неработоспособности ее) или же средствами BIOS Setup поднимаем на единицу RAS# to CAS# Delay и снова тестируем. После можно попытаться уменьшить на единицу параметр RAS# Precharge, что немного увеличит быстродействие.
Тоже самое проделываем для памяти DDR2-667: вместо значений 5-5-5-15 выставляем 3-3-3-9. При проведении тестов нам пришлось также увеличить RAS# to CAS# Delay, иначе быстродействие ничем не отличалось от стандартных настроек.
Для системы, использующей DDR2-800, задержки можно уменьшить до 4-4-4-12 или даже 4-4-3-10, в зависимости от конкретных модулей. В любом случае подбор таймингов сугубо индивидуален, и дать конкретные рекомендации достаточно сложно, но приведенные примеры вполне могут помочь вам в тонкой настройке системы. И не забываем о напряжении питания.
В итоге мы провели тестирование с восемью различными вариантами и комбинациями режимов работы памяти и ее задержками, а также включили в тесты результаты оверклокерской памяти, — Team Xtreem TXDD1024M1066HC4, работавшей на эффективной частоте 800 МГц при таймингах 3-3-3-8. Итак, для режима 533 МГц вышло три комбинации с таймингами 4-4-4-12, 3-4-3-8 и 3-4-2-8, для 667 МГц всего две — 5-5-5-15 и 3-4-3-9, а для режима 800 МГц, как и в первом случае, три — 5-5-5-18, 4-4-4-12 и 4-4-3-10. В качестве тестовых пакетов использовались: подтест памяти из синтетического пакета PCMark05, архиватор WinRAR 3.70b, программа расчета числа Пи — SuperPI и игра Doom 3 (разрешение 1024×768, качество графики High). Латентность памяти проверялась встроенным бенчмарком программы Everest. Все тесты проходили в среде Windows XP Professional Edition SP2. Представленные результаты на диаграммах расположены по режимам работы.
Как видите по результатам, разница в некоторых тестах незначительная, а порой даже мизерная. Это обусловлено тем, что системная шина процессора Core 2 Duo, равная 1066 МГц, имеет теоретическую пропускную способность 8,5 Гб/с, что соответствует пропускной способности двухканальной памяти DDR2-533. При использовании более скоростной памяти ограничивающим фактором быстродействия системы становится шина FSB. Уменьшение задержек ведет к росту быстродействия, но не так заметно, как повышение частоты памяти. При использовании в качестве тестового стенда платформы AMD можно было бы наблюдать совсем другую картину, что мы по возможности и сделаем в следующий раз, а пока вернемся к нашим тестам.
В синтетике рост производительности при уменьшении задержек для каждого из режимов составил 0,5% для 533 МГц, 2,3% для 667 МГц и 1% для 800 МГц. Заметен значительный рост производительности при переходе от памяти DDR2-533 к DDR2-667, а вот смена с 667 на DDR2-800 дает уже не такую прибавку скорости. Также память уровнем ниже и с низкими таймингами вплотную приближается к более высокочастотному варианту, но с номинальными настройками. И это справедливо практически для каждого теста. Для архиватора WinRAR, который достаточно чувствителен к изменению таймингов, показатель производительности немного вырос: 3,3% для DDR2-533 и 8,4% для DDR2-667/800. Расчет восьмимиллионного знака числа Пи отнесся к различным комбинациям в процентном соотношении лучше, чем PCMark05, хоть и незначительно. Игровое приложение не сильно жалует DDR2-677 с таймингами 5-5-5-15, и только снижение последних позволило обойти менее скоростную память (которой, как оказалось, все равно, какие тайминги стоят) на два кадра. Настройка памяти DDR2-800 дала прибавку еще в два кадра, а оверклокерский вариант, который имел неплохой разрыв в остальных тестах, не слишком вырвался вперед относительно менее дорогого аналога. Все же, кроме процессора и памяти, есть еще одно звено — видеоподсистема, которая вносит свои коррективы в производительность всей системы в целом. Результат латентности памяти удивил, хотя, если присмотреться к графику, становится ясно, отчего показатели именно такие, какие есть. Падая с ростом частоты и уменьшением таймингов от режима DDR2-533 4-4-4-12, латентность имеет «провал» на DDR2-667 3-4-3-9, а последний режим практически ничем кроме частоты от предыдущего не отличается. И благодаря столь низким задержкам DDR2-667 запросто обходит DDR2-800, которая имеет более высокие значения, но пропускная способность DDR2-800 позволяет в реальных приложениях все же вырваться вперед.
И в заключение хотелось бы сказать, что несмотря на небольшой процент прироста быстродействия (
0,5-8,5), который получается от уменьшения временных задержек, эффект все же присутствует. И даже при переходе с DDR2-533 на DDR2-800 мы получаем прибавку в среднем 3-4%, а в WinRAR более 20. Так что подобный «тюнинг» имеет свои плюсы и позволяет даже без серьезного разгона немного поднять производительность системы.
Другие идентичные названия опции: DRAM 1T/2T Command, SDRAM Command Rate.
DRAM Command Rate — это так называемый командный тайминг, функция задержки между этапами работы контроллера DRAM (микросхемы, которая управляет памятью). составляют отдельную настраиваемую группу опций BIOS. В этой статье мы попробуем разобраться, какое значение данной функции является оптимальным и почему.
Для наилучшего понимания смысла рассматриваемой опции необходимо проследить процесс чтения данных из памяти. Изначальный запрос на чтение информации, посылаемый операционной системой контроллеру памяти, не содержит в себе точных «координат», уникального физического адреса запрашиваемых данных. Система передает лишь условное обозначение, виртуальный адрес, с которым начинает работать контроллер памяти, преобразуя его в физический адрес. В то же самое время контроллер выполняет активацию банка памяти, содержащего необходимую системе информацию. Это происходит через присвоение сигнала этому банку с помощью команды Chip Select. Результатом конвертации или декодирования виртуального адреса является необходимый физический адрес данных; после его получения контроллер приступает к выполнению команд чтения.
То есть, проще говоря, вместо немедленной инициализации операции чтения контроллер задерживается для проведения конвертации адресов. Интервал тайминга прямо пропорционален объему обрабатываемой памяти и количеству ее банков. Соответственно, при увеличении «объема работ» контроллеру для проведения данной операции потребуется больше времени.
Тайминг BIOS DRAM Command Rate предоставляет возможность пользователю самостоятельно определить интервал вышеописанной задержки, выбрав между значениями 1Т или 2Т (такт).
Стоит ли включать опцию?
Казалось бы, выбор очевиден: чем меньше интервал задержки, тем быстрее обработка команд контроллера. Однако это не совсем так. Понятно, что при увеличении времени ожидания контроллер излишне задерживается и отправляет команды позже, чем нужно. В результате этого снижается быстродействие памяти, а также ухудшается производительность ОЗУ. Но при использовании слишком малого значения тайминга управляющая памятью микросхема просто не успевает выполнить декодирование и отправку адресов, вследствие чего информация может быть повреждена или утеряна.
В некоторых моделях и версиях BIOS встречается также третий вариант — Auto (или By SPD). Присвоение функции такого значения приведет к тому, что интервал будет взят из информации, запрограммированной производителем в микросхеме SPD (Serial Presence Detect).
Прежде чем экспериментировать с быстрым интервалом в 1Т, стоит изучить техническую документацию материнской платы на предмет такой возможности. Если нет уверенности в совершаемых действиях, то рекомендуем остановиться на значении Auto.
Особый интерес представляет возможность повысить производительность системы с помощью настройки работы памяти (другой часто используемый термин «твикинг» памяти, от tweaking). Соответствующее иследование мы провели на примере платы Abit KX7-333 , как имеющей один из самых богатых наборов различных настроек памяти доступных через BIOS.
В тестовой системе было использовано следующее оборудование:
- Материнская плата Abit KX7-333;
- 256 Мбайт PC2100 DDR SDRAM, производства Samsung;
- Процессор AMD Athlon XP 1600+
- Видеокарта MX440 на чипе NVidia GeForce4 64Mb (NVIDIA Detonator v28.32);
- Звуковая карта Creative Live 5.1;
- Жесткий диск IBM DTLA 307030 30Gb;
- блок питания PowerMan 250W;
- Операционная система Windows 2000 English SP1
Для демонстрации возможностей тонкой настройки памяти использовался тест Sisoft Sandra 2002 и игра Quake3 (производительность которой очень сильно зависит от пропускной способности памяти). Для большей наглядности я буду изменять каждый параметр отдельно и приводить значение производительности.
Тест с установками по умолчанию
- CAS Latency = 2.5Т
- Bank Interleave = Disable
- DRAM Command Rate = 2T
- Trp = 3T
- Tras = 6T
- Trcd = 3T
- Частота FSBЧастота работы памяти = 133Мгерц133Мгерц
Bank Interleave — 2 Bank
Изменяем параметр Bank Interleave, устанавливаем значение 2 Bank. Вообще этот параметр предназначен для управления доступом к открытым банкам памяти. Возможные значения: None, 2 Bank, 4 Bank (иногда 2-Way/4-Way). Наиболее производительным является 4 Bank.
DRAM Command Rate — 1Т
Далее изменяем параметр DRAM Command Rate. Устанавливаем значение 1Т, при этом оставляем Bank Interleave равным 4 Bank. Параметр DRAM Command Rate появился еще в чипсете KT266. С его помощью мы можем вручную изменять задержки при передачи данных между чипсетом и памятью. Возможные значения 2T, 1T (наиболее быстрым является 1Т). Отметим, что это один из тех параметров, которые существенно влияют на производительность подсистемы памяти.
Тест | Значение |
Sandra (Int) | 1965 |
Sandra (Float) | 1864 |
Quake3 (Fastest) | 235,0 fps |
CAS Latency — 2Т
Следующим изменяем параметр CAS Latency. Устанавливаем значение 2Т, при этом остальные настройки не трогаем (т.е. Bank Interleave=4 Bank, DRAM Command Rate=1Т). CAS Latency — это то количество тактов, через которое память реагирует на запрос чтения. Чем меньше это значение, тем лучше. Возможные варианты: 2.5Т, 2Т. Наиболее важный, с точки зрения производительности, параметр работы памяти.
Тест | Значение |
Sandra (Int) | 2024 |
Sandra (Float) | 1901 |
Quake3 (Fastest) | 239,7 fps |
Итак, мы имеем оптимально настроенную подсистему памяти, с точки зрения стабильности и скорости. Однако, если Вы имеете качественную память, то изменяя параметры Trp (Precharge to Active), Tras (Active to precharge) и Trcd (Active to CMD), мы можем получить еще небольшую прибавку в скорости.
Trp =2T, Tras=5T и Trcd=2T
Модуль памяти 256 Мбайт PC2100 DDR SDRAM, производства Samsung, за все время тестирования (был куплен в январе этого года) зарекомендовал себя самым положительным образом. Поэтому я смело установил следующие значения: Trp =2T, Tras=5T и Trcd=2T (значения по умолчанию 3Т, 6Т и 3Т).
Тест | Значение |
Sandra (Int) | 2039 |
Sandra (Float) | 1906 |
Quake3 (Fastest) | 245,0 fps |
Итак, после тонкой настройки памяти прирост производительности составил
7.5 процентов по тесту Sandra и более 12 процентов в игре Quake3!
DDR333 (PC2700)
А теперь давайте посмотрим, что может дать установка памяти в режим DDR333 (или PC2700). Тестовый модуль памяти смог заработать на такой частоте только на следующих таймингах:
- CAS Latency = 2Т
- Bank Interleave = 4 Bank
- DRAM Command Rate = 1T
- Trp = 3T
- Tras = 6T
- Trcd = 3T
- Частота FSB Частота работы памяти = 133Мгерц 166 Мгерц
Сводная таблица
Для более удобного восприятия этой информации, я оформлю результаты в виде таблицы:
No | Частота FSB MEM (Мгерц) | Тайминги | Sandra | Quake3 (fps) | Прирост в Q3(%) | Частота процеcсора (рейтинг) |
1 | 133133 | Dis, 2T, 2.5T-3T-6T-3T | 1907 / 1776 | 218,1 | — | XP 1600+ |
2 | 133133 | 2 Bank, 2T, 2.5T-3T-6T-3T | 1911 / 1791 | 222,9 | 2,2 | XP 1600+ |
3 | 133133 | 4 Bank, 2T, 2.5T-3T-6T-3T | 1925 / 1806 | 227,3 | 4,2 | XP 1600+ |
4 | 133133 | 4 Bank, 1T, 2.5T-3T-6T-3T | 1965 / 1864 | 235,0 | 7,7 | XP 1600+ |
5 | 133133 | 4 Bank, 1T, 2T-3T-6T-3T | 2024 / 1901 | 239,7 | 9,9 | XP 1600+ |
6 | 133133 | 4 Bank, 1T, 2T-2T-5T-2T | 2039 / 1906 | 245,0 | 12,3 | XP 1600+ |
7 | 133166 | 4 Bank, 1T, 2T-3T-6T-3T | 2052 / 1932 | 255,1 | 16,9 | XP 1600+ |
8 | 166166 | 4 Bank, 1T, 2T-3T-6T-3T | 2426 / 2272 | 307,2 | 40,8 | XP 2100+ |
Выводы
Стандартными настройками являются следующие параметры:
- CAS Latency = 2Т
- Bank Interleave = 4 Bank
- DRAM Command Rate = 1T
- Trp = 3T
- Tras = 6T
- Trcd = 3T
Поэтому конфигурации с 1 по 4 интересны только с теоретической точки зрения. Правда иногда неопытные сборщики не выставляют правильные параметры, и пользователь теряет значительную часть производительности. В другом случае, попытка сэкономить деньги на качестве оперативной памяти так же приводит к потере до 5-10% производительности. Причем это очень большие цифры; для примера разница в 5-10 fps в тесте Quake3 (Fastest), это разница между процессорами XP1600+ и XP1700+ (разница в рейтинге 100, в реальной частоте процессора — 66Mhz).
Обратите внимание на разницу в производительности 5 и 7 конфигурации, она приблизительно равна 6.5%. Это приблизительный прирост производительности при переходе на DDR333 (пример: апгрейд с KT266A на KT333).
Обращаем внимание на последнюю строчку — на показатели теста Sandra. Вот какой значительный прирост производительности можно получить, установив синхронный режим работы процессора и памяти (166 и 166 Mhz). Показатели теста Quake3 здесь беcполезны, так как процессор разогнан с 1400 до 1750 Mhz.
В этом режиме отсутствуют задержки при согласовании сигналов и, начиная с частоты 166 Мгерц, используется делитель 1/5 для частоты PCI (2/5 для AGP), что автоматически означает работу контроллера жестких дисков на стандартной частоте PСI (33 Mhz).
Естественно, весь этот материал имеет ценность только для компьютерного энтузиаста, цель которого — выжать максимум из имеющегося в наличии железа. А для большинства обычных пользователей, я думаю, вполне достаточно знать то, что можно установить все тайминги в значения, определенные производителем памяти. Для этого предназначен параметр «DRAM Timing». Возможные значения: «Manual» — параметры устанавливаются вручную, «By SPD» — устанавливаются по умолчанию (SPD = Serial Presence Detect). Конечно, производители памяти немного подстраховываются и несколько завышают тайминги работы. В результате производительность несколько меньше, чем при ручной установке параметров.
Как может заметить читатель, я изменял не все имеющиеся в нашем распоряжении параметры. А параметров работы памяти у платы Abit KX7-333 наибольшее количество (больше чем у плат Epox). Скажу следующее — все рассмотренные параметры есть практически в каждой плате среднего и высшего класса, этакий «джентльменский набор». Другие параметры (за исключением Queue Depth) — это довольно специфические параметры, которые слабо влияют на производительность, но иногда очень полезные для улучшения стабильности работы памяти разных производителей (есть даже такие тонкости) и работы в разных конфигурациях модулей памяти.
И последнее. Для достижения стабильной работы при агрессивных (низких) таймингах очень полезно повышать напряжение на памяти (Vmem). Правда, при этом повышается тепловыделение, но для предотвращения перегрева можно использовать радиаторы для памяти.
Оверклокеру важно помнить и то, что очень часто препятствием для разгона становится неспособность памяти работать на высоких частотах. Поэтому, иногда есть смысл повысить тайминги памяти (производительность чуть упадет), но за счет этого появляется возможность достигнуть более высоких частот FSB (возросшая частота процессора даст куда большую прибавку производительности).