Ключевой разработкой корпорации Advanced Micro Devices заключительных лет является процессорная микроархитектура Zen. Компания AMD возлагает большие чаяния на новые CPU и рассчитывает на то, что они помогут ей вернуть утраченные позиции на базаре персональных компьютеров и серверов, увеличить выручку и норму барыши. В последние несколько месяцев AMD начала раскрывать подробности о новоиспеченной микроархитектуре и особенностях новых платформ для ПК и серверов. Одной из значительных вех на пути новых CPU на рынок стал анонс коммерческого наименования новых процессоров, а также демонстрация их работы на этой неделе. Ниже мы попытаемся коротко подытожить то, что мы уже знаем о микроархитектуре Zen, а также о процессорах Ryzen на её базе.
Микроархитектура
Микроархитектура Zen является первой целиком новой микроархитектурой AMD с конца 2011 года, когда компания представила Bulldozer. Приоритеты при создании заключительнее отдавались возможностям быстрого роста тактовых частот, числа ядер (в том числе за счёт использования двухъядерных кластеров), а также постепенному усовершенствованию заключительных. Физическое воплощение Bulldozer первого и второго поколения продемонстрировало, что эта микроархитектура не может обеспечить сравнимую с основным конкурентом производительность при схожем энергопотреблении, а потому в 2012 году было зачислено решение отказаться от серьёзной доработки Bulldozer и сосредоточить инженерные ресурсы компании на разработке принципиально новоиспеченной микроархитектуры, получившей название Zen.
Глава AMD представляет процессоры Ryzen
AMD Zen исконным образом отличается от Bulldozer в том, что касается приоритетов. Джим Келлер (Jim Keller), основной архитектор Zen, поставил перед разработчиками ядра задачу максимально повысить количество одновременно исполняемых инструкций (instructions per clock, IPC) без увеличения потребляемой мощности. Подобный подход исповедуется будет широко, а его преимущества отлично иллюстрируются процессорами Apple, когда микросхемы с двумя основами оставляют позади конкурентов с четырьмя в многопоточных приложениях. Разумеется, «размашистые» ядра имеют свои ограничения (размеры, тактовые частоты и т. д.), но их преимущества перевешивают вероятные недостатки.
Принимая во внимание всё вышесказанное, неудивительно, что ядро AMD Zen существенно выделяется от предшественников. С точки зрения исполнительных устройств ядро Zen имеет четыре блока целочисленных операций (ALU) и одинешенек модуль операций с плавающей запятой (FPU) с двумя блоками сложения (ADD) и двумя блоками умножения (MUL). Внимательный читатель может отметить, что число исполнительных устройств в ядре Zen полностью соответствует количеству исполнительных конструкций в «двухъядерном» модуле Bulldozer. Работая в парах, указанные блоки могут исполнять либо две операции соединённого умножения-сложения (fused multiply-accumulate, FMAC) за такт, либо одну 256-разрядную руководство AVX.
Ядро AMD Zen
Однако ключом к высокой производительности современных CPU зачастую являются не лишь существенные вычислительные ресурсы, но и способность процессоров полностью задействовать потенциал этих ресурсов. Чтобы владеть возможность эффективно загрузить вычислительные ресурсы, ядро Zen использует целиком новый блок прогнозирования ветвлений, новый декодер руководств, новую систему кеширования внутри ядра с кешем декодированных микроопераций, расширенное на 75 % окно планировщика руководств, расширенный в полтора раза исполнительный тракт (и упомянутое рослее симметричное увеличение числа исполнительных устройств), а также иные улучшения.
Новый блок предсказания переходов
Помимо итого прочего, AMD упомянула, что новый блок предсказания ветвлений основан на аппаратной нейронной сети и является обучаемым, то кушать он может делать предположения касательно данных/инструкций, какие понадобятся в ближайшее время (а затем загружать их в соответствующие кеши) не лишь на основе аппаратно «зашитых» шаблонов, но и на основе анализа поведения приложения. На этом этапе AMD не стремится рассказать подробности о механизмах обучения; отчего именно они лучше, чем традиционные алгоритмы предсказаний, и как «обучаемый» блок пророчеств гарантирует защиту от неверных предсказаний (которые уменьшают производительность и увеличивают энергопотребление). Тем не немного, упоминание механизмов даёт поверхностное представление о масштабах и нраве изменений в ядре Zen по сравнению с предшественниками.
Блок предсказания на основе нейронной сети
Как уже сообщалось, любое ядро Zen может конкурентно исполнять два потока одновременно, что призвано гарантировать более эффективную загрузку исполнительного тракта и дополнительно повысить производительность на ватт. Объём кеш-памяти второго уровня составит 512 Кбайт на основа. Ядра Zen будут группироваться в кластеры по четыре ядра с 8 Мбайт разделяемого «виктимного» (victim) кеша третьего степени. Таким образом, в микросхемах с числом ядер более четырёх будут использоваться два кластера. Подобная компоновка облегчает создание многоядерных CPU для серверов, а заодно указывает на то, что AMD обладает необходимой «обвязкой» для создания таковых — высокоскоростной внутренней шиной, многоканальными контроллерами памяти и иными элементами для подобных устройств.
Частоты и энергопотребление
Возможности микроархитектуры являются значительнейшей составляющей производительности процессоров. Однако ничуть не менее значимыми являются рослые тактовые частоты при минимально возможном энергопотреблении, что обеспечивается как микроархитектурой, так и технологией производства микросхем. Для изготовления процессоров на базе микроархитектуры Zen первого поколения будет применяться технология 14LPP с кой-какими доработками GlobalFoundries. Это большой шаг вперёд по сравнению с 32-нм и 28-нм техпроцессами GlobalFoundries и TSMC, какие использовались для предыдущих поколений APU и CPU разработки AMD последние пять лет.
Начиная с мобильных процессоров Carrizo в 2015 году корпорация AMD вводила в свои процессоры набор различных датчиков с целю гарантировать возможность работы технологии динамического масштабирования напряжения столы и частот процессора (dynamic voltage and frequency scaling, DVFS). В случае с мобильными процессорами технология могла кратковременно снижать усилие питания и частоту на неиспользуемых участках CPU, тем самым экономя потребляемую мощность.
AMD Pure Power
Судя по всему, в процессоры Ryzen на базе Zen будет внедрена новоиспеченная версия технологии DVFS, называемая Pure Power. Датчики Pure Power будут соединяться между собой при поддержки технологии Infinity Fabric (что, судя по названию, намекает на «нескончаемое» количество поддерживаемых устройств), а изменения тактовых частот CPU будут осуществляться как наверх, так и вниз, с шагом 25 МГц благодаря технологии Precision Boost. Пока не четко, будет ли последняя манипулировать тактовой частотой всей микросхемы, отдельных основ (как это делает Intel Turbo Boost Max Technology 3.0) или отдельных участков микросхем. К образцу, процессоры Intel Core i7 Extreme Edition на базе основ Broadwell-E умеют снижать тактовую частоту на ядрах, взятых исполнением энергоёмких AVX-инструкций. Если бы AMD удалось реализовать то же самое, но при этом снижать частоты динамически, это дало бы преимущества процессорам компании в линии приложений, задействующих AVX.
AMD Extended Frequency Range (XFR)
Наличие огромное числа датчиков внутри процессорных ядер, способность оперативно получать с них эти и анализировать их в реальном времени, а также поддержка технологии Precision Boost обнаруживает AMD ещё один способ увеличить производительность своих CPU. Не секрет, что многие энтузиасты используют весьма продвинутые системы охлаждения, способные рассеивать огромное число тепловой энергии. К примеру, гигант Alpenföhn Olymp способен рассеять до 340 Вт, мощные жидкостные системы охлаждения — 300+ Вт, а некрепкий азот и того больше. Измеряя температуру процессора, а также динамику её изменений сравнительно загрузки и тактовых частот, микропроцессор Ryzen может сделать вывод об используемой системе охлаждения и попытаться повысить свою тактовую частоту свыше заявленной для режима Turbo. AMD именует эту технологию Extended Frequency Range (XFR), но не говорит, будет ли она поддерживаться всеми микросхемами Ryzen, или же лишь самыми производительными (по примеру Intel Turbo Boost Max Technology 3.0). По сути, AMD намекает на то, что Ryzen для настольных ПК смогут разгонять себя сами при присутствии достойной системы охлаждения. При этом наиболее вероятным является сценарий, когда XFR будет отключён для мобильных и серверных микросхем, поскольку увеличение частот ведёт к увеличению энергопотребления, что является негативным для ноутбуков и середин обработки данных.
В ближайшие месяце AMD предстоит ещё много рассказать об зодчеству процессоров Ryzen, об их возможностях управлять частотами и многом товарищем. Тем не менее, основной посыл AMD — очевиден. Одним из ключевых нововведений Ryzen сделается возможность максимально тонкой настройки частот для достижения максимальной производительности и минимального энергопотребления в любой конкретный момент времени.
Платформа
В полном соответствии с традициями заключительных лет процессоры AMD Ryzen в форм-факторе AM4 получат некоторые функциональные возможности, как-то присущие наборам логики. Известно, что процессоры Ryzen будут владеть встроенные контроллеры памяти DDR4, PCI Express 3.0, NVMe, Serial ATA, SATA Express и т. д. Перенесение поддержки основного накопителя этих непосредственно в CPU сокращает задержки при обращении к быстрым SSD, что несколько повысит общую производительность системы. Что более важно, выделенные черты PCIe для твердотельных накопителей дадут возможность использовать основные черты исключительно для графических карт, что максимизирует предельную производительность игровых ПК.
Перрон AM4 для процессоров AMD Ryzen
Перенос основных возможностей ввода/вывода прямо в CPU также даёт возможность отказаться от набора логики и максимально упростить материнские платы для недорогих ПК. Однако едва-едва ли производители материнских плат воспользуются этой возможностью при создании перронов для Ryzen на базе кристаллов Summit Ridge. Процессоры с восемью основами предназначены для высокопроизводительных ПК с большим количеством накопителей, мощными графическими картами и т. п., для таких систем нет резона экономить несколько десятков долларов на материнской плате. Тем не немного, процессоры Raven Ridge со встроенным графическим ядром, а также недорогие Summit Ridge с четырьмя основами, в ряде случаев вполне могут обойтись и без дорогого комплекта логики (например, в случае использования в ПК класса всё-в-одном или форм-фактора Mini-ITX).
Поскольку первые процессоры семейства AMD Ryzen будут назначены в первую очередь для мощных игровых ПК, то и экипироваться такие компьютеры будут соответственными наборами логики с богатыми функциональными возможностями вроде поддержки USB 3.1 со скоростью передачи этих 10 Гбит/с и других. На сегодняшний день компания AMD воздерживается от немало точного описания возможностей высокопроизводительных платформ AM4, но указывает на максимальные возможности модернизации и расширения, что является отличительной чертой перронов Intel HEDT.
Первая материнская плата под AMD Ryzen… и не лишь
Материнские платы AM4 для процессоров Ryzen/Summit Ridge не бывальщины основной темой мероприятия AMD, а потому компания не стремилась акцентировать на них внимание. Тем не немного, в презентации для журналистов приводится фотография материнской платы с гнездом AM4 для игровых компьютеров. Судя по всему, собственно это системная плата в форм-факторе ATX сейчас используется для демонстрации возможностей AMD Ryzen.
Поскольку эта материнская плата не была анонсирована официально, AMD попыталась скрыть производителя и модель новинки при поддержки чёрной изоленты и программы Adobe Photoshop. Тем не менее, ряд косвенных примет говорят о том, что мы имеем дело с изделием MSI среднего ценового сегмента, чьё состояние готовности не так вдали от финального: плата уже экипирована «стильными» радиаторами на наборе логики и модуле регулятора усилия (voltage regulator module, VRM), а также укреплённым разъёмом PCI Express, но всё ещё бедствует в неких последних штрихах (например, в корпусировке контактов для USB на фронтальной панели ПК, маркировке разъёмов DIMM и иной «косметике»).
Материнская плата AM4
Что касается самой платы, то мы можем приметить довольно скромный шестифазовый преобразователь напряжения питания процессора, что присуще недорогим платформам. Среди портов ввода/вывода для задней панели ПК можно приметить как один коннектор USB Type-C, так и DVI и даже D-Sub. По всей видимости, присутствие разъёмов для подключения монитора говорит о том, что данная материнская плата с гнездом AM4 назначена не только для процессоров Summit Ridge, но и для APU Raven Ridge со встроенным графическим основой.
Материнская плата экипирована двумя слотами PCI Express x16, четой разъёмов PCI Express x1 и даже двумя слотами PCI, что весьма удивительно для современного ПК. Несмотря на наличие двух архаичных разъёмов, на плате видать лишь два порта Serial ATA, один разъём M.2-22110 для твердотельного накопителя и одинешенек коннектор U.2 для ещё одного SSD. Мы не знаем, возможна ли одновременная работа накопителей подключённых к M.2 и U.2 (поскольку мы не ведаем количество поддерживаемых данной платформой линий PCIe 3.0), но даже четыре накопителя этих для высокопроизводительного современного ПК непростительно мало, но вполне достаточно для системы на базе APU. Что прикасается подсистемы памяти, то мы видим четыре разъёма для модулей, какие поддерживают до 64 Гбайт DDR4, что является обычным для материнских плат ATX.
Основной вывод, который можно сделать глядя на системную плату, показанную AMD, это то, что компания, судя по всему, использует универсальную перрон для процессоров Summit Ridge и Raven Ridge для демонстрации первых. Тяжело сказать, означает ли это, что выпуск Raven Ridge не за горами (появление этой микросхемы сложно ожидать ранее второй половины 2017 года), но, по меньшей мере, это означает, что энергопотребление восьмиядерного процессора AMD Ryzen подлинно укладывается в 95 ватт, что само по себе является существенным достижением.
Демонстрация и производительность
Мероприятии New Horizon не сделалось первой публичной демонстрацией систем на базе Ryzen. Впервые компания показала трудящийся CPU на базе микроархитектуры Zen в августе этого года. Тем не менее, оно сделалось первым, где AMD показало работу Ryzen в типичных приложениях, а не в синтетических программах с отворённым исходным кодом.
AMD Ryzen (Summit Ridge): 8 основ, тактовая частота 3,4 ГГц, 20 Мбайт кеша, 95 Вт
Если в августе AMD демонстрировала труд восьмиядерного CPU на базе Zen при в программе Blender, которая используется при создании трёхмерных анимационных кинофильмов, то на этой неделе восьмиядерный процессор AMD Ryzen на частоте 3,4 ГГц был использован для запуска игр Battlefield 1, Doom, Star Wars: Battlefront, а также приложений Handbrake, Z-Brush и Key Shot.
Впрочем, без Blender не стало и в этот раз: программа использовалась для рендеринга процессора с логотипом Ryzen. В заключительном случае производительность AMD Ryzen сравнивалась с таковой у системы на базе Intel Core i7-6900K (8 основ, 3,2 ГГц), а сравнение выявило примерный паритет при несколько меньшем энергопотреблении микросхемы AMD. Благостную полотно несколько смазал тот факт, что память Core i7-6900K трудилась в двухканальном режиме (при этом процессор поддерживает четырёхканальный порядок работы). Те же ПК использовались для транскодирования видео при помощи программы Handbrake, также выявившей кое-какое преимущество Ryzen перед конкурентом (54 секунды против 59 секунд). Желая и Blender, и Handbrake показывают паритет между Ryzen и Core i7-6900K, вытекает понимать, что, во-первых, оба не являются популярными приложениями среди безотносительного большинства пользователей (впрочем, кодеки X264 и Х265 c отворённым исходным кодом используются далеко не только в Handbrake); а во-вторых, являются программами с отворённым исходным кодом, которые могут быть оптимизированы (или, навыворот, деоптимизированы…) под конкретные CPU силами разработчиков последних. Как следствие, попытка разбора результатов Blender и Handbrake в данном случае — не самая лучшая идея. Помимо итого прочего, во время демонстрации AMD не делала акцента на возможностях XFR (было бы логично показать, как процессоры Ryzen ведут себя под некрепким азотом), что может говорить о том, что пока данная возможность трудится не так, как того желает AMD.
Результаты работы AMD Ryzen 3,4 ГГц и Intel Core i7-6900K в Handbrake
Что прикасается запуска игр, то компания не делала акцента на производительности CPU, а стремилась показать, что новоиспеченные процессоры Ryzen стабильно работают на заданных частотах в том числе в играх. Учитывая, что большинство игр ныне затачиваются под популярные четырёхъядерные Core i5/Core i7 (и которые оказываются лучше приспособленными к играм за счёт рослой тактовой частоты, чем Core i7-6900K), то восьмиядерный Ryzen едва-едва ли покажет в них все свои возможности (если только процессоры Ryzen не умеют избирательно разгонять N основ из восьми при обнаружении рабочей нагрузки для N ядер).
Интересно отметить, что во пора демонстрации процессоров Ryzen AMD впервые показала широкой публике труд своей высокопроизводительной графической карты следующего поколения на базе процессора Greenland (Vega) с 8 Гбайт памяти HBM2 (т. е. бывальщины использованы не анонсированные официально микросхемы 2Hi ёмкостью 2 Гбайт), какая почему-то работала на тактовой частоте 500 МГц. Сниженные тактовые частоты памяти присущи в первую очередь вычислительным ускорителям, где объём памяти играет вящую роль, а пропускная способность — меньшую. В случае с игровыми графическими картами есть предельный полезный объём памяти, при этом повышение пропускной способности почти вечно ведёт к увеличению производительности в высоких разрешениях с применением сглаживания. В AMD разрешили несколько замедлить работу графической карты следующего поколения: вероятно, чтобы не давать основному конкуренту возможности проанализировать возможности новоиспеченных GPU, которые демонстрировались в играх Doom и Star Wars: Battlefront в позволенье 4K (3840 × 2160). Как бы там ни было, в прошлом году предполагалось, что Greenland сделается флагманской графической картой AMD в этом году, однако компания разрешила перенести его анонс на начало 2017 года. Принимая это во внимание, показ Greenland состоялся мощно позже предполагаемых изначально сроков.
Что касается сроков появления на рыке процессоров Ryzen, то компания AMD обещает приступить продажи данных микросхем уже в первом квартале. Причём, по словам Лизы Су (Lisa Su), исполнительного директора AMD, «скорее, чем вы размышляете». Означает ли это, что новинки появятся в продаже в январе, а не в марте — непростой проблема.