Процесор amazon graviton3: 64 ядра arm, 5-нм техпроцес, чиплетная компоновка і ddr5 з pcie 5.0

74

Анонсований днями arm-процесор graviton3, створювався спеціально для потреб amazon і aws, несподівано виявився по ряду параметрів на голову вище ще навіть не вийшли epyc і xeon наступного покоління. І це не самий хороший сигнал для amd, intel, qualcomm та інших виробників.

Amazon graviton3. Фото: ian colle

Graviton3 — перший масовий (самої amazon і рядом обраних клієнтів він використовується вже не один місяць) серверний процесор з підтримкою ddr5 і pcie 5.0. Cpu виконаний по 5-нм техпроцесу tsmc і містить приблизно 55 млрд транзисторів. Для здешевлення він використовує bga-корпус і чиплетную компоновку з семи окремих кристалів-два pcie-контролера і чотири двоканальних контролера ddr5 винесені за межі власне cpu.

Вузол ec2 c7g. Тут і нижче зображення amazon aws

Більш того, їх упаковка використовує передові рішення з каналами довжиною менше 55 мкм, що вдвічі менше, ніж у інших серверних cpu. Зменшення довжини провідників позитивно позначається на енергоефективності, яка дуже важлива для будь-якого гиперскейлера. Цим же пояснюється і відносно невелике за сучасними мірками число ядер (всього 64) і їх частота (2,6 ггц). Все це дозволило домогтися енергоспоживання приблизно в 100 вт.

Є і ще один важливий плюс в збереженні числа ядер-перехід на ddr5 – 4800 дозволив не тільки досягти пікової сумарної пропускної здатності пам’яті в 300 гбайт/с на чіп, але і підвищити реальну швидкість роботи з пам’яттю кожного vcpu (фактично ядра) в півтора рази в порівнянні з минулим поколінням. Та ж ситуація і з pcie 5.0-для досягнення тієї ж пропускної здатності, що раніше, потрібно вдвічі менше ліній.

Для здешевлення використовуються готові ip-блоки сторонніх компаній і, судячи з усього, ядра теж несильно відрізняються від референсів arm. А ось які саме, дізнаємося не відразу, оскільки amazon явно не вказала, чи будуть це neoverse v1 (zeus) або n2 (perseus). Ймовірно, це все ж v1 (armv8.5-a), оскільки за описом graviton3 схожі саме на цю архітектуру. Нові ядра стали значно “ширше” колишніх – вони забирають 8 інструкцій, декодують від 5 до 8 з них і відправляють на виконання відразу 15 інструкцій. Відповідно і число виконавчих блоків в порівнянні з neoverse-n1 (graviton2) практично подвоїлося.

Крім того, вони обзавелися підтримкою 256-біт векторних інструкцій sve, що підвищило не тільки швидкість виконання «класичних» fp-операцій (наприклад, для завдань медіакодування і шифрування), але і завдяки підтримці bfloat16 дозволило стверджувати amazon, що нові чіпи годяться і для інференсу. Серед згаданих раніше заходів захисту є, наприклад, примусове шифрування оперативної пам’яті, ізольовані кеші для кожного vcpu (ядра), апаратний захист стека.

У підписі другого стовпця явна помилка

В цілому, середній приріст продуктивності graviton3 в порівнянні з graviton2 склав 25 %, але в деяких завданнях він досягає 60 %. І все це при збереженні того ж рівня енергоспоживання і тепловиділення. Все це дозволило вмістити в одному 1u-вузлі з повітряним охолодженням відразу три процесора graviton3. І вони разюче відрізняються від прийдешніх 128-ядерних процесорів altra max і epyc bergamo, які ampere і amd позиціонують як рішення для гіперкейлерів.

Але cpu – це лише частина платформи, фундамент для якої кілька років тому заклала поява чіпів nitro. Їх зараз варто було б назвати dpu / ipu, хоча на момент їх появи такого поняття, можна сказати, і не було. Nitro бере на себе всі завдання з обслуговування гіпервізора, забезпечення безпеки, роботи зі сховищем і мережею і т.д., вивільняючи, з одного боку, всі ресурси cpu, пам’яті і ssd для обробки завдання клієнта, а з іншого — дозволяючи практично повністю дезагрегувати всю інфраструктуру.

Вузол з nitro ssd

Втім, amazon пішла ще далі — тепер вона самостійно закуповує nand-чіпи і виробляє ssd, теж під управлінням nitro. Тобто у компанії під контролем практично повний стек сучасних апаратних рішень: cpu, dpu, ssd, ші-прискорювачі для навчання (trainium) і інференса (inferentia). Вона активно переносить на нього власні сервіси і пропонує їх клієнтам. І саме це і повинно стурбувати великих вендорів, оскільки їх рішення навряд чи дозволять домогтися такого ж рівня tco, а гіперкейлерів, охочих перейти на аналогічну модель, чимало.

Новим авторам.

джерела: