Комплексные компьютерные
решения
г. Винница. ул. Келецкая 61А
тел. +38(0432)550 950
+38(0432)554 408
моб. +38(063)863 78 03
сервис. +38(068)574 82 16

Intel проливає світло на архітектуру процесорів Knights Mill

За часів, коли машинне навчання і технології на базі нейромереж активно розвиваються, прогресує і апаратне забезпечення для цих сфер. Але кожен розробник підходить до питання по-своєму: виробники графічних процесорів покладаються на початково масивний паралелізм своїх розробок, такі компанії як Google розробляють порівняно прості чіпи, все в яких підпорядковано єдиному завданню, що виконується максимально швидко, ну а такі компанії як Intel адаптують існуючі процесорні архітектури. Так, нещодавно «сині» розкрили деякі секрети, що стосуються спадкоємців серії Knights Landing — процесорів Knights Mill.

Звичайно, компанія досліджує і інші напрямки, наприклад, рішення на базі FPGA Altera, а також розробляє співпроцесори Lake Crest і Knights Crest, які, швидше за все, будуть нагадувати Google TPU. Однак і спадкоємець серії Knights Landing — чіп Knights Mill — отримає змінену з урахуванням популярності технологій машинного навчання архітектуру. Основа залишиться колишньою, але кожен модуль (VPU) отримає замість двох «великих» блоків FPU (32/64 біта) менший блок обчислень з плаваючою комою і чотири блоки Vector Neural Network Instruction (VNNI). Останні будуть підтримувати операції з плаваючою комою одинарної точності, а також отримають здатність працювати зі змішаними цілочисельними форматами (16 біт на вході, 32 на виході). Схожі ядра є в складі NVIDIA V100, але вони підтримують більш традиційні формати FP32/64.

Кінцевий результат можна передбачити досить точно: Knights Mill буде вдвічі поступатися Knights Landing на операціях подвійної точності, але вдвічі же перевершувати на операціях точності одинарної. А поява блоків VNNI з підтримкою цілочисельних форматів може підняти продуктивність Knights Mill в чотири рази в задачах, пов’язаних з глибинним машинним навчанням. Таким чином, процесор вийде більш спеціалізованим, але в своїх областях спеціалізації він перевершить попередника. Чіпи Knights Mill не страждатимуть від нестачі ПСП, оскільки отримають 16 Гбайт MCDRAM, що доповнює 6-канальний контролер DDR4. Загальна кількість ядер залишиться колишнім — 72, з урахуванням 256 операцій на такт в блоках VPU, Knights Mill зможе продемонструвати більше 27 трильйонів операцій в секунду при частотах близько 1,5 ГГц. Це менше, ніж 92 трильйона операцій у Google TPU, але рішення Intel виглядає більш універсальним і збалансованим. З’явиться воно на ринку вже в четвертому кварталі цього року.