Японский стартап Preferred Networks разработал ИИ-чип с производительностью 0,5 Петафлопс

7

На выставке, посвящённой конференции SC19, очень богато была представлена тема искусственного интеллекта и машинного обучения. Не только гиганты индустрии, но и молодые компании демонстрировали весьма интересные и заслуживающие внимания новинки.

Одной из таких новинок стал процессор MN-Core, разработанный силами японской компании Preferred Networks (PFN), основанной в 2014 году на средства корпорации Toyota. Этот чип является результатом усилий, сконцентрированных на создании ИИ-процессора для систем с низкой латентностью, включая комплексы IoT.


Японский стартап Preferred Networks разработал ИИ-чип с производительностью 0,5 Петафлопс

Суперкомпьютер Preferred Networks MN-2

В создании MN-Core принимал участие профессор Токийского университета Кей Хираки (Kei Hiraki). Он рассказал, что компания PFN создала семейство частных суперкомпьютеров для того, чтобы ускорить собственные разработки в области глубокого машинного обучения. Первая такая система, MN-1, была запущена в 2017 году и показала мощность свыше 19 Петафлопс, заняв первое место в рейтинге японских суперкомпьютеров.

Японский стартап Preferred Networks разработал ИИ-чип с производительностью 0,5 Петафлопс

PFN MN-Core: 4 кристалла, 756 квадратных миллиметров, 500 Ватт тепловыделения

Первые системы PFN были классическим сочетанием процессоров общего назначения и ускорителей на базе GPU NVIDIA, но уже следующая машина должна будет использовать новый чип MN-Core, который, если верить обещаниям, превзойдет в энергоэффективности существующие решения. Разработчики замахнулись на процессор с теплопакетом 500 Ватт!

Японский стартап Preferred Networks разработал ИИ-чип с производительностью 0,5 Петафлопс

PFN MN-Core: основные технические характеристики

Производиться MN-Core будет с использованием 12-нм технологических норм на мощностях TSMC. Он не будет монолитным ‒ уже показанный на выставке образец даёт понять, что речь идёт о сборке из четырёх кристаллов в общем корпусе. Маркировка GRAPE-DR указывает на преемственность архитектуры, берущей своё начало в разработанном PFN ранее сопроцессоре физических вычислений. 

Чип довольно крупный, 85 × 85 миллиметров, общая площадь кристаллов составляет 756,7 мм2, проектная вычислительная мощность — 524 Тфлопс на вычислениях половинной точности (FP16), что даёт удельную производительность порядка 1 Тфлопс на ватт. 

Японский стартап Preferred Networks разработал ИИ-чип с производительностью 0,5 Петафлопс

PFN MN-Core: четыре блока вычислений + блок матричной арифметики в каждом ядре

Несмотря на то, что базовым режимом является FP16, доступны будут и более точные вычисления в форматах FP32/64 — ценой совместной работы вычислительных блоков и соответствующего снижения производительности. Ускоритель на базе MN-Core представляет собой классическую полноразмерную плату расширения с разъёмом PCI Express 3.0, которая, помимо процессора, будет нести на борту и 32 Гбайт памяти. Тип памяти и показатели ПСП пока неизвестны.

Японский стартап Preferred Networks разработал ИИ-чип с производительностью 0,5 Петафлопс

Дизайн будущих ускорителей MN-Core включает мощнейшую систему охлаждения

По словам профессора Хираки, главной проблемой разработчиков был высокий уровень тепловыделения, но им удалось создать воздушную систему охлаждения, способную справиться с энергопотреблением в районе 600 ватт. Каждый серверный узел будущего суперкомпьютера MN-3 будет иметь высоту 7U и включать в себя четыре ускорителя MN-Core. Это позволит достичь производительности почти 2,1 петафлопса на сервер.

Заявлено наличие двух разъёмов для ЦП общего назначения с теплопакетом до 200 Ватт. Вероятнее всего, речь идёт об Intel Xeon Scalable. Каждый сервер получит до 24 дисковых отсеков, из которых как минимум два будут поддерживать протокол NVMe.

Японский стартап Preferred Networks разработал ИИ-чип с производительностью 0,5 Петафлопс

Сервер PFN: строительный блок будущего суперкомпьютера

Проектируемый сейчас суперкомпьютер MN-3 будет состоять из 4800 чипов MN-Core, но пока неясно, сколько стоек для этого потребуется; сама компания называет цифры в районе 300 единиц. Планируется достичь производительности свыше 2 Экзафлопс (1018 операций в секунду) при потреблении электроэнергии порядка 3,36 МВт. Для сравнения, суперкомпьютер Summit развивает 1,88 Экзафлопса, потребляя 13 МВт.

Японский стартап Preferred Networks разработал ИИ-чип с производительностью 0,5 Петафлопс

Примерные габариты MN-3. Видны 4 сервера с новыми ускорителями в каждой стойке

Компания планирует ввести MN-3 в строй уже в 2020 году, причём система будет использоваться исключительно для обеспечения вычислительными мощностями новых разработок Preferred Networks. Поставлять MN-Core другим разработчикам или производителям серверного оборудования PFN не планирует. Тем самым она идёт по стопам таких гигантов, как Google и Amazon, также разрабатывающих собственные ИИ-процессоры для своих облачных систем и кластеров.

Источник