Компания IBM, которая всегда была в авангарде квантовых вычислений и ряда других областей исследований, недавно продемонстрировала, каким, по ее мнению, может быть решение для обработки ИИ (и связанные с этим затраты). И если видение IBM во что-то воплотится, будущее не сосредоточено вокруг графических процессоров: вместо этого оно происходит в аналоговых чипах со смешанными сигналами, которые могут привести к значительному повышению энергоэффективности, предлагая производительность, конкурентоспособную по сравнению с текущими требованиями рынка.
Согласно исследовательской статье, опубликованной в журнале Nature Electronics на прошлой неделе, IBM считает, что будущее логического вывода ИИ может пройти через чип, сочетающий память с фазовым переходом (PCM) вместе с цифровыми схемами. Согласно документу, умножение матрицы на вектор (одна из основных рабочих нагрузок для вывода ИИ) может выполняться непосредственно на весах, хранящихся в чипе.
В этом сценарии сниженные требования к мощности пассивных аналоговых схем (которым не требуется непрерывный электрический ток для поддержания битового значения, которое они хранят) должны позволить снизить общую мощность, необходимую для успешного выполнения матричных вычислений — или , по крайней мере, позволит перенаправить избыточный энергетический бюджет (теперь) аналоговых секций чипа на его оставшиеся цифровые схемы для дополнительной пропускной способности. Дизайн основан на результатах исследований в области нейроморфных вычислений.
Разработанная в рамках проекта IBM Hermes, последняя версия чипа насчитывает 64 вычислительных модуля, которые взаимодействуют друг с другом с помощью подхода Network-on-Chip (NOC), который по своей концепции аналогичен Infinity Fabric от AMD. Существует также аппаратное обеспечение с фиксированными функциями, которое специализируется на обработке сверточных слоев (которые направлены на снижение сложности базовой информации, чтобы ускорить скорость обработки и повысить эффективность). Поскольку чип является исследовательским, он изготовлен по 14-нанометровому техпроцессу; возможно, у IBM есть возможности для дальнейшего повышения эффективности энергопотребления, если аналоговые ячейки можно будет еще больше миниатюризировать.
Сами ячейки памяти с изменением фазы (PCM) распределены по каждой из 64 плиток, расположенных в виде перекладины, которая может хранить пространство для умножения матрицы на вектор размером 256x256. Справедливости ради следует отметить, что в такой смешанной аналого-цифровой схеме существуют определенные ограничения производительности: сигналы необходимо преобразовывать из аналоговых в цифровые (и наоборот), что влечет за собой потери как в задержке, так и в использовании энергии. Но при соответствующей оптимизации планирования конечным результатом является более высокая эффективность по сравнению с полностью цифровыми чипами (такими как A100 и H100 от Nvidia). По данным IBM, один вход ResNet-9 обрабатывался за 1,52 мкс (микросекунды) и потреблял 1,51 мкДж (микроджоули) энергии. По словам Абу Себастьяна из IBM Rüschlikon Center (по данным EE Times), текущая итерация чипа обеспечивает пиковую производительность матричного векторного умножения от 16,1 до 63,1 TOPC (триллионов операций в секунду) при энергоэффективности от 2,48 до 9.76 ТОПС W-1.
Все еще продолжающаяся «революция» ИИ вызвала бурные изменения на рынке высокопроизводительных вычислений (HPC). Но помимо того, что в полной мере демонстрируется чудо графических процессоров (общих процессоров, ответственных за ускорение большей части этого конкретного рынка), золотая лихорадка для ускорителей ИИ продемонстрировала, насколько зависит рынок от одного игрока (читай: Nvidia), а также выдвигая на первый план вопросы энергоэффективности.
Аналоговые чипы, которые разрушают барьеры энергоэффективности, безусловно, были бы долгожданным шагом, но, как и в случае с любой новой технологией, чипам аналогового вывода ИИ придется бороться, чтобы выжить против уже укоренившихся технологий.
Иван Ковалев
VIA
А нужно ли вообще реагировать на отзывы, которые люди оставляют в бесконечном электронном пространстве? И если да, то