
На протяжении десятилетий вся компьютерная индустрия вращалась вокруг простой парадигмы: логика превыше всего.Центральные и графические процессоры были сердцем систем;память была всего лишь вспомогательным компонентом, отвечающим за временное хранение данных, пока процессоры выполняли основную работу.Но сегодня происходит фундаментальная революция: эра логико-ориентированных вычислений заканчивается, и память-ориентированные вычисления прибыл.
Этот сдвиг не является постепенным — он носит структурный характер.Благодаря искусственному интеллекту, большим языковым моделям, облачным вычислениям и высокопроизводительным вычислениям баланс сил между логикой и памятью полностью изменился.Память больше не является периферийным компонентом;это стало основное узкое место, главный ограничитель производительности и настоящий центр создания ценности. современных вычислительных систем.
В течение многих лет производительность процессора улучшалась гораздо быстрее, чем пропускная способность памяти и задержка.Этот растущий разрыв известен как стена памяти.В традиционных системах:
По мере того, как модели ИИ растут от миллиардов до триллионов параметров, стена памяти становится фатальной.Системы больше не могут позволить себе перемещать огромные объемы данных туда и обратно между логикой и памятью.Единственное решение: перестроить всю архитектуру вокруг памяти.
Логико-ориентированная архитектура
- CPU/GPU в качестве ядра
- Память как внешнее хранилище
- Данные переходят в вычисления
- Производительность зависит от скорости инструкций
- Доминирующие ПК и ранние облачные вычисления
Память-ориентированная архитектура
- Память как ядро системы
- Вычисления переходят к данным
- Пропускная способность и задержка определяют производительность
- Энергоэффективность, ориентированная на перемещение данных
- Определяет искусственный интеллект и вычисления следующего поколения.
Разница не в технических деталях — это полный переворот философии проектирования системы.
1. Вычисления с ближней памятью (NMC)
Разместите вычислительные механизмы близко к памяти, чтобы свести к минимуму перемещение данных.Значительно снижает задержку и мощность.Широко применяется в ускорителях искусственного интеллекта и инфраструктуре DPU.
2. Вычисления в памяти (IMC)
Выполняйте вычисления непосредственно внутри ячеек памяти, полностью исключая передачу данных.Идеально подходит для вывода ИИ, периферийных устройств и систем с низким энергопотреблением.Рассматривается как долгосрочная окончательная архитектура.
3. Наложение 3D-логики памяти
Устанавливайте память непосредственно поверх процессоров, используя гибридное соединение и TSV.Создает сверхвысокую пропускную способность между вычислениями и памятью.HBM, HBM3E и 3D-стекирование лежат в основе современных чипов искусственного интеллекта.
Большие языковые модели и генеративный искусственный интеллект обладают уникальными характеристиками:
В системах искусственного интеллекта процессор часто простаивает в ожидании данных.Производительность ограничивается не тем, насколько быстро чип может выполнять вычисления, а как быстро он может получить доступ к памяти.
Этот архитектурный сдвиг переписывает мощь отрасли:
Тот, кто контролирует архитектуру памяти, контролирует будущее вычислений.
Эпоха вычислений, в которых доминирует логика, закончилась.Мы вступили в новую эпоху, когда память определяет производительность, память ограничивает масштабирование, а память определяет ценность системы.
Переход от архитектуры, ориентированной на логику, к архитектуре, ориентированной на память, — это не просто техническая тенденция — это самая фундаментальная трансформация в вычислительной технике за полвека.В течение следующего десятилетия, память станет центром вселенной.