ГлавнаяНовостиВеликий сдвиг: от вычислительной архитектуры, ориентированной на логику, к архитектуре, ориентированной на память

Великий сдвиг: от вычислительной архитектуры, ориентированной на логику, к архитектуре, ориентированной на память

Великий сдвиг: от вычислительной архитектуры, ориентированной на логику, к архитектуре, ориентированной на память


На протяжении десятилетий вся компьютерная индустрия вращалась вокруг простой парадигмы: логика превыше всего.Центральные и графические процессоры были сердцем систем;память была всего лишь вспомогательным компонентом, отвечающим за временное хранение данных, пока процессоры выполняли основную работу.Но сегодня происходит фундаментальная революция: эра логико-ориентированных вычислений заканчивается, и память-ориентированные вычисления прибыл.

Этот сдвиг не является постепенным — он носит структурный характер.Благодаря искусственному интеллекту, большим языковым моделям, облачным вычислениям и высокопроизводительным вычислениям баланс сил между логикой и памятью полностью изменился.Память больше не является периферийным компонентом;это стало основное узкое место, главный ограничитель производительности и настоящий центр создания ценности. современных вычислительных систем.

Основная причина: стена памяти

В течение многих лет производительность процессора улучшалась гораздо быстрее, чем пропускная способность памяти и задержка.Этот растущий разрыв известен как стена памяти.В традиционных системах:

  • Процессоры большую часть времени ждут данных
  • Перемещение данных потребляет гораздо больше энергии, чем вычисления
  • Пропускная способность не успевает за ростом размера модели
  • Задержка напрямую определяет реальную скорость вывода

По мере того, как модели ИИ растут от миллиардов до триллионов параметров, стена памяти становится фатальной.Системы больше не могут позволить себе перемещать огромные объемы данных туда и обратно между логикой и памятью.Единственное решение: перестроить всю архитектуру вокруг памяти.

Логика и память: разница в парадигмах

Логико-ориентированная архитектура
- CPU/GPU в качестве ядра
- Память как внешнее хранилище
- Данные переходят в вычисления
- Производительность зависит от скорости инструкций
- Доминирующие ПК и ранние облачные вычисления

Память-ориентированная архитектура
- Память как ядро системы
- Вычисления переходят к данным
- Пропускная способность и задержка определяют производительность
- Энергоэффективность, ориентированная на перемещение данных
- Определяет искусственный интеллект и вычисления следующего поколения.

Разница не в технических деталях — это полный переворот философии проектирования системы.

Три пути инноваций, ориентированных на память

1. Вычисления с ближней памятью (NMC)
Разместите вычислительные механизмы близко к памяти, чтобы свести к минимуму перемещение данных.Значительно снижает задержку и мощность.Широко применяется в ускорителях искусственного интеллекта и инфраструктуре DPU.

2. Вычисления в памяти (IMC)
Выполняйте вычисления непосредственно внутри ячеек памяти, полностью исключая передачу данных.Идеально подходит для вывода ИИ, периферийных устройств и систем с низким энергопотреблением.Рассматривается как долгосрочная окончательная архитектура.

3. Наложение 3D-логики памяти
Устанавливайте память непосредственно поверх процессоров, используя гибридное соединение и TSV.Создает сверхвысокую пропускную способность между вычислениями и памятью.HBM, HBM3E и 3D-стекирование лежат в основе современных чипов искусственного интеллекта.

Почему ИИ делает неизбежным использование памяти

Большие языковые модели и генеративный искусственный интеллект обладают уникальными характеристиками:

  • Массивные наборы параметров требуют огромного объема памяти.
  • Вывод привязан к памяти, а не к вычислениям
  • Пропускная способность определяет пропускную способность и удобство использования
  • В энергопотреблении преобладает перемещение данных

В системах искусственного интеллекта процессор часто простаивает в ожидании данных.Производительность ограничивается не тем, насколько быстро чип может выполнять вычисления, а как быстро он может получить доступ к памяти.

Реструктуризация отрасли: стоимость перемещается в память

Этот архитектурный сдвиг переписывает мощь отрасли:

  • Производители памяти получают стратегическую ценовую власть
  • При проектировании системы приоритет отдается топологии памяти.
  • Упаковка становится критически важной для подключения памяти
  • Новые гиганты возникают в памяти и взаимосвязях

Тот, кто контролирует архитектуру памяти, контролирует будущее вычислений.

Вывод: будущее управляется памятью

Эпоха вычислений, в которых доминирует логика, закончилась.Мы вступили в новую эпоху, когда память определяет производительность, память ограничивает масштабирование, а память определяет ценность системы.

Переход от архитектуры, ориентированной на логику, к архитектуре, ориентированной на память, — это не просто техническая тенденция — это самая фундаментальная трансформация в вычислительной технике за полвека.В течение следующего десятилетия, память станет центром вселенной.