ГлавнаяНовостиУзкое место в межсоединении 448G: реальный предел ИИ — не вычислительная мощность, а пропускная способность системы

Узкое место в межсоединении 448G: реальный предел ИИ — не вычислительная мощность, а пропускная способность системы

Узкое место в межсоединении 448G: настоящий предел ИИ — не вычислительная мощность, а пропускная способность





За последние два года почти все внимание было сосредоточено на графических процессорах, вычислительной мощности и передовых технологических узлах.По мере роста производительности одной карты и расширения кластеров искусственного интеллекта до десятков тысяч ускорителей незаметно возникло фундаментальное противоречие: Данные больше не могут эффективно передаваться по всей системе.

Это можно понять с помощью простой городской метафоры: Вычислительные узлы подобны небоскребам: с каждым годом они становятся все выше и мощнее.Однако дороги, соединяющие эти здания, никогда не модернизировались синхронно.Результат очевиден: мощное оборудование готово, однако трафик данных сильно перегружен.

Самая заставляющая задуматься точка зрения из этого отчета поражает: В эпоху 448G чипы и даже оптические модули практически полностью созрели и готовы к массовому внедрению. Настоящим узким местом является давно заброшенное оборудование: разъемы, физические каналы и вся экосистема электрических соединений.

Когда основная задача смещается с недостаточная вычислительная мощность чтобы недостаточная пропускная способность системы, и узкое место перемещается изнутри чипа между чипами и стойками, логика конкуренции в инфраструктуре искусственного интеллекта полностью переписывается.

Основная тема отчета

Взрывной спрос на искусственный интеллект подталкивает центры обработки данных в эпоху высокоскоростных межсоединений 448G.Проблема отрасли больше не в технологической осуществимости, а в том, сможет ли полная система межсетевых соединений, включая SerDes, разъемы и оптические каналы, идти в ногу с экспоненциальным ростом искусственного интеллекта.

Суть проблемы: расширение ИИ равняется взрывному спросу на соединения

В отчете выдвигается основное суждение: крупномасштабные кластеры искусственного интеллекта способствуют взрывному, экспоненциальному росту пропускной способности центров обработки данных.Три основных пути масштабирования определяют будущее развитие межсетевых соединений:

  • Масштабирование (внутрисерверное): более высокая скорость SerDes 448G/полоса и повышенная плотность упаковки.
  • Масштабируемое масштабирование (от стойки к стойке): Расширенные оптические каналы с 8/16/32-полосной передачей высокой плотности.
  • Масштабирование (межцентр обработки данных): Крупномасштабная оптическая сеть для планирования ресурсов на больших расстояниях.

Основной вывод: самая большая проблема ИИ больше не в недостаточности вычислений, а в том, что недостаточные возможности межсоединения.

Общая тенденция: вся отрасль движется к межсетевому соединению 448G

Отчет сосредоточен на основном стандарте: 448G на полосу.

Причина 448G становится неизбежной: Поддержка сверхбольших требований к полосе пропускания кластера искусственного интеллекта и создание коммутационной способности на уровне PB.

Продуманная техническая база уже имеется: 3-нм техпроцесс CMOS обеспечивает высокочастотную полосу пропускания более 100 ГГц, Высокоскоростной ЦАП/АЦП 224 Гвыб/с, и высокопроизводительная архитектура SerDes нового поколения.

Вкратце: аппаратное обеспечение на стороне чипа полностью готово к обновлению 448G.

Настоящее узкое место: не чипы, а физические ограничения каналов

Это наиболее критическая точка зрения в докладе.

1. Серьезные физические ограничения SerDes
Требовательная рабочая полоса пропускания 112 ГГц, джиттер ниже 100 фс и сверхвысокие требования к сигналу/шуму приближают высокоскоростные электрические SerDe к физическим пределам.

2. Разъемы становятся самой короткой платой
Существующие структуры OSFP едва ли могут поддерживать модуляцию PAM6. Традиционные разъемы не могут адаптироваться к PAM4 в высокоскоростных сценариях. Ясный вывод: будущие приложения 448G не могут полагаться на сегодняшние устаревшие решения для разъемов.

3. Серьезные риски целостности сигнала
Высокочастотные потери, перекрестные помехи и узкие места переходов BGA ограничивают стабильную передачу. Отраслевые решения ориентированы на гибкие межсетевые соединения и двухмерные архитектуры соединений с высокой плотностью соединений.

Конкуренция схем модуляции: PAM4 против PAM6 против PAM8

В отчете проводится углубленное сравнение трех основных форматов модуляции:

  • ПАМ4: Высокая потребность в пропускной способности, но наиболее зрелая, стабильная и экономически эффективная.
  • ПАМ6: более высокий порог SNR, повышенная сложность проектирования.
  • PAM8 : более высокая теоретическая плотность с ограниченной практической пользой и чрезмерной сложностью.

Основной вывод: дополнительные преимущества модуляции более высокого порядка не могут компенсировать растущие затраты и технические риски. Даже к 2028 году PAM4 останется единственным надежным и распространенным решением для крупномасштабного развертывания.

Оптическое соединение: полностью готово к будущим обновлениям

Оптическая технология стала самым надежным прорывом:

  • Однополосная оптическая передача 448G полностью проверена.
  • Поддержка передачи на большие расстояния на 2 км и крупномасштабной системы коммутации 3,2 Тбит/с.
  • Технология Driverless TFLN и усовершенствованные модуляторы EML еще больше снижают энергопотребление.

Оптические модули не являются узким местом — они являются основным прорывом в области соединения ИИ следующего поколения.

Окончательное решение

  1. Благодаря искусственному интеллекту пропускная способность глобальных центров обработки данных полностью вступает в эпоху 448G.
  2. Чипы и оптические модули технически готовы, тогда как электрические соединения, разъемы и устаревшая инфраструктура серьезно отстают.
  3. В будущем конкуренция вычислительной мощности ИИ больше не будет сосредоточена на производительности одного кристалла. Основная конкурентоспособность будет определяться возможность межсетевого взаимодействия на уровне системы.

Резюме

ИИ нарушил первоначальный баланс между вычислениями и передачей данных. В новую эпоху 448G межсетевое соединение заменяет вычислительную мощность в качестве основного ограничения. Тот, кто освоит высокоскоростные каналы связи, разъемы и оптические соединения, займет доминирующее положение в следующей волне конкуренции в области инфраструктуры искусственного интеллекта.