Keysight Technologies stellte AresONE 1600GE vor, eine skalierbare 1,6T-Ethernet-KI-Workload-Emulationsplattform, die zur Validierung von KI-Fabrics der nächsten Generation entwickelt wurde, die über neue 224G-SerDes (elektrische Lanes) betrieben werden. Die Lösung ermöglicht es Herstellern von Netzwerkgeräten und Halbleiter-Chips, Hyperscalern und Betreibern von KI-Rechenzentren, großangelegte KI-Rechenknoten zu emulieren und KI-Fabrics vor und nach der Bereitstellung zu validieren.
Hintergrund: Da KI-Workloads ein rasantes Wachstum bei Scale-up- und Scale-out-Netzwerken verursachen, vollzieht die Branche derzeit einen Umstieg auf höhere Datenraten und eine erhöhte
KI-Switch-Radix (Anzahl der Ports an einem Switch) durch Fan-out von 800GE- und 1600GE-Ports, wodurch die Effizienz der KI-Struktur verbessert und die Netzwerkebenen reduziert werden.
Die Validierung neuer Designs für diese Geschwindigkeiten stellt jedoch eine große Herausforderung dar, darunter die Link-Integrität über 224G-Lanes, das Verhalten bei Überlastung durch Mikrobursts
und die realistische Emulation der kollektiven Kommunikation von KI.
Um diesen Herausforderungen zu begegnen, kombiniert die speziell entwickelte AresONE-1600GE-Plattform eine hochdichte 1,6T-Architektur mit der KAI DC Builder-Software (Keysight AI Data Center
Builder) und liefert damit eine realistische Emulation von KI-Workloads, die zur Validierung von KI-Fabrics der nächsten Generation erforderlich ist. Mit KAI DC Builder emuliert die Plattform reale
KI-Workloads, darunter mehrere Full-Stack-RoCEv2-Verbindungen und eine Vielzahl von kollektiven Kommunikationsmustern. Teams können wichtige Fabric-KPIs unter Bedingungen bewerten, die
Produktivumgebungen sehr nahe kommen, während die integrierte Datenerfassung und -analyse die Transparenz verbessert und Ingenieuren dabei hilft, die Fabric-Leistung zu optimieren.
Durch die Vereinheitlichung von KI-Workload-Emulation, Validierung der Bitübertragungsschicht sowie Traffic- und Protokolltests in einer einzigen Plattform bietet der AresONE 1600GE:
Ermöglicht wird die Bewertung der Implementierung von KI-Fabrics unter Verwendung realer KI-Workloads und GPU-Cluster-Emulation bei hohen Geschwindigkeiten. Testet GPUs, KI-NICs und Beschleuniger vor und nach der Implementierung, misst die Auswirkungen des Netzwerks auf die Bearbeitungszeit und bewertet die Leistungsisolierung, den Lastausgleich und die Überlastungskontrolle, um die KI-Trainingsleistung zu optimieren.
Die Rack-Mount-Plattform bietet vier OSFP 1600-Ports, die flexible Fan-Out-Konfigurationen von 1 × 1600GE, 2 × 800GE, 4 × 400GE oder 8 × 200GE über elektrische 224G SerDes-Lanes unterstützen und so die Einrichtung von Verbindungen und die Validierung von großvolumigem Datenverkehr in einem einzigen skalierbaren System ermöglichen.
Unterstützt wird die Validierung optischer und elektrischer Verbindungen, Vorwärtsfehlerkorrektur (FEC) und physikalisches Codierungsverhalten sowie die vollständige Analyse von Layer-2/3-Protokollen und Datenverkehr innerhalb einer Plattform – unter Berücksichtigung von Signalintegrität, Protokollverhalten und Anwendungsleistung.
Hochleistungsfähige Rechenleistung und Speicher ermöglichen automatisierte, reproduzierbare Tests, eine nahtlose Integration von Labor und Rechenzentrum sowie eine hohe Zuverlässigkeit beim täglichen Betrieb über Entwicklungs- und Validierungszyklen hinweg.
Emuliert hochskalierte Layer-2/3-Protokolle und Datenverkehr mit Lane-Geschwindigkeit und bietet Entwicklern so mehr Transparenz, um Probleme früher zu erkennen und die Marktreife von Produkten zu beschleunigen.